Cursor Composer 2はKimi K2.5にコーディング特化RLを適用したモデルだった

Cursor が Composer 2 を発表した翌日、開発者の Fynn（@fynnso）が Cursor の OpenAI 互換 API エンドポイントを直接叩いたところ、内部モデルIDが平文で返ってきた。

accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast

kimi-k2p5 は Moonshot AI の Kimi K2.5、rl は強化学習での追加学習、0317 はトレーニング日（2026年3月17日）を示している。Cursor の公式ブログには基盤モデルについての記述がなく、独自開発のように読める内容だったため、Hacker News で 264pt まで伸びた。

Kimi K2.5 のアーキテクチャ

Kimi K2.5 は Moonshot AI が公開したオープンウェイトの Mixture-of-Experts（MoE）モデル。MoE とはモデルを複数の「エキスパート」ネットワークに分割し、各トークンの処理に一部のエキスパートだけを起動する構造で、総パラメータ数は大きくても計算量を抑えられる。

項目	値
総パラメータ数	約1兆
1トークンあたりアクティブパラメータ	32B
エキスパート数	384
1トークンあたり選択エキスパート	8 + 1（shared）
コンテキスト長	256K トークン
アテンション方式	MLA（Multi-Head Latent Attention）
ビジョンエンコーダ	MoonViT（400Mパラメータ）
学習トークン数	視覚+テキスト合計約15兆

ベンチマーク性能は以下の通り。

ベンチマーク	スコア
AIME 2025	96.1
GPQA-Diamond	87.6
SWE-Bench Verified	76.8
LiveCodeBench v6	85.0
HLE-Full（tool use）	50.2

Moonshot AI は Kimi K2.5 の学習に PARL（Parallel-Agent RL）という手法も採用している。モノリシックなタスクをサブルーティンに分解して並列実行し、オーケストレータのみを訓練する構造で、BrowseComp で 60.6% → 78.4%（+17.8pt）を達成した。

Cursor が加えた RL

Cursor が適用したのはコーディング特化の強化学習で、「数百のアクションを要する長期的コーディングタスク（long-horizon coding tasks）」を報酬対象にしている。コンピュート配分はベースモデル由来が全体の約1/4で、残り3/4は Cursor 独自の RL 学習分だという。推論インフラには Fireworks AI のホスト型 RL・推論プラットフォームを利用している。

CursorBench（Cursor 独自ベンチ）の結果は以下。

モデル	CursorBench
GPT-5.4 Thinking	63.9
Composer 2	61.3
Claude Opus 4.6	58.2
Composer 1.5	44.2

前バージョン（1.5）から17pt以上の改善で、GPT-5.4 Thinking に肉薄している。

ライセンス問題の経緯

Kimi K2.5 のライセンスは Modified MIT で、月間 MAU 1億人超または月間収益2000万ドル超のサービスには「Kimi K2.5」をUIに目立つ形で表示する義務がある。Cursor は月間収益が約1億6700万ドル（年換算20億ドル）とされており、条件を大きく上回る。

発覚直後、Moonshot AI の pretraining リードである Yulun Du がトークナイザー分析で Kimi K2.5 であることを独自確認し、ライセンス違反・未払いを X で公開告発した。しかし数時間後、Moonshot AI の公式アカウント（@Kimi_Moonshot）が声明を出した。

“Congrats to the @cursor_ai team on the launch of Composer 2! We are proud to see Kimi-k2.5 provide the foundation. (…) Cursor accesses Kimi-k2.5 via Fireworks AI hosted RL and inference platform as part of an authorized commercial partnership.”

最初の告発ツイートは削除され、正式な商用契約を結んでいたことが確認された。Cursor の共同創業者 Aman Sanger も「ブログで基盤モデルを明記しなかったのはミスだった」と認め、次回以降は最初から公表すると約束している。

Cursor の「自社モデル」の実態

HN では「Composer 1 は Qwen（アリババ）、Composer 2 は Kimi（Moonshot AI）で、IDE は VSCode ベース」というコメントが目立った。293億ドルのバリュエーションがついている企業が独自プレトレーニングをしているわけではなく、中国産オープンウェイトモデルにドメイン特化 RL をかけて出しているだけ、という構図が明らかになった形だ。

attribution 条項についても、Cursor が自発的に公表したのではなく、外部の開発者が API レスポンスからモデル名を見つけ、Moonshot AI のエンジニアが告発して初めて表面化した。商用契約自体は存在していたが、ユーザーへの開示はコミュニティの圧力がなければ行われなかった。