Cursor Composer 2はKimi K2.5にコーディング特化RLを適用したモデルだった
Cursor が Composer 2 を発表した翌日、開発者の Fynn(@fynnso)が Cursor の OpenAI 互換 API エンドポイントを直接叩いたところ、内部モデルIDが平文で返ってきた。
accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast
kimi-k2p5 は Moonshot AI の Kimi K2.5、rl は強化学習での追加学習、0317 はトレーニング日(2026年3月17日)を示している。Cursor の公式ブログには基盤モデルについての記述がなく、独自開発のように読める内容だったため、Hacker News で 264pt まで伸びた。
Kimi K2.5 のアーキテクチャ
Kimi K2.5 は Moonshot AI が公開したオープンウェイトの Mixture-of-Experts(MoE)モデル。MoE とはモデルを複数の「エキスパート」ネットワークに分割し、各トークンの処理に一部のエキスパートだけを起動する構造で、総パラメータ数は大きくても計算量を抑えられる。
| 項目 | 値 |
|---|---|
| 総パラメータ数 | 約1兆 |
| 1トークンあたりアクティブパラメータ | 32B |
| エキスパート数 | 384 |
| 1トークンあたり選択エキスパート | 8 + 1(shared) |
| コンテキスト長 | 256K トークン |
| アテンション方式 | MLA(Multi-Head Latent Attention) |
| ビジョンエンコーダ | MoonViT(400Mパラメータ) |
| 学習トークン数 | 視覚+テキスト合計 約15兆 |
ベンチマーク性能は以下の通り。
| ベンチマーク | スコア |
|---|---|
| AIME 2025 | 96.1 |
| GPQA-Diamond | 87.6 |
| SWE-Bench Verified | 76.8 |
| LiveCodeBench v6 | 85.0 |
| HLE-Full(tool use) | 50.2 |
Moonshot AI は Kimi K2.5 の学習に PARL(Parallel-Agent RL)という手法も採用している。モノリシックなタスクをサブルーティンに分解して並列実行し、オーケストレータのみを訓練する構造で、BrowseComp で 60.6% → 78.4%(+17.8pt)を達成した。
Cursor が加えた RL
Cursor が適用したのはコーディング特化の強化学習で、「数百のアクションを要する長期的コーディングタスク(long-horizon coding tasks)」を報酬対象にしている。コンピュート配分はベースモデル由来が全体の約1/4で、残り3/4は Cursor 独自の RL 学習分だという。推論インフラには Fireworks AI のホスト型 RL・推論プラットフォームを利用している。
CursorBench(Cursor 独自ベンチ)の結果は以下。
| モデル | CursorBench |
|---|---|
| GPT-5.4 Thinking | 63.9 |
| Composer 2 | 61.3 |
| Claude Opus 4.6 | 58.2 |
| Composer 1.5 | 44.2 |
前バージョン(1.5)から17pt以上の改善で、GPT-5.4 Thinking に肉薄している。
ライセンス問題の経緯
Kimi K2.5 のライセンスは Modified MIT で、月間 MAU 1億人超 または 月間収益2000万ドル超のサービスには「Kimi K2.5」をUIに目立つ形で表示する義務がある。Cursor は月間収益が約1億6700万ドル(年換算20億ドル)とされており、条件を大きく上回る。
発覚直後、Moonshot AI の pretraining リードである Yulun Du がトークナイザー分析で Kimi K2.5 であることを独自確認し、ライセンス違反・未払いを X で公開告発した。しかし数時間後、Moonshot AI の公式アカウント(@Kimi_Moonshot)が声明を出した。
“Congrats to the @cursor_ai team on the launch of Composer 2! We are proud to see Kimi-k2.5 provide the foundation. (…) Cursor accesses Kimi-k2.5 via Fireworks AI hosted RL and inference platform as part of an authorized commercial partnership.”
最初の告発ツイートは削除され、正式な商用契約を結んでいたことが確認された。Cursor の共同創業者 Aman Sanger も「ブログで基盤モデルを明記しなかったのはミスだった」と認め、次回以降は最初から公表すると約束している。
Cursor の「自社モデル」の実態
HN では「Composer 1 は Qwen(アリババ)、Composer 2 は Kimi(Moonshot AI)で、IDE は VSCode ベース」というコメントが目立った。293億ドルのバリュエーションがついている企業が独自プレトレーニングをしているわけではなく、中国産オープンウェイトモデルにドメイン特化 RL をかけて出しているだけ、という構図が明らかになった形だ。
attribution 条項についても、Cursor が自発的に公表したのではなく、外部の開発者が API レスポンスからモデル名を見つけ、Moonshot AI のエンジニアが告発して初めて表面化した。商用契約自体は存在していたが、ユーザーへの開示はコミュニティの圧力がなければ行われなかった。