技術 約3分で読めます

Cursor Composer 2はKimi K2.5にコーディング特化RLを適用したモデルだった

Cursor が Composer 2 を発表した翌日、開発者の Fynn(@fynnso)が Cursor の OpenAI 互換 API エンドポイントを直接叩いたところ、内部モデルIDが平文で返ってきた。

accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast

kimi-k2p5 は Moonshot AI の Kimi K2.5、rl は強化学習での追加学習、0317 はトレーニング日(2026年3月17日)を示している。Cursor の公式ブログには基盤モデルについての記述がなく、独自開発のように読める内容だったため、Hacker News で 264pt まで伸びた。

Kimi K2.5 のアーキテクチャ

Kimi K2.5 は Moonshot AI が公開したオープンウェイトの Mixture-of-Experts(MoE)モデル。MoE とはモデルを複数の「エキスパート」ネットワークに分割し、各トークンの処理に一部のエキスパートだけを起動する構造で、総パラメータ数は大きくても計算量を抑えられる。

項目
総パラメータ数約1兆
1トークンあたりアクティブパラメータ32B
エキスパート数384
1トークンあたり選択エキスパート8 + 1(shared)
コンテキスト長256K トークン
アテンション方式MLA(Multi-Head Latent Attention)
ビジョンエンコーダMoonViT(400Mパラメータ)
学習トークン数視覚+テキスト合計 約15兆

ベンチマーク性能は以下の通り。

ベンチマークスコア
AIME 202596.1
GPQA-Diamond87.6
SWE-Bench Verified76.8
LiveCodeBench v685.0
HLE-Full(tool use)50.2

Moonshot AI は Kimi K2.5 の学習に PARL(Parallel-Agent RL)という手法も採用している。モノリシックなタスクをサブルーティンに分解して並列実行し、オーケストレータのみを訓練する構造で、BrowseComp で 60.6% → 78.4%(+17.8pt)を達成した。

Cursor が加えた RL

Cursor が適用したのはコーディング特化の強化学習で、「数百のアクションを要する長期的コーディングタスク(long-horizon coding tasks)」を報酬対象にしている。コンピュート配分はベースモデル由来が全体の約1/4で、残り3/4は Cursor 独自の RL 学習分だという。推論インフラには Fireworks AI のホスト型 RL・推論プラットフォームを利用している。

CursorBench(Cursor 独自ベンチ)の結果は以下。

モデルCursorBench
GPT-5.4 Thinking63.9
Composer 261.3
Claude Opus 4.658.2
Composer 1.544.2

前バージョン(1.5)から17pt以上の改善で、GPT-5.4 Thinking に肉薄している。

ライセンス問題の経緯

Kimi K2.5 のライセンスは Modified MIT で、月間 MAU 1億人超 または 月間収益2000万ドル超のサービスには「Kimi K2.5」をUIに目立つ形で表示する義務がある。Cursor は月間収益が約1億6700万ドル(年換算20億ドル)とされており、条件を大きく上回る。

発覚直後、Moonshot AI の pretraining リードである Yulun Du がトークナイザー分析で Kimi K2.5 であることを独自確認し、ライセンス違反・未払いを X で公開告発した。しかし数時間後、Moonshot AI の公式アカウント(@Kimi_Moonshot)が声明を出した。

“Congrats to the @cursor_ai team on the launch of Composer 2! We are proud to see Kimi-k2.5 provide the foundation. (…) Cursor accesses Kimi-k2.5 via Fireworks AI hosted RL and inference platform as part of an authorized commercial partnership.”

最初の告発ツイートは削除され、正式な商用契約を結んでいたことが確認された。Cursor の共同創業者 Aman Sanger も「ブログで基盤モデルを明記しなかったのはミスだった」と認め、次回以降は最初から公表すると約束している。

Cursor の「自社モデル」の実態

HN では「Composer 1 は Qwen(アリババ)、Composer 2 は Kimi(Moonshot AI)で、IDE は VSCode ベース」というコメントが目立った。293億ドルのバリュエーションがついている企業が独自プレトレーニングをしているわけではなく、中国産オープンウェイトモデルにドメイン特化 RL をかけて出しているだけ、という構図が明らかになった形だ。

attribution 条項についても、Cursor が自発的に公表したのではなく、外部の開発者が API レスポンスからモデル名を見つけ、Moonshot AI のエンジニアが告発して初めて表面化した。商用契約自体は存在していたが、ユーザーへの開示はコミュニティの圧力がなければ行われなかった。