CursorのComposer 2は、2026年3月19日に発表された同社最新のエージェント型コーディングモデルです。Cursorはこれを「コーディングでフロンティア級」と表現し、低レイテンシのソフトウェア作業向けに構築され、個人プラン向けに独立した使用プールを備えた形でCursor内から直接利用可能だとしています。ローンチでは、同等の知能を保ちながら高速なバリアントの導入と、汎用フロンティアモデルの多くよりもエージェント型コーディングを手頃にする新しい価格体系も併せて発表されました。
Composer 2が重要なのは、AIソフトウェア開発の広範なシフトを反映しているからです。価値はもはや生のモデル知能だけではなく、速度、長ホライゾンのタスク処理、ツール利用、費用効率の組み合わせにあります。Cursor自身のフレーミングは明確で、モデルはエージェント型コーディングに最適化され、数百のアクションを要する難題を扱え、長時間走るワークフローでも重要なコンテキストを保持するよう訓練されています。
Composer 2とは?
テキスト補完だけでなく、エージェント型コーディングのために作られたモデル
Composer 2はCursorの自社製コーディングモデルです。ソフトウェアエンジニアリングの知能と速度に特化し、Cursorのエージェントハーネスで訓練され、汎用チャットではなく実際のコーディングタスクでうまく機能することを意図しています。重要なのは、エージェント型コーディングが通常のコード生成と異なる点です。モデルはコードベースを検索し、ファイルを編集し、複数ステップで推論し、タスクの糸を失わずにミスから回復できなければなりません。Cursorの長ホライゾン訓練に関する投稿は、この設計目標を非常に明確に示しています。
Dual Model Variants:
| Variant | Purpose |
|---|---|
| 標準 | 最低コスト |
| 高速 | より高速(デフォルト) |
Cursorがこれを構築した理由
Cursorの研究投稿は、シンプルな仮説を示唆しています。より優れたコーディングエージェントには、知能と多ステップにわたる効率的な継続性の両方が必要だというものです。社内ベンチマーク(CursorBench)の観察では、現実の困難なコーディングタスクにおけるより強いパフォーマンスは、より多くの思考とより広いコードベース探索と相関していることが示されています。したがってComposer 2は、タスクを解くだけでなく、モデルの即時のコンテキスト長を超える長い軌跡にわたって解き続けるように訓練されています。
Composer 2はどう機能する?
継続事前学習が大きなアップグレード
Composer 2の品質向上は「初の継続事前学習ラン」によるもので、強化学習のためにより強力なベースを提供すると説明されています。これは、モデルが単なるComposer 1.5の調整版ではないことを示す重要なポイントであり、Cursorが目指す長ホライゾンのコーディング挙動に適したより良い出発点になっていることを意味します。
長いコーディング軌跡での強化学習
継続事前学習の後、CursorはComposer 2を長ホライゾンのコーディングタスクで強化学習します。同社は、Composer 2が数百のアクションを要する難問を解決できると主張しています。実務的には、モデルが単発の回答を生成して止まるのではなく、マルチステップのデバッグ、コードナビゲーション、反復的な修復ループを粘り強く継続するよう教えられていることを意味します。
自己要約は重要な研究的前進
Cursorは「自己要約」を用いて長いホライゾンにわたる訓練を行います。この設定では、モデルがコンテキストトリガーに達すると一時停止し、自身の作業状態を要約してから、その圧縮されたコンテキストから継続します。Cursorによれば、この手法により、モデルの最大コンテキストウィンドウをはるかに超える軌跡での訓練が可能になり、要約自体にも報酬を与えることが訓練信号の一部として機能します。
耐久性
実務面でのメリットは耐久性です。長いコーディングタスクは、エージェントが以前の決定を忘れたり、広大なワークスペースで重要な詳細を失ったりすると失敗しがちです。自己要約は、調整済みプロンプトベースのコンパクション基準と比較して、テスト環境でトークンを5分の1に抑えながらコンパクション誤差を50%削減します。これは、現在のエージェントシステムの弱点の一つがコンパクションであることを踏まえると、かなり大きな主張です。
Composer 2の新機能は?
1. 継続事前学習 + RLのスケーリング
Composer 2はCursorの「初の大規模な継続事前学習パイプライン」を導入し、強化学習にとってより強力なベースモデルを作り上げます。
その後、以下を適用します:
- 長ホライゾンのRL訓練
- 複数ステップにまたがるタスク連鎖
- 実世界のコーディングワークフロー
👉 結果:コードスニペットだけでなく、より「複雑なエンジニアリングタスク」への対応が向上。
2. 長ホライゾンのタスク実行
少しのステップで失敗してしまう以前のモデルとは異なり:
- Composer 2は「複数ファイルのリファクタ」を完了可能
- 「ターミナルワークフロー」を実行
- 「数百のアクション」にわたって状態を維持
これにより「真のAIコーディングエージェント的な挙動」へと近づきます。
3. コードのみの訓練戦略
Composer 2はプログラミング関連データのみによって訓練されています。
重要な理由:
| Factor | General Models | Composer 2 |
|---|---|---|
| モデルサイズ | 大 | 小さめ |
| 対象範囲 | 広い | 狭い |
| 効率 | 低い | 高い |
| コスト | 高い | 低い |
👉 これが「圧倒的な価格対性能の優位性」を説明します。
4. ハイブリッド基盤(Kimiベース + RL)
最近の開示によれば、Composer 2は当初「Kimi K2.5(Moonshot AI)」を基盤とし、強化学習を追加して構築されました。
- ベースモデル由来の計算量は約25%のみ
- 大部分はCursorの訓練スタックによる
👉 これは「ハイブリッドなモデルエンジニアリング + 独自最適化」という新潮流を反映しています。
パフォーマンスベンチマーク
| Model | CursorBench | Terminal-Bench 2.0 | SWE-bench Multilingual |
|---|---|---|---|
| Composer 2 | 61.3 | 61.7 | 73.7 |
| Composer 1.5 | 44.2 | 47.9 | 65.9 |
| Composer 1 | 38.0 | 40.0 | 56.9 |
Composer 1.5比で、Composer 2はCursorBenchで約38.7%高く、Terminal-Bench 2.0で28.8%高く、SWE-bench Multilingualで11.8%高い数値です。これはすべての外部モデルに対する普遍的な優位性を証明するものではありませんが、Cursor自社モデルラインの中で明確な進歩を示しています。
Composer 2へのアクセス方法は?
CursorはComposer 2をプロダクトのエージェント優先ワークフローの一部として位置づけています。Composer 2はCursor内で利用可能で、同社によれば個人プランではComposerの使用が独立した使用プールから供給され、十分な含まれ使用量が提供されます。ユーザーは新しいインターフェースの「アーリーアルファ」でComposer 2を試すこともできるとしています。つまり、Composer 2は単なるモデルAPIではなく、エディタ、エージェント、ブラウザ、レビューの各ツールが連携するCursorのエージェントワークフロー内での利用を意図しています。
Cursor内での利用
Composer 2はCursor内、そして新インターフェースのアーリーアルファでも利用可能です。実務的なアクセス形態はAPIファーストではなくプロダクトネイティブであり、ユーザーはCursorエディタとそのエージェントワークフロー内でモデルと対話します。これは、エディタをモデルとの主要なインタラクション面として扱うというCursorの大局的な方向性と整合しています。
使用プールとプラン構成
各個人プランには請求サイクルごとにリセットされる2つの使用プールが含まれています。Auto + Composerは、AutoまたはComposer 2が選択されている場合に含まれ使用量が大幅に増え、APIプールはモデルのAPI料金で課金されます。Cursorはまた、個人プランに毎月少なくとも$20のAPI使用枠が含まれると述べており、上位ティアでは正確な金額が増加します。実務的なポイントは、Composer 2が頻繁に利用されることを前提に設計され、すべてのリクエストを即座に純粋なAPI課金へ追い込まないことです。
API価格:
$0.50 input / $2.50 output per 1M tokens;高速バリアント $1.50 / $7.50
プランの文脈
Cursor Proは月$20、Pro Plusは$60、Ultraは$200で、それぞれ含まれ使用量のレベルが異なります。チーム向けにはTeamsおよびEnterpriseも提供され、追加の管理機能があります。重要なのは、Composer 2が単なるモデルSKUではなく、価格、使用プール、コラボレーション機能を組み合わせたより広いプロダクトパッケージの一部であるという点です。
Composer 2 vs Claude Opus 4.6 vs GPT-5.4:どれを選ぶべき?
Terminal-Bench 2.0

| Model | Score |
|---|---|
| Composer 2 | 61.7 |
| Claude Opus 4.6 | ~58 |
| GPT-5.4 | ~75 |
👉 Composer 2:
ピーク性能ではGPT-5.4に及ばない
一部の条件でOpus 4.6を上回る
公式価格
| Model | Input ($/M tokens) | Output ($/M tokens) |
|---|---|---|
| Composer 2 | 0.50 | 2.50 |
| Composer 2 Fast | 1.50 | 7.50 |
| Claude Opus 4.6 | 5.00 | 25.00 |
| GPT-5.4 | 2.50–5.00 | 15.00–22.50 |
👉 Composer 2は:
- Opus 4.6の「10倍安価」
- GPT-5.4より「約5〜6倍安価」
なぜClaude Opus 4.6とGPT-5.4は依然として有用なのか?
Composer 2は、Cursor内での作業が多い開発者に強く適した選択で、反復的なコード編集ループ、リファクタ、複数ファイルの変更、速度と費用効率が効くエージェント的タスクに向いています。コードと長ホライゾンのアクション実行に最適化され、価格は劇的に低い設計です。
しかしClaude Opus 4.6とGPT-5.4は、それぞれより広いプロフェッショナル機能、大きなコンテキストウィンドウ、豊富なエンタープライズ機能を備えています。洗練されたエッセイ、スプレッドシート、ブラウザエージェントのワークフローを一度に作る必要がある場合に適しています。
比較表:
| Feature | Composer 2 | Claude Opus 4.6 | GPT-5.4 |
|---|---|---|---|
| フォーカス | コーディングのみ | 総合AI | 総合AI |
| コスト | ⭐ 最低 | 非常に高い | 中程度 |
| コーディング精度 | 高い | 非常に高い | 高い |
| 推論 | 中 | 非常に高い | 非常に高い |
| 速度 | 高速バリアントあり | 中程度 | 中程度 |
| エージェント機能 | 強力 | 強力 | 改善中 |
| マルチモーダル | ❌ | ✅ | ✅ |
| 最適なユースケース | 開発ワークフロー | 研究グレードのタスク | 総合+コーディング |
最適なユースケースとアクセス
タスクが広範な推論、マルチモーダル、汎用エンタープライズ用途であれば、GPT-5.4とClaude Opus 4.6はいずれも公式のポジショニングと機能に基づいて強力な候補です。タスクがCursor内の日々のコーディングで、特にコストと反復速度が重要な場合は、Composer 2がより特化し、かつ安価な適合です。CursorはComposer 2をCursor自体のための特化したエージェント型コーディングモデルとして位置づけています。GPT-5.4とOpus 4.6が汎用フロンティアモデルであるのに対し、Composer 2はIDE-エージェントのループに特化しています。
OpenAIはGPT-5.4を、APIでのツールサポートと強力な汎用推論を備えた複雑なプロフェッショナル作業向けのフロンティアモデルとして位置づけています。AnthropicはClaude Opus 4.6を、コーディング、推論、エージェント的作業における最も賢いモデルとして位置づけており、いずれもCometAPIで利用可能です。
CometAPIのAPIは現在20%オフで、プレイグラウンドを直接生成できます。他のソリューションと比べて、CometAPIははるかに優れた選択肢であり、本質的にはサブスクリプション不要のCursorのようなものです。
結論
Composer 2は単なる漸進的なCursorモデルではありません。コーディングエージェントにおける価格対性能曲線を再定義しようとする試みです。先行モデルより強いベンチマーク結果、長ホライゾンのエージェント挙動を中心とした設計、そして大手フロンティア代替よりも劇的に低い価格設定。Cursor自身のエビデンスはComposer 1および1.5に対する明確な向上を示し、価格は入力トークンでClaude Opus 4.6の10倍、GPT-5.4の5倍下回ります。
すでにCursorに根ざしているチームにとって、Composer 2は多くのコーディングタスクで説得力のあるデフォルトです。最も困難で、失敗許容度が低く、範囲が広い作業では、Claude Opus 4.6とGPT-5.4が引き続き比較対象となるプレミアムなベンチマークです。真の物語は、フロンティアなコーディング市場が同時に鋭く、安価で、より特化してきているということです。
Cursorの代替や、Claude Opus 4.6やGPT-5.4のような安価で最先端のモデルAPIを探しているなら、CometAPIが最適の選択です。Ready to go?
