Composer 2：有哪些新功能，與 Claude Opus 4.6 及 GPT-5.4 的比較

Cursor 的 Composer 2 是該公司最新的代理式程式碼模型，於 2026 年 3 月 19 日發布。Cursor 將其描述為「在編碼方面達到前沿水準」，專為低延遲的軟體工作打造，可直接在 Cursor 中使用，且個人方案提供獨立的用量池。此次發佈同時引入了具備相同智慧水準的更快變體，以及一套新的定價結構，旨在讓代理式編碼比許多通用前沿模型更實惠。

Composer 2 的重要性在於，它反映了 AI 軟體開發的一個更廣泛轉變：價值不再僅僅是模型本身的智力，而是速度、長時程任務處理、工具使用能力與成本效率的組合。Cursor 的定位也很明確：該模型為代理式編碼最佳化，能處理需要數百步行動的高難度任務，並在長時間工作流程中保留關鍵脈絡。

什麼是 Composer 2？

一個為代理式編碼而非純文本補全打造的模型

Composer 2 是 Cursor 的內部程式碼模型。Composer 2 專注於軟體工程智能與速度，在 Cursor 的代理框架中訓練，旨在在真實編碼任務中表現良好，而非泛用聊天。這一點很重要，因為代理式編碼不同於普通的程式碼生成：模型必須搜尋程式碼庫、編輯檔案、跨多步推理，並能在不丟失任務線索的情況下從錯誤中恢復。Cursor 的長時程訓練文章清楚闡述了這一設計目標。

雙版本變體：

版本	用途
標準	成本最低
快速	更高速度（預設）

為何 Cursor 要打造它

Cursor 的研究文章提出了一個簡單的論點：更好的編碼代理需要兼具智能與在多步過程中的高效延續性。其內部基準（CursorBench）的觀察顯示，在真實世界高難度編碼任務上，表現更強與更多思考、更廣泛程式碼庫探索呈正相關。因此，Composer 2 不僅被訓練去解決任務，還被訓練去在超出模型即時上下文長度的長軌跡中持續地解決任務。

Composer 2 如何運作？

持續預訓練是最大的升級

Composer 2 的品質提升來自其「首次持續預訓練」，據稱為強化學習提供了更強的基底。這意味著該模型不僅僅是 Composer 1.5 的微調版本；它是更適合 Cursor 所追求的長時程編碼行為的起點。

在長程編碼軌跡上的強化學習

在持續預訓練之後，Cursor 透過強化學習在長時程編碼任務上訓練 Composer 2。公司聲稱 Composer 2 能解決需要數百步行動的困難問題。在實務上，這意味著模型被教導要在多步除錯、程式碼導覽與迭代修復迴圈中持續前進，而不是生成一次性的答案後就停止。

自我摘要是關鍵研究進展

Cursor 使用「自我摘要」將 Composer 訓練到更長的視程。在這種設定下，當模型達到某個上下文觸發點時，會暫停並摘要自身的工作狀態，然後從這個壓縮後的上下文繼續。Cursor 表示，這項技術讓它能在遠超過模型最大上下文視窗的軌跡上進行訓練，並將這些摘要本身作為訓練訊號的一部分給予獎勵。

耐久性

實際的好處是耐久性。長時間的編碼任務常因代理忘記先前的決策或在龐大的工作空間中遺失重要細節而失敗。相較於在其測試環境中的調整後提示式壓縮基準，自我摘要在僅使用五分之一 token 的情況下，將壓縮誤差降低了 50%。這是個相當重要的主張，因為壓縮一直是當前代理系統的弱點之一。

Composer 2 有哪些新特性？

1. 持續預訓練 + RL 擴展

Composer 2 引入了 Cursor 的「首次大規模持續預訓練管線」，為強化學習打造更強的基礎模型。

接著，應用：

長時程 RL 訓練
多步任務鏈接
真實世界的編碼工作流程

👉 結果：更好地處理「複雜工程任務」，而不只是零碎的程式碼片段。

2. 長時程任務執行

不同於較早期、執行幾步後就失敗的模型：

Composer 2 能完成「跨多檔案的重構」
執行「終端機工作流程」
在「數百步行動」中維持狀態

這將其推向「真正的 AI 編碼代理行為」。

3. 僅程式碼訓練策略

Composer 2 僅使用與程式設計相關的資料進行訓練。

為何重要：

因素	通用模型	Composer 2
模型大小	大	較小
範圍	廣	窄
效率	較低	較高
成本	高	低

👉 這解釋了「巨大的性價比優勢」。

4. 混合基礎（Kimi 基底 + RL）

近期披露顯示，Composer 2 最初建立在「Kimi K2.5（Moonshot AI）」之上，並進一步進行強化訓練。

僅約 25% 的算力來自基礎模型
多數來自 Cursor 的訓練棧

👉 這反映了「混合模型工程 + 專有優化」的新趨勢

效能基準

模型	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

相較於 Composer 1.5，Composer 2 在 CursorBench 上高出約 38.7%，在 Terminal-Bench 2.0 上高出 28.8%，在 SWE-bench Multilingual 上高出 11.8%。這並不能證明其對所有外部模型的全面優勢，但至少顯示了 Cursor 自身產品線內明顯的躍升。

如何取得 Composer 2？

Cursor 將 Composer 2 定位為產品的代理優先工作流程一部分。它可在 Cursor 中使用，且 Cursor 表示在個人方案中，Composer 的使用量來自一個獨立的用量池，內含相當慷慨的使用額度。Cursor 也表示使用者可在其新介面的「早期 Alpha」中試用 Composer 2。這意味著 Composer 2 不僅是模型 API；它旨在在 Cursor 的代理工作流程中使用，使編輯器、代理、瀏覽與審查工具協同工作。

在 Cursor 內

Composer 2 可在 Cursor 中使用，也可在其新介面的早期 Alpha 中試用。實際的存取模式是以產品為原生，而非 API 優先：使用者在 Cursor 編輯器與其代理工作流程中與之互動。這與 Cursor 更廣泛的方向一致，公司將編輯器視為與模型互動的主要介面。

用量池與方案結構

每個個人方案都有兩個在每個計費週期重置的用量池：Auto + Composer，當選擇 Auto 或 Composer 2 時可獲得顯著更多的包含用量；以及按模型 API 費率計費的 API 用量池。Cursor 也表示，個人方案每月至少包含 $20 的 API 用量，較高級別方案會增加金額。實務上的重點是，Composer 2 被設計為可頻繁使用，而不會使每一次請求都立即轉入純 API 計費。

API 價格：

每 1M tokens「輸入 $0.50 / 輸出 $2.50」；快速版本「$1.50 / $7.50」

方案脈絡

Cursor Pro 每月 $20、Pro Plus 為 $60、Ultra 為 $200，各自包含不同的使用額度。對於團隊，Cursor 也提供 Teams 與 Enterprise，並具備額外的控管功能。這很重要，因為 Composer 2 不僅是模型 SKU；它是融合定價、用量池與協作控管的更廣泛產品套件的一部分。

Composer 2 vs Claude Opus 4.6 vs GPT-5.4：我該選哪一個？

Terminal-Bench 2.0

Composer 2：有哪些新功能，與 Claude Opus 4.6 及 GPT-5.4 的比較

模型	分數
Composer 2	61.7
Claude Opus 4.6	~58
GPT-5.4	~75

👉 Composer 2：

在峰值表現上落後於 GPT-5.4

在部分設定中超過 Opus 4.6

官方定價

模型	輸入（$/M tokens）	輸出（$/M tokens）
Composer 2	0.50	2.50
Composer 2 Fast	1.50	7.50
Claude Opus 4.6	5.00	25.00
GPT-5.4	2.50–5.00	15.00–22.50

👉 Composer 2 是：

比 Opus 4.6「便宜 10 倍」
比 GPT-5.4「便宜約 5–6 倍」

為何 Claude Opus 4.6 與 GPT-5.4 仍然值得？

Composer 2 非常適合大部分時間待在 Cursor 內的開發者，尤其是重複的程式碼編輯迴圈、重構、多檔案變更，以及受益於速度與成本效率的代理式任務；它圍繞程式碼與長時程行動執行進行最佳化，且定價大幅降低。

但 Claude Opus 4.6 與 GPT-5.4 各自提供更廣泛的專業能力、更大的上下文視窗與更豐富的企業功能。如果你需要一次性產出精緻文章、試算表與瀏覽器代理工作流程。

比較表：

功能	Composer 2	Claude Opus 4.6	GPT-5.4
聚焦	僅限編碼	通用型 AI	通用型 AI
成本	⭐ 最低	非常高	中等
編碼準確性	高	非常高	高
推理	中	非常高	非常高
速度	提供快速變體	中等	中等
代理能力	強	強	正在提升
多模態	❌	✅	✅
最佳使用情境	開發工作流程	研究級任務	通用 + 編碼

最適用情境與存取

若任務是廣泛推理、多模態工作或一般企業用途，基於其官方定位與能力，GPT-5.4 與 Claude Opus 4.6 都是強有力的候選者。若任務是日常在 Cursor 內的編碼，尤其重視成本與迭代速度時，Composer 2 是更專門且更廉價的選擇。Cursor 將 Composer 2 定位為專為 Cursor 本身打造的代理式編碼模型；GPT-5.4 與 Opus 4.6 是廣泛的前沿模型，而 Composer 2 則是為 IDE—代理迴路量身打造。

OpenAI 將 GPT-5.4 定位為面向複雜專業工作的前沿模型，在 API 中具備工具支援且具強大的通用推理能力。Anthropic 將 Claude Opus 4.6 定位為其在編碼、推理與代理工作上最智慧的模型——它們如今皆可透過 CometAPI 使用。

CometAPI 的 API 目前有 20% 折扣，並可直接生成 playground。相較其他方案，CometAPI 是更佳選擇；它本質上是一個不需訂閱的 cursor。

結論

Composer 2 並不只是另一個漸進式的 Cursor 模型。它是 Cursor 試圖重置編碼代理的性價比曲線：相較前代基準更強、以長時程代理行為為核心設計，且定價遠低於大型前沿替代方案。Cursor 自身的證據顯示，相比 Composer 1 與 1.5 有明顯提升，同時在輸入 token 價格上對 Claude Opus 4.6 低 10 倍、對 GPT-5.4 低 5 倍。

對於已深度使用 Cursor 的團隊，Composer 2 是許多編碼任務的有力預設選擇；而對於最困難、風險最高或範圍最廣的工作，Claude Opus 4.6 與 GPT-5.4 仍是值得對比的高端基準。真正的故事是：前沿編碼市場正同時變得更銳利、更便宜且更專門化。

如果你正在尋找 Cursor 的替代品，或像 Claude Opus 4.6 與 GPT-5.4 一樣更便宜、前沿的模型 API，CometAPI 是最佳選擇。立即開始？

什麼是 Composer 2？

一個為代理式編碼而非純文本補全打造的模型

為何 Cursor 要打造它

Composer 2 如何運作？

持續預訓練是最大的升級

在長程編碼軌跡上的強化學習

自我摘要是關鍵研究進展

耐久性

Composer 2 有哪些新特性？

1. 持續預訓練 + RL 擴展

2. 長時程任務執行

3. 僅程式碼訓練策略

4. 混合基礎（Kimi 基底 + RL）

效能基準

如何取得 Composer 2？

在 Cursor 內

用量池與方案結構

方案脈絡

Composer 2 vs Claude Opus 4.6 vs GPT-5.4：我該選哪一個？

Terminal-Bench 2.0

官方定價

為何 Claude Opus 4.6 與 GPT-5.4 仍然值得？

最適用情境與存取

結論

以低成本存取頂級模型

閱讀更多

Composer 2：有哪些新功能，與 Claude Opus 4.6 及 GPT-5.4 的比較

什麼是 Composer 2？

一個為代理式編碼而非純文本補全打造的模型

為何 Cursor 要打造它

Composer 2 如何運作？

持續預訓練是最大的升級

在長程編碼軌跡上的強化學習

自我摘要是關鍵研究進展

耐久性

Composer 2 有哪些新特性？

1. 持續預訓練 + RL 擴展

2. 長時程任務執行

3. 僅程式碼訓練策略

4. 混合基礎（Kimi 基底 + RL）

效能基準

如何取得 Composer 2？

在 Cursor 內

用量池與方案結構

方案脈絡

Composer 2 vs Claude Opus 4.6 vs GPT-5.4：我該選哪一個？

Terminal-Bench 2.0

官方定價

為何 Claude Opus 4.6 與 GPT-5.4 仍然值得？

最適用情境與存取

結論

以低成本 存取頂級模型

閱讀更多

以低成本存取頂級模型