Claude Sonnet 5 API 概覽
Claude Sonnet 5 API 是 Anthropic 最新的 Sonnet 級模型,面向編碼代理、工具驅動的工作流、長上下文文件推理,以及日常專業工作。在 CometAPI 上,該模型的 ID 為 claude-sonnet-5,同時通過原生的 Anthropic Messages 端點與相容 OpenAI 的聊天端點提供,讓開發者可在 Claude 特定控制與可移植的多模型整合層之間進行選擇。
技術規格
| 項目 | 規格 |
|---|---|
| 模型名稱 | Claude Sonnet 5 |
| API 模型 ID | claude-sonnet-5 |
| 供應商 | Anthropic |
| CometAPI provider code | anthropic |
| 輸入類型 | 文字與影像輸入;PDF/文件輸入已在 CometAPI 目錄功能中列出 |
| 輸出類型 | 文字 |
| 上下文視窗 | 1M tokens,為 Claude Sonnet 5 的預設與最大值 |
| 最大輸出 tokens | 同步 Messages API 上為 128k tokens |
| 自適應思考 | 是;預設啟用 |
| 擴展思考 | 手動思考:{type: "enabled", budget_tokens: N} 會被移除並返回 400 錯誤 |
| 努力程度控制 | 透過 effort 參數支援;Anthropic 指出 API 與 Claude Code 的預設為高努力程度 |
| 取樣參數 | 非預設的 temperature、top_p 或 top_k 會返回 400 錯誤 |
| 可靠知識截止時間 | 2026 年 1 月 |
| 訓練資料截止時間 | 2026 年 1 月 |
什麼是 Claude Sonnet 5?
Claude Sonnet 5 是 Anthropic 下一代的 Sonnet 模型,直接升級自 Claude Sonnet 4.6。Claude Sonnet 5 API 是 Anthropic 最新的 Sonnet 級模型,適用於編碼代理、工具驅動工作流、長上下文文件推理,以及日常專業工作。
該模型縮小了 Sonnet 與 Opus 之間的能力差距。Anthropic 的發佈說明指出,Sonnet 5 在代理式表現上接近 Claude Opus 4.8,同時保留了 Sonnet 級別更快、更高效的定位。它面向需要比 Sonnet 4.6 更強執行力、但不必將所有工作流都切換到 Opus 級模型的開發者。
對於 API 使用者而言,Sonnet 5 也改變了生成控制方式。自適應思考預設啟用,不再接受手動的擴展思考配額,且非預設的取樣參數會被拒絕。因此,從 Sonnet 4.6 遷移到生產環境時,應重新測試 token 預算、移除手動思考配額,並避免覆寫 temperature/top-p/top-k。
Claude Sonnet 5 的功能與亮點
1. 更強的代理式編碼與終端工作能力
Anthropic 將 Claude Sonnet 5 定位為迄今代理性最強的 Sonnet 模型。在系統卡片中,Claude Sonnet 5 在 SWE-bench Verified 達到 85.2%、SWE-bench Pro 為 63.2%、SWE-bench Multilingual 為 78.3%,以及在 Terminal-Bench 2.1 為 80.4%。這些結果使 Claude Sonnet 5 API 非常適合程式碼審查、錯誤排查、遷移規劃、測試生成,以及自主工程代理。
2. 100 萬 token 的長上下文推理
Claude Sonnet 5 預設支援 100 萬 token 的上下文視窗。Anthropic 指出,該模型使用了新的分詞器,對相同文本將產生約多出 30% 的 tokens,因此開發者在遷移時應重新計算提示並重新檢視 max_tokens 設定。大型上下文視窗仍然是倉庫級任務、政策審查、財務活頁簿、多文件研究,以及長客戶支援歷史的重大優勢。
3. 多模態文件與電腦操作能力
Anthropic 目前的 Claude 模型總覽指出,當前 Claude 模型支援文字與影像輸入、文字輸出、多語能力與視覺。Sonnet 5 在 GDP.pdf 無工具得分 67.5%、搭配工具為 81.6%,在 OSWorld-Verified 為 81.2%,在 ChartMuseum 搭配工具為 86.7%,顯示其在高密度文件、GUI 類任務與圖表推理上的實用強度。
4. 通過 CometAPI 的 Claude 特定控制
CometAPI 透過 /v1/messages 提供與 Anthropic 風格整合相符的端點,並透過 /v1/chat/completions 提供與 OpenAI 相容的路由。當你需要 Claude 特定功能(如自適應思考、努力程度控制、提示快取、伺服器工具或 Anthropic 回應結構)時,請使用原生 Messages 端點。當你的應用已經標準化為 OpenAI 風格的聊天呼叫,且希望在同一整合層中比較 Claude Sonnet 5 與 GPT、Gemini 或其他 CometAPI 目錄模型時,請使用相容 OpenAI 的端點。
基準測試表現
Anthropic 的發佈材料與 Claude Sonnet 5 系統卡片報告了相較於 Claude Sonnet 4.6 的廣泛提升,尤其在編碼、代理式搜尋、多模態推理與專業任務表現上。
| 能力 | 基準測試 | Claude Sonnet 5 結果 | 備註 |
|---|---|---|---|
| 程式修復 | SWE-bench Verified | 85.2% | 500 個經驗證的軟體工程任務 |
| 更難的程式修復 | SWE-bench Pro | 63.2% | 更大的多檔差異與更困難的代碼庫問題 |
| 多語言編碼 | SWE-bench Multilingual | 78.3% | 涵蓋 9 程式語言的 300 個任務 |
| 終端編碼代理 | Terminal-Bench 2.1 | 80.4% | 445 次試驗的平均報酬 |
| 代理式編碼 | FrontierCode v1 | 38.8% | 來自 Cognition 的實際 Pull Request 風格任務 |
| Cursor 生產編碼任務 | CursorBench | 61.2% | 由 Cursor 獨立測量;Sonnet 4.6 得分為 49% |
| 代理式網路搜尋 | BrowseComp | 84.7% | 自適應思考在最大努力下,10M-token 限制與上下文壓縮 |
| 電腦操作 | OSWorld-Verified | 81.2% | 首次嘗試成功率,取五次運行平均 |
| 專業 PDF 推理 | GDP.pdf | 無工具 67.5%,搭配工具 81.6% | 針對 100 個專業 PDF 提示的平均準則通過率 |
| 圖表理解 | ChartMuseum | 無工具 70.1%,搭配工具 86.7% | 較 Sonnet 4.6 有明顯提升 |
| Office 文件推理 | OfficeQA / OfficeQA Pro | 73.3% / 59.4% | 在代理式測試環境中的完全匹配分數 |
| 經濟工作任務 | GDPval-AA v2 | ELO 1618 | 由 Independent Artificial Analysis 評估;在系統卡片摘要中排名第二,僅次於 Claude Fable 5 |

Claude Sonnet 5 對比 Sonnet 4.6、Opus 4.8 與 Claude Fable 5
| 模型 | 同類型角色描述 | 最適合場景 | 選型說明 |
|---|---|---|---|
| Claude Sonnet 5 | 快速且高智的 Sonnet 模型,用於代理與編碼 | 編碼代理、長上下文工作、文件分析、生產自動化 | 當 Sonnet 4.6 不夠強、但不需要每個請求都使用 Opus 級模型時選擇。 |
| Claude Sonnet 4.6 | 先前的 Sonnet 生產模型 | 現有 Sonnet 工作流、較低遷移風險、既有提示 | 為了更強的代理式編碼與專業任務表現,建議升級至 Sonnet 5,但需重新測試 token 預算與 API 參數。 |
| Claude Opus 4.8 | 更強大的 Opus 級模型 | 複雜推理、高自主性工作、最困難的長期代理任務 | 當任務需要更高峰值推理能力時使用;在部分代理式任務上,Sonnet 5 在特定努力等級下可匹配或接近其表現。 |
| Claude Fable 5 | Anthropic 最強大且廣泛釋出的模型 | 對品質要求最高的工作負載與高要求長期代理任務 | 當品質優先於堅持使用 Sonnet 級別時,作為上限基準模型使用。 |
如何在 CometAPI 上使用 Claude Sonnet 5 API
Claude Sonnet 5 API 是 Anthropic 最新的 Sonnet 級模型,適用於編碼代理、工具驅動工作流、長上下文文件推理,以及日常專業工作。在 CometAPI 上,該模型的 ID 為 claude-sonnet-5,同時通過原生的 Anthropic Messages 端點與相容 OpenAI 的聊天端點提供,讓開發者可在 Claude 特定控制與可移植的多模型整合層之間進行選擇。
準備:註冊取得 API 金鑰
登入 cometapi.com。若你還不是我們的使用者,請先註冊。登入你的 CometAPI 控制台。取得介面的存取憑證 API key。在個人中心的 API token 處點擊 “Add Token”,取得 token key:sk-xxxxx 並提交。
步驟 1:使用原生的 Anthropic Messages 端點
當你希望通過 CometAPI 獲得最貼近 Claude API 行為時,請使用 /v1/messages。此路徑更適合自適應思考、努力程度控制、提示快取、伺服器工具、串流,以及 Claude 風格的回應內容區塊。
對於 Claude Sonnet 5,請勿傳送手動擴展思考配額,例如 thinking: {"type": "enabled", "budget_tokens": 32000}。Anthropic 建議改用自適應思考與努力程度控制。
步驟 2:使用與 OpenAI 相容的端點進行可移植路由
當你的應用已經使用 OpenAI 風格的聊天呼叫,或希望在相同的客戶端模式下將 Claude Sonnet 5 與其他 CometAPI 目錄模型比較時,請使用 /v1/chat/completions。
步驟 3:在上線前重新測試提示
從 Claude Sonnet 4.6 遷移時,請在新分詞器下重新計算提示、移除非預設取樣參數,並檢視輸出限制。Sonnet 5 對相同文本會產生比 Sonnet 4.6 更多的 tokens,而自適應思考所用 tokens 與最終回應文本共享 max_tokens 預算。
為何使用 CometAPI 來使用 Claude Sonnet 5?
CometAPI 為開發者提供單一的模型市集,涵蓋 Claude Sonnet 5、Claude Opus 級模型、GPT 級模型、Gemini 級模型與其他前沿 AI 系統。當團隊希望使用單一 API key、進行模型比較、分階段發佈、回退路由,以及更容易在供應商之間遷移時,這尤其有用。
對於 Claude Sonnet 5 而言,CometAPI 的價值在於雙端點策略。團隊可以針對 Claude 原生功能使用 Anthropic Messages 端點,並在已標準化為 chat-completions 風格請求的應用中使用與 OpenAI 相容的端點。這讓工程團隊能在真實的編碼、文件與代理工作流中測試 Claude Sonnet 5 API,而無需先重建整個整合層。