技術規格 — Claude Sonnet 4.6
| 項目 | Claude Sonnet 4.6(公開摘要) |
|---|---|
| 提供商 | Anthropic |
| 模型家族 | Sonnet(Claude v4.x 家族)— Sonnet 4.6 變體 |
| 模型 id(標準) | claude-sonnet-4-6 |
| 輸入類型 | 文字(主要)。對結構化工具/JSON I/O 提供有限/次要支援。非以圖像生成為主要用途的模型。 |
| 輸出類型 | 文字(自然語言、結構化 JSON、程式碼與工具呼叫負載) |
| 上下文視窗 | ~200,000 個 token(約)— 為多文件與長會話的一致性而設計 |
| 函式呼叫/工具使用 | 是 — 支援結構化工具呼叫、JSON 受限輸出、類代理式編排 |
| 多模態 | 有限 — Sonnet 著重於文字與結構化工具整合;未針對圖像生成最佳化。 |
| 發佈說明重點 | 在長上下文推理的穩定性/改進、面向速度–準確權衡的較低延遲 Sonnet 變體、改進的指令遵循。 |
什麼是 Claude Sonnet 4.6
Claude Sonnet 4.6 是 Anthropic 的 Sonnet 模型系列的最新進化,旨在以更親民的價格提供接近 Opus 的效能。它將 Sonnet 從早期的 4.5 版本升級,帶來更強的指令遵循、極大擴展的上下文支援、改進的程式設計與電腦使用能力,以及更廣泛的多步推理能力——同時維持與 Sonnet 4.5 相同的定價。
不同於作為旗艦並針對重型代理式工作負載最佳化的 Opus 模型,Sonnet 4.6 面向需要廣泛能力與成本效益的開發者與一般知識型工作。
Claude Sonnet 4.6 的主要功能
- 1M Token 上下文視窗(Beta):Sonnet 4.6 在 Beta 中支援高達一百萬個 token 的上下文——大致可在單次請求中納入整個程式碼庫、一疊法律合約或多篇學術論文。
- 改進的程式設計效能:相較於 Sonnet 4.5,Sonnet 4.6 在實際開發者任務與如 SWE-Bench Verified 的基準測試上有顯著提升(回報分數約 ~79.6%),適用於複雜的程式設計任務。
- 增強的電腦操作能力:在涉及操作軟體的任務(試算表、多步驟網頁表單工作流程等)上達到新的熟練度,在 OSWorld-Verified 測試中接近人類水準的表現。
- 自適應思考:模型融入增強的推理策略,能動態分配內部計算,逐步處理複雜問題。
- 更強的指令遵循:用戶回報在遵循詳細請求方面更一致且更精確,幻覺更少,任務完成度更高。
- 安全性與提示注入抵抗力:與 Sonnet 4.5 相比,Anthropic 提升了對提示注入攻擊與類似弱點的魯棒性。
Claude Sonnet 4.6 的基準表現
| 評估 | Claude Sonnet 4.6(約) | 備註 |
|---|---|---|
| SWE-Bench Verified | ~79.6% | 強大的程式設計表現,接近 Opus 等級。 |
| OSWorld-Verified(Computer Use) | ~72.5% | 接近人類水準的任務表現;對工作流程非常有力。 |
| ARC-AGI-2 | ~60.4% | 反映廣泛的推理能力。 |
作為中階模型,Sonnet 4.6 顯著縮小與 Opus 模型的效能差距,使其適用於許多先前需旗艦級模型才能勝任的任務。
Claude Sonnet 4.6 與其他 Claude 模型的比較
| 模型 | 最適用於 | 關鍵差異 |
|---|---|---|
| Claude Sonnet 4.6 | 兼顧程式設計、推理與大型上下文 | 超大上下文視窗 Beta、具成本效益、對工作流程任務表現強勁。 |
| Claude Sonnet 4.5 | 中階的一般任務 | 基準分數較低,4.6 之前的上下文視窗較小。 |
| Claude Opus 4.6 | 深度推理與代理式程式設計 | 原始推理與代理能力更強;價格更高。 |
與 Sonnet 4.5 相比,4.6 版本提升了對上下文的理解與辦公場景任務的表現;與 Opus 模型相比,Sonnet 在旗艦級推理能力上略低一籌,但在程式設計與一般任務基準上往往比預期更接近。
Claude Sonnet 4.6 的限制
- Beta 上下文視窗:100 萬 token 的上下文目前處於 Beta——採用情況與穩定性可能因 API 使用方式與方案而異。
- 延遲與成本:處理極大的上下文會增加計算成本,與較小上下文相比,API 呼叫可能出現更高延遲。
- 基準細粒度:雖然在已報告測試中表現強勁,但在最複雜的推理或跨學科基準上,Sonnet 可能略遜於 Opus。
Claude Sonnet 4.6 的代表性用例
- 大型程式碼庫協助:適合納入並推理整個軟體系統、重構或跨檔相依關係。
- 文件與研究綜合:適用於超出典型限制的長文檔分析。
- 工作流程自動化:處理多步驟的電腦任務,例如試算表與表單自動化。
- 一般知識型工作:適合需要可靠指令遵循與推理、但不想承擔旗艦模型成本的知識工作者。
如何存取並使用 Claude Sonnet 4.6 API
步驟 1:註冊並取得 API 金鑰
登入 cometapi.com。如果你還不是我們的用戶,請先註冊。登入你的 CometAPI console。取得介面存取憑證 API 金鑰。點擊個人中心的 API token「Add Token」,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 claude-sonnet-4-6 API 發送請求
選擇 “claude-opus-4-6” 端點發送 API 請求並設定請求本文。請求方法與請求本文可從我們的網站 API 文件取得。我們的網站也提供 Apifox 測試以便於使用。將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。呼叫位置:Anthropic Messages 格式與 Chat 格式。
將你的問題或請求插入 content 欄位——這是模型將回應的內容。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理後,API 會回覆任務狀態與輸出資料。