Claude Haiku 4.5 是 Anthropic 於 2025 年 10 月中推出的目標優化、小型級語言模型。其在 Claude 產品線中定位為快速、低成本的選項,同時在 程式設計、代理協作與互動式「computer-use」 等工作流程上保有強大能力,並為企業部署提供更高吞吐量與更低單位成本。
關鍵功能
- 速度與成本效率: Haiku 4.5 被描述為比 Sonnet 4 快超過兩倍、成本約為 Sonnet 4 的三分之一(且遠低於 Opus),適合大規模用量。
- 延展思考: 首個支援延展思考(精簡/交錯式思考、可設定思考預算)的 Haiku 模型,可在多步推理深度與延遲之間取得平衡。
- 工具與電腦使用: 對 Claude 工具(bash、程式碼執行、文字編輯器、網頁搜尋與電腦操作自動化)提供完整支援。為代理式工作流程與子代理架構而設計。
- 大型內容視窗: 200k token 的內容視窗(在較大型模型上提供 1M context 選項作為其他模型類別的測試版)。
技術細節
- 訓練資料與截止: Haiku 4.5 以專有的公共與授權資料混合訓練,訓練截止時間約為 2025 年 2 月。
- 延展思考(混合推理模式)受支援,可在需求時以延遲換取更深層推理。
- 內容視窗在發佈時為200,000 tokens,且模型明確具備情境感知(可追蹤視窗使用量)。
- 效能/吞吐量: 社群早期回報與 Anthropic 測試指出 OTPS 很高,內部/早期測試的非正式速度約 ~200+ tokens/sec —— 遠快於許多同級中階模型。
基準測試表現
SWE-Bench(程式設計): Haiku 4.5 在 SWE-Bench Verified 上取得 ~73.3% —— Anthropic 指出該成績使 Haiku 4.5 成為同級中全球頂尖的程式設計模型之一。
終端機/命令列/工具測試: Anthropic 報告在 Terminal-Bench(聚焦命令列)上約 ~41%,並在多項工具使用基準上與 Sonnet 4 及多個同級前沿中階模型相當。
指令遵循與投影片文字: Anthropic 內部範例聲稱 Haiku 4.5 在部分指令遵循任務上優於先前模型(例如,投影片文字生成:在其基準中為 65% vs 44%,相較於先前的高階模型)。
真實世界自動化/代理任務: 第三方評估與早期採用者回報在自動化 UI/代理任務上具競爭力的成功率(例如,OSWorld 風格或代理基準的一些測試中約 ≈50% 成功率),顯示其適合擴大量產工作流程,但仍存在非平凡的失敗模式。
限制與安全說明
- 非前沿模型: Anthropic 明確將 Haiku 4.5 分類為不以推進前沿為目標;它優化於效率,而非追求絕對最先進的表現。(Anthropic)
- 偶發的敏感主題行為: 在某些科學/生物安全相關提示中,Haiku 4.5 有時會給出高層次資訊並附帶警示,而非嚴格拒答;Anthropic 指出這是持續改進中的區域。
- 延展思考可能改變行為(有時會增加回應的不對稱性)。
建議使用情境
- 代理式程式設計與多代理協作: 快速子代理、迭代重構、單元測試與修補產生。(適合。)
- 即時、高量使用者工作流程: 對話助理、內部自動化,重視請求成本。(適合。)
- 工具驅動工作流程與電腦控制: 自動化 GUI/CLI 任務、文件流程與工具鏈,低延遲更有幫助。(適合。)
- 不建議(缺乏控管時): 需要前沿級科學序列設計或高保證生物安全工作的獨立角色。(請審慎。)
如何存取 Claude Haiku 4.5 API
步驟 1:註冊並取得 API 金鑰
登入 cometapi.com。若您尚未成為使用者,請先註冊。登入您的 CometAPI console。取得該介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊「Add Token」,取得 token key:sk-xxxxx 並提交。
步驟 2:向 Claude Haiku 4.5 API 發送請求
選擇 “claude-haiku-4-5-20251001” 端點來發送 API 請求並設定請求本文。請求方法與請求本文可從我們的網站 API 文件取得。我們的網站也提供 Apifox 測試以便您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。base url 是 Anthropic Messages 和 Chat。
將您的問題或請求插入 content 欄位—模型會回應該內容。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。