Claude Haiku 4.5 是 Anthropic 推出的針對特定用途優化的小型級別語言模型,於 2025 年 10 月中旬發佈。它在 Claude 產品線中定位為快速、低成本的選項,在**程式設計、代理協調,以及互動式「電腦操作」**等工作流程方面保持強大能力,同時為企業部署帶來更高吞吐量與更低單位成本。
主要特性
- 速度與成本效率:Haiku 4.5 被描述為比 Sonnet 4 快兩倍以上,成本約為 Sonnet 4 的三分之一(且遠低於 Opus),對大規模使用具有吸引力。
- 擴展思考:首個支援擴展思考的 Haiku 模型(摘要/交錯思維、可配置的思考配額),在權衡延遲的同時實現更深入的多步推理。
- 工具與電腦操作:對 Claude 工具提供完整支援(bash、程式碼執行、文字編輯器、網路搜尋與電腦操作自動化)。為代理式工作流程與子代理架構而設計。
- 大型上下文視窗:提供200k token 的上下文視窗(較大型模型提供 1M 上下文選項,作為其他模型類別的測試版)。
技術細節
- **訓練資料與截止:**Haiku 4.5 使用公共與授權資料的專有混合進行訓練,訓練截止約在 2025 年 2 月。
- 支援「擴展思考」(一種混合推理模式),可在需要時以更高延遲換取更深入的推理。
- 發佈時的上下文視窗為 200,000 tokens,且模型具有明確的上下文感知能力(可追蹤視窗的使用量)。
- 效能/吞吐量:早期社群報告與 Anthropic 測試指出 OTPS(每秒輸出 token 數)非常高,部分內部/早期測試的非正式觀測速度約為 ~200+ tokens/sec——遠快於許多同級中階模型。
基準表現
**SWE-Bench(程式設計):**Haiku 4.5 在 SWE-Bench Verified 上取得 ~73.3% ——Anthropic 指出這使其成為同級別中表現最優秀的程式設計模型之一。
**終端/命令列/工具測試:**Anthropic 報告在 Terminal-Bench 上約為 ~41%,且在許多工具使用基準上與 Sonnet 4 以及多個競爭的中階前沿模型表現相當。
**指令遵循與投影片文字:**Anthropic 的內部示例聲稱,在某些指令遵循任務上(例如投影片文字生成:65% vs 44%,以其基準中的一款此前高階模型為對照)Haiku 4.5 優於先前模型。
**真實世界自動化/代理任務:**第三方評估與早期採用者回報在自動化 UI/代理任務上具有競爭力的成功率(例如 OSWorld 風格或代理基準在某些測試中報告 ≈50% 的成功率),顯示其對大規模工作流程的實用性,但仍存在不容忽視的失敗模式。
限制與安全說明
- 非前沿模型:Anthropic 明確將 Haiku 4.5 歸類為非推動前沿的模型;其優化目標在於效率,而非追求絕對最先進的水準。(Anthropic)
- 對敏感主題的偶發行為:在某些科學/生物安全相關提示下,Haiku 4.5 有時會提供附帶注意事項的高層次資訊,而非嚴格拒絕;Anthropic 指出這是持續改進的方向。
- 擴展思考可能改變行為表現(有時會增加回覆的非對稱性)。
建議使用情境
- 代理式編碼與多代理協調:快速子代理、迭代程式碼重構、自動測試與修補程式生成。(適合。)
- 即時且高量的客戶工作流程:聊天助理、對單次請求成本敏感的內部自動化。(適合。)
- 工具驅動的工作流程與電腦控制:自動化 GUI/CLI 任務、文件工作流程與工具鏈,低延遲能帶來助益。(適合。)
- 不建議(無相應管控時):需要前沿水準科學序列設計或高保證生物安全任務的獨立角色。(請謹慎。)
如何存取 Claude Haiku 4.5 API
步驟 1:申請 API 金鑰
登入 cometapi.com。若您尚非我們的使用者,請先註冊。登入您的 CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 位置點擊「Add Token」,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 Claude Haiku 4.5 API 發送請求
選擇“claude-haiku-4-5-20251001”端點來發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以供便利。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。Base URL 見 Anthropic Messages 與 Chat。
將您的問題或請求填入 content 欄位——模型將對此作出回應。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。