Claude Haiku 4.5 是 Anthropic 于 2025 年 10 月中旬发布的一款面向特定用途优化的小型语言模型。它在 Claude 产品线中定位为一种快速、低成本的选择,在实现更高吞吐量和更低单位成本、适合企业规模部署的同时,仍保留了在**编程、智能体编排和交互式“计算机使用”**工作流等任务上的强大能力。
关键特性
- 速度与成本效率:Haiku 4.5 被描述为比 Sonnet 4 快两倍以上,成本约为 Sonnet 4 的三分之一(且比 Opus 便宜得多),因此非常适合大规模使用。
- 扩展思考:首个支持扩展思考的 Haiku 模型(总结式 / 交错式思维、可配置思考预算),可在平衡延迟的同时进行更深入的多步推理。
- 工具与计算机使用:完整支持 Claude 工具(bash、代码执行、文本编辑器、网页搜索和计算机使用自动化)。专为智能体工作流和子智能体架构设计。
- **大上下文窗口:**20 万 token 上下文窗口(其他更大模型类别还提供 100 万上下文选项测试版)。
技术细节
- **训练数据与截止时间:**Haiku 4.5 基于公开数据和授权数据的专有混合数据集训练,训练截止时间约为 2025 年 2 月。
- 支持 扩展思考(一种混合推理模式),因此在有需要时,模型可以用更高延迟换取更深层次的推理。
- 发布时的上下文窗口为 200,000 token,并且该模型明确具备上下文感知能力(会跟踪窗口已使用的部分)。
- **性能 / 吞吐量:**早期社区反馈和 Anthropic 测试表明其 OTPS(每秒输出 token 数)非常高,在某些内部 / 早期测试中,速度约为 ~200+ token/秒——明显快于许多同类中档模型。
基准表现
**SWE-Bench(编程):**Haiku 4.5 在 SWE-Bench Verified 上取得了 ~73.3% 的成绩——Anthropic 强调,这一结果使 Haiku 4.5 成为同类别中全球最优秀的编程模型之一。
**终端 / 命令行 / 工具测试:**Anthropic 报告其在 Terminal-Bench(侧重命令行)上达到 ~41%,并且在许多工具使用基准上,与 Sonnet 4 及若干有竞争力的中档前沿模型表现相当。
**指令遵循与幻灯片文本:**Anthropic 的内部示例称,Haiku 4.5 在某些指令遵循任务上优于先前模型(例如幻灯片文本生成:在其基准中,65% 对 44%,相较于一款此前的高端模型)。
真实世界自动化 / 智能体任务:第三方评测和早期采用者报告称,在自动化 UI / 智能体任务上,其成功率具有竞争力(例如,在某些测试中,OSWorld 风格或智能体基准在复杂自动化任务上报告约 ≈50% 的成功率),表明其适用于大规模工作流,但也存在不可忽视的失败模式。
局限性与安全说明
- 不是前沿模型:Anthropic 明确将 Haiku 4.5 归类为不推动前沿进展的模型;它针对的是效率优化,而不是追求绝对最先进水平。(Anthropic)
- 偶发的敏感话题行为:在一些科学 / 生物安全相关提示中,Haiku 4.5 有时会返回带保留说明的高层次信息,而不是严格拒绝;Anthropic 将其标记为仍在持续改进的领域。
- 扩展思考可能会改变行为(有时会增加响应中的不对称性)。
推荐使用场景
- 智能体编程与多智能体编排:快速子智能体、迭代式代码重构、自动测试和补丁生成。(非常适合。)
- 实时、高并发客户工作流:聊天助手、对单次请求成本敏感的内部自动化。(非常适合。)
- 支持工具的工作流与计算机控制:自动化 GUI/CLI 任务、文档工作流和工具链,低延迟在此类场景中很有帮助。(非常适合。)
- 不推荐(若无控制措施):需要前沿级科学序列设计或高保障生物安全任务的独立角色。(请谨慎使用。)
如何访问 Claude Haiku 4.5 API
第 1 步:注册 API Key
登录 cometapi.com。如果您还不是我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
第 2 步:向 Claude Haiku 4.5 API 发送请求
选择 “claude-haiku-4-5-20251001” 端点发送 API 请求并设置请求体。请求方法和请求体可从我们网站的 API 文档中获取。我们的网站还提供 Apifox 测试以方便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。base url 为 Anthropic Messages 和 Chat。
将您的问题或请求插入到 content 字段中——模型将对此作出响应。处理 API 响应以获取生成的答案。
第 3 步:获取并验证结果
处理 API 响应以获取生成的答案。处理完成后,API 会返回任务状态和输出数据。