Claude Haiku 4.5 博客

以下为在 Claude 中使用“Thinking(思考)模式”的常见方式(以实际界面与文档为准):

- 在 Claude 网页/桌面/移动端
  - 新建对话后,打开模型选择器,选择带有“Thinking/思考”标识的模型,或在可见的“Thinking/高级推理”开关中启用。
  - 若界面提供“思考/推理预算”或“深度/速度”选项,可根据任务复杂度进行调整。
  - 提示词建议:明确目标与约束,并要求“仅输出最终答案/结论”,避免要求展示中间思考过程。

- 在 API/SDK 中
  - 选择支持 Thinking 的模型(模型列表以控制台/文档为准,通常名称中会标明 Thinking)。
  - 在请求参数中启用 Thinking/高级推理相关配置,并(如支持)设置思考/推理预算;同时配置 max_output_tokens、温度等常规参数。
  - 监控使用量与延迟:Thinking 会消耗更多代币并更慢,可结合超时、重试与用量指标(如思考/输出 tokens)进行控制。

- 适用场景与注意事项
  - 适合多步骤推理、复杂规划、代码与数学问题;对简单查询不一定有益。
  - 响应更慢、成本更高;在需要深度推理时再开启。
  - 若在你的账号或区域看不到该模式,可能尚未开通或未覆盖,请在控制台查看可用模型与权限。
Mar 27, 2026
Claude Haiku 4.5

以下为在 Claude 中使用“Thinking(思考)模式”的常见方式(以实际界面与文档为准): - 在 Claude 网页/桌面/移动端 - 新建对话后,打开模型选择器,选择带有“Thinking/思考”标识的模型,或在可见的“Thinking/高级推理”开关中启用。 - 若界面提供“思考/推理预算”或“深度/速度”选项,可根据任务复杂度进行调整。 - 提示词建议:明确目标与约束,并要求“仅输出最终答案/结论”,避免要求展示中间思考过程。 - 在 API/SDK 中 - 选择支持 Thinking 的模型(模型列表以控制台/文档为准,通常名称中会标明 Thinking)。 - 在请求参数中启用 Thinking/高级推理相关配置,并(如支持)设置思考/推理预算;同时配置 max_output_tokens、温度等常规参数。 - 监控使用量与延迟:Thinking 会消耗更多代币并更慢,可结合超时、重试与用量指标(如思考/输出 tokens)进行控制。 - 适用场景与注意事项 - 适合多步骤推理、复杂规划、代码与数学问题;对简单查询不一定有益。 - 响应更慢、成本更高;在需要深度推理时再开启。 - 若在你的账号或区域看不到该模式,可能尚未开通或未覆盖,请在控制台查看可用模型与权限。

“思考模式”(亦称 extended thinking、thinking 或 thinking blocks)在 Claude 4.5 中是一种显式、可配置的运行模式,它指示模型在输出最终答案之前,使用单独预算的若干 tokens 生成内部、逐步的推理(“思维链”)。它通过以更高的时延与 token 成本换取更深入的内部审思,从而提升在多步推理、复杂编码与 Agent 化工作流以及研究任务上的表现。Claude 4.5 在 Messages API 层面通过显式参数(例如 thinking / budget_tokens,或 effort/“interleaved-thinking” 请求头)公开此能力,保留并可选地加密思考块以用于后续验证或工具使用,并引入了在构建生产级工作负载时需要管理的缓存与 token 记账行为。