如何结合 Thinking Mode 代码使用 Claude 3.7

CometAPI
AnnaJun 15, 2025
如何结合 Thinking Mode 代码使用 Claude 3.7

Claude 3.7 Sonnet 在 AI 推理与编码能力方面代表了一个里程碑,为开发者在 AI 如何“思考”复杂任务上提供前所未有的控制。发布于 2025 年 2 月,Claude 3.7 Sonnet 引入了混合推理模型,可在快速响应与详细、逐步反思之间无缝切换,既适用于简单查询,也适用于多阶段工作流。API 用户可通过可配置的“思考预算”微调模型的思考行为,在速度、成本与推理深度之间实现精确权衡。

什么是 Claude 3.7 Sonnet?

Claude 3.7 Sonnet 是 Anthropic 的首个混合推理 AI,既具备直觉式、快速响应能力,也可选择进行面向用户可见的、延展的内部推理。不同于早期模型需要在速度或深度之间二选一,Claude 3.7 将两种模式统一到一个模型中,开发者可根据任务复杂度在两者间无缝切换 (, )。

混合推理架构

Claude 3.7 Sonnet 的核心是一套统一的架构,同时处理“快”与“慢”的思维路径。在默认模式下,Claude 通过调用预训练启发式几乎瞬时地给出回复;启用扩展思考时,它会暂停生成“思维”token——用户可检视与优化的中间推理步骤。该架构类似于人类认知,直觉与深思在同一心智中并存。

扩展思考模式 vs 快速模式

可通过 API 参数开启或关闭扩展思考模式,开发者可设置以 token 计量的“思考预算”,限制 Claude 在一个问题上投入的时长。快速模式通过绕过推理草稿板几乎立即返回答案,而扩展模式会生成可见的逻辑步骤轨迹。此灵活性确保简单查询保持高效,而复杂问题获得所需的深入分析。

如何在代码中启用思考模式?

哪些 API 参数控制思考模式?

要在 Anthropic API 中使用思考模式,请在请求载荷中指定:

json{
  "model": "claude-3.7-sonnet",
  "prompt": "...",
  "thinking_mode": "extended",
  "max_thoughts": 1000
}
  • model: 设置为 claude-3.7-sonnet 以使用混合推理。
  • thinking_mode: 选择 "standard" 或 "extended"(可见的链式思考)。
  • max_thoughts: 限制草稿板的长度——在预算与深度之间调优。

扩展思考模式在所有付费层级与 API 中均可用,但免费 Claude 层不支持。

如何在 Claude Code(CLI)中启用思考模式?

Anthropic 的 Claude Code CLI 将思考模式带到你的终端。安装方式:

bashnpm install -g @anthropic/claude-code

然后运行:

bashclaude-code --model sonnet-3.7 --think extended ./path/to/project

该命令指示 Claude Code 在编码时内部分解任务(例如脚手架化一个 REST API),并输出其规划步骤。研究预览支持对思考时长进行精细控制(--think-duration 30s),在周转时间与深度之间取得平衡。

开发者如何将思考模式代码整合到工作流?

通过 Anthropic API 集成 Claude 3.7 的思考模式非常简单。通过传递诸如 --thinking_mode--thinking_budget 等配置标志,开发者可以控制 Claude 是否使用草稿板,以及为推理投入多少“算力”。这种方法使在现有 CI/CD 与 DevOps 流水线中对延迟、成本与答案质量进行精细化管理成为可能。

API 用法与思考预算参数

调用 Claude API 时,可包含诸如 thinking_mode="extended"thinking_budget=5000 的参数,以为内部推理分配最多 5,000 个 token。或者,将 thinking_mode="quick" 设为快速模式以禁用草稿板,获得更快且更低成本的输出。Anthropic 的文档提供了主流语言(Python、JavaScript、Go)的代码片段,便于将思考模式直接集成到代码编辑器、聊天界面或命令行工具中。

提示工程最佳实践

通过合理结构化提示来引导 Claude 的推理,从而最大化思考模式效率。例如,以“让我们一步一步地思考:”作为任务前缀,为草稿板的结构化逻辑做预设。使用中间检查(“这一步是否正确?”)确保在继续之前获得稳健的进展。将每个推理块限制在 100–200 个 token 可防止过度思考,而清晰的任务描述有助于 Claude 有效分配思考预算。

常见的代理式编码模式是什么?

  1. 任务分解:使用扩展思考将大型需求拆分为子任务,输出步骤的 JSON 列表。
  2. 自动化代码评审:提示 Claude “思考”潜在边界情况,并用源自草稿板的洞见为拉取请求添加注释。
  3. 多代理研究:在 Anthropic 的内部多代理系统中,主代理使用扩展思考为子代理分配角色与工具,在测试中将指令遵循度提升了逾 15%。

在编码与推理方面,Claude 3.7 与其他模型相比如何?

截至 2025 年年中,Claude 3.7 的混合方法使其有别于 OpenAI 的 GPT‑4o 与 xAI 的 Grok。最新比较强调,Claude 在处理复杂逻辑谜题与长时间代码生成方面比 GPT‑4o 更为准确,但延迟略高。与此同时,Grok 的代理式工作流在社交媒体情感分析中表现出色,但缺乏 Claude 的透明草稿板功能。

与 GPT‑4o 和 Grok 的比较

在同台测试中,GPT‑4o 提供更快的原始 token 吞吐量,但在具有深度多步依赖的任务上表现吃力,在代码正确性基准上低 8%。Grok 3 在创意写作和简单问答方面表现良好,但在逐步调试任务上逊色。Claude 3.7 在一系列软件工程与逻辑推理挑战中持续匹配或超过这两者的准确性。

成本与上下文窗口考量

Claude 3.7 提供 200,000 token 的上下文窗口——是 GPT‑4o 的两倍——可一次性处理庞大代码库或长文档。虽然扩展思考会产生额外 token 成本,但 Anthropic 的分级定价确保深度推理会话相较于其他按 token 计费模型仍具成本效益。开发者可通过调整思考预算参数在深度与预算间取得平衡,为日常任务降低开销。

在哪里可以访问 Claude 3.7 Sonnet 并立即开始使用?

哪些订阅层包含思考模式?

扩展思考模式在所有付费 Claude 计划——Pro、Team 和 Enterprise——以及 Anthropic API 中均可用。它也可在 Amazon BedrockGoogle Cloud’s Vertex AI 上访问,便于集成到现有云管道中。注意 Free 层不支持扩展思考。

如何在您的环境中启用 Claude 3.7?

  • Claude.ai 仪表板:在模型设置面板切换“Extended Thinking”。
  • API:在请求载荷中包含 "model": "claude-3.7-sonnet""mode": "extended"
  • Bedrock/Vertex:在模型目录中选择 “Claude 3.7 Sonnet” 并启用思考特性标志。
    启用后,团队可在 CLI 与 API 间互换使用,便于在多样技术栈中快速原型与生产部署。

通过 CometAPI 访问 Claude 3.7

CometAPI 提供统一的 REST 接口,聚合数百个 AI 模型——在一致的端点下,内置 API 密钥管理、使用配额与计费仪表板。无需再在多个厂商 URL 与凭证之间来回切换。

开发者可通过 CometAPI 访问 Claude 3.7-Sonnet API(model: claude-3-7-sonnet-20250219; claude-3-7-sonnet-20250219),文中的最新模型列表以文章发表日期为准。开始使用前,可在 Playground 探索模型能力,并查阅 API guide 获取详细说明。访问之前,请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方价格的报价,助你快速集成。

CometAPI 亦提供最新的 Claude 4 API(Claude Opus 4 APIClaude Sonnet 4 API)。

结论

通过将前沿的混合推理与灵活的 API 控制相结合,Claude 3.7 Sonnet 使开发者与企业能够自信而清晰地解决复杂问题。无论是构建复杂算法、诊断多层级客户问题,还是审计 AI 决策路径,Claude 3.7 的思考模式代码都为现代企业需求提供透明、可控且高性能的解决方案。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣