Claude 3.7 Sonnet 与 Claude 3.5 Sonnet:有何变化

CometAPI
AnnaApr 4, 2025
Claude 3.7 Sonnet 与 Claude 3.5 Sonnet:有何变化

Anthropic 的 AI 助手 Claude 随着 3.5 版本与 Claude 3.7 Sonnet 的发布取得了显著进步。这些更新带来了更强的推理能力、更出色的编程辅助以及更丰富的功能,使 Claude 成为 AI 领域中一名强有力的竞争者。本文将深入比较 Claude 3.5 与 3.7 Sonnet,重点介绍它们的特性、性能以及对用户的整体影响。

Claude 3.7 Sonnet API

Claude 3.5 与 3.7 Sonnet 有何区别?

特性Claude 3.7 SonnetClaude 3.5 Opus
SWE-bench 准确率62.3%49.0%
任务完成速度节省 45 分钟以上标准
零售任务准确率81.2%71.5%
每百万 tokens 成本$3(输入),$15(输出)$15(输入),$75(输出)

什么是 Claude 3.5?

在 3.7 之前发布的 Claude 3.5 标志着 Anthropic AI 产品的重要演进。它引入了诸如 Artifacts 等功能,使用户可以直接在浏览器中运行代码并保存内容以供日后使用。此外,项目库功能便于共享工作与创意协作,提升了生产力。Claude 3.5 还拥有约 200,000 tokens 的上下文窗口,在特定应用中可扩展至 1 million,这对于分析图像、照片和图表尤为有益。然而,用户会遇到相对较低的速率限制,消息配额常常触顶,需切换到更小的模型或等待重置。此外,尽管 Claude 3.5 在编程辅助方面表现出色,但不具备图像生成能力,不过它可以提供与 Midjourney 等图像生成器兼容的提示词。

Claude 3.7 Sonnet 的改进

在前代基础上,Claude 3.7 Sonnet 引入了“混合推理”,使模型能够处理更复杂的问题,尤其是在数学和编程方面。此项增强通过将推理作为核心能力进行整合,旨在简化用户交互,无需单独的推理模型。Claude 3.7 Sonnet 在代理式编码、金融与法律任务上有显著提升。尽管不具备实时网页搜索能力,但其知识更新至 2024 年 10 月,信息更为新近。开发者能够影响模型的运行方式,包括响应时间,从而对性能实现更大的掌控。在内部用例中,Claude 3.7 被用于优化网页设计、开发游戏以及执行大量编程任务,展现了其多样性与高效性。

性能与准确性如何对比?

基准测试评估

与 Claude 3.5 Sonnet 相比,Claude 3.7 Sonnet 在多项基准测试中表现更优。尤其在编码任务中,Claude 3.7 的准确率与效率更高,完成任务的速度也快于前代。

推理与问题解决能力

Claude 3.7 Sonnet 引入的“扩展思考模式”增强了其推理能力,尤其在数学和编程等复杂领域更为突出。该模式允许模型在回答前进行自我反思,从而生成更准确且更周全的回复。相比之下,尽管 Claude 3.5 Sonnet 较早期版本有所改进,但并不具备这一高级推理特性。

编程辅助

两者均提供了强大的编程支持,但 Claude 3.7 Sonnet 引入了 Claude Code,这是一款面向代理式协作的编码工具,旨在成为积极的协作伙伴。该工具能够搜索与阅读代码、编辑文件、编写并运行测试、将代码提交并推送至 GitHub,以及使用命令行工具,大幅简化编码工作流程。

上下文窗口与视觉能力

Claude 3.5 具有大型上下文窗口,有利于细致的对话任务和图像分析。Claude 3.7 Sonnet 在保留这些能力的同时整合了高级推理,使用户可以在快速响应与更细致的逐步推理之间进行选择,从而提升灵活性与用户体验。

集成与可用性

两者均通过为 Windows 与 macOS 提供桌面应用来扩大可用性,并新增听写支持,使用户可直接在电脑上与 Claude 交互并通过语音输入。上述集成促进了多任务的无缝处理以及将 Claude 的功能纳入各类应用。

性能差异有哪些?

速度与效率

Claude 3.5 运行高效,但受制于速率限制,对重度用户有影响。Claude 3.7 Sonnet 通过允许开发者设定响应时间并提升吞吐,缓解了这些问题,提供更定制化与更高效的体验。

跨领域应用

Claude 3.5 被用于前端网站设计与交互式游戏开发等任务。Claude 3.7 Sonnet 进一步扩大了应用范围,承担大量编码任务、提升网页设计并开发游戏,展示了其跨领域的多样性。

哪个版本更适合你的需求?

面向开发者的考量

需要高级编程辅助并希望影响模型运行方式的开发者,可能会发现 Claude 3.7 Sonnet 更符合需求。引入的 Claude Code 以及可定制的响应时间,为编码任务提供了更强的可控性与效率。

普通用户与对话交互

对于进行对话交互的普通用户,两者都提供类人交互与增强的推理能力。不过,Claude 3.7 Sonnet 的混合推理模型在细致性与复杂问题求解方面更胜一筹,提升了整体用户体验。

集成与可用性如何对比?

两种模型均可通过 Claude 应用、Anthropic 的 API、Amazon Bedrock 与 Google Cloud 的 Vertex … 访问。然而,Claude 3.7 Sonnet 引入了增强用户对模型运行控制的特性,包括可设定响应时间并影响模型的推理过程。这些改进为开发者在将模型集成到各类应用时提供了更大的灵活性。

Claude 3.5 与 3.7 模型的费用是多少?

相比 Claude 3.5 Sonnet,Claude 3.7 Sonnet 的性价比更高。Claude 3.7 的定价结构与前代一致:每百万输入 tokens 收费 $3,每百万输出 tokens 收费 $15。

在 CometAPI 中的 Claude 3.5 与 3.7 模型

CometAPI 提供远低于官方价格的方案,帮助你集成 Claude 3.7 Sonnet API(model name: claude-3-7-sonnet-20250219; claude-3-7-sonnet-thinking)与 Claude 3.5-Sonnet API(model name: claude-3-5-sonnet-20241022),并且注册并登录后你的账户将获得 $1!欢迎注册体验 CometAPI。

CometAPI 作为多家领先 AI 模型 API 的集中枢纽,使你无需分别对接多个 API 提供商。

集成详情请参阅 Claude 3.7 Sonnet API和 [Claude 3.5-Sonnet API](https://www.cometapi.com/grok-3-api/)。

CometAPI 的定价结构如下:

类别Claude 3.7 SonnetClaude 3.5 Sonnet
API 定价claude-3-7-sonnet-20250219 -输入: $2.4 / million tokens -输出: $12 / million tokens 缓存写入: $3 / M tokens输入 Tokens: $2.4 / M tokens 输出 Tokens: $12 / M tokens 缓存写入: $3 / M tokens
claude-3-7-sonnet-thinking -输入: $4.8 / million tokens -输出: $24 / million tokens 缓存写入: $6 / M tokens

结论

Anthropic 的 Claude 从 3.5 到 3.7 Sonnet 取得了显著进步,带来了更强的推理能力、编程辅助与用户可用性。混合推理模型与 Claude Code 等工具使 Claude 3.7 Sonnet 成为多功能且高效的 AI 助手,既适合开发者也适合普通用户。随着 AI 不断演进,这些发展强调了整合先进推理与以用户为中心的特性以满足 AI 领域多样化需求的重要性。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣