我们在 2025 年见证了 AI 的爆发式进步:Claude Opus 4、Sonnet 4、Claude Gov、细粒度工具流、ChatGPT 的 GPT‑4.1 和 GPT‑4o、语音模式升级、新的定价方案——不胜枚举。本文将逐一解读这些更新,帮助你我一起弄清:Claude AI 真的比 ChatGPT 更好吗?
Claude AI 最新版本的关键创新有哪些?
Claude Opus 4 与 Sonnet 4:推理与编码的飞跃
你可能已经听到不少讨论:2025 年 5 月,Anthropic 发布了其旗舰模型 Claude Opus 4 和 Claude Sonnet 4。Claude Opus 4 在编码基准测试中表现顶尖——SWE‑bench 得分 72.5%、Terminal‑bench 得分 43.2%——非常适合处理复杂、耗时数小时的编码或研究任务。与此同时,Sonnet 4 强调快速且审慎的回应,在速度与深度之间取得平衡。Opus 4 是迄今最强大的模型,专为最艰难的任务和长时间运行的工作流而设计。Sonnet 4 则是一款更快、更均衡的日常使用模型。两者都具备高达 200,000 令牌的上下文窗口,可处理超长对话或文档。Anthropic 还引入了**“延展思考”**:在复杂查询上允许模型投入更多推理时间的选项。
细粒度工具流:更智能的集成
除了模型的原始能力,Claude 的细粒度工具流(2025 年 6 月 11 日上线)是一次重要跃进。这项公开测试功能允许 Claude 对单个工具调用进行流式输出——例如网页搜索或数据库查询——无需等待缓冲或验证整个 JSON 负载,因此在串联多工具时可获得更顺畅、逐步增量的答案。配合“带工具使用的延展思考”测试版,Claude 能在一次响应中在内部推理与外部工具调用之间交替,类似对话中的 AI 代理一边思考一边灵活使用资源。实际效果是,Claude 可以循环其推理步骤并并行使用多个工具,以更快获得更好的答案。比如,你可以让 Claude 搜索网页、运行代码或查询文件,而无需等待某个工具结束再启动另一个(新的细粒度工具流让这一过程更快、更灵敏)。
Claude Code
一项重要新增是Claude Code,面向开发者。Claude Code 让你就自己的代码项目与 Claude 对话。它可通过 GitHub Actions 运行后台任务,并直接挂接到 VS Code 或 JetBrains IDE 等编辑器。你可以在终端或 IDE 中让 Claude 生成、重构或编写代码文档。与此同时,Claude API 增加了诸如代码执行工具(在沙箱中运行 Python)、浏览器工具(网页搜索)和文件 API(上传数据)等能力。这些使 Claude 更像一个“AI 代理”平台,而不仅仅是聊天机器人。
新服务
Anthropic 还推出了Claude Pro 功能。免费的 Claude 现在甚至包含 Sonnet 4(快速模式)以及基础网页搜索。Claude Pro(年付优惠为 US$17/月,按月 US$20)解锁高强度使用、在终端访问 Claude Code、用于整理聊天的无限项目、扩展记忆的“Research”模式,以及 Google Workspace 等“远程上下文提供方”的连接器。还有高端**“Max”**套餐(起价 $100/月),面向重度用户,提供 Pro 的 5×–20× 使用量与优先访问。Enterprise 与 Team 套餐新增 SSO、审计日志以及增强的安全控制(例如单点登录与域验证)。
2025 年 6 月 5 日,Anthropic 推出 Claude Gov——为美国国防与情报机构定制的 Claude 版本。该服务放宽了某些防护,以支持涉密级威胁分析、上下文文档理解以及对国家安全工作至关重要的多语言能力。尽管 Claude Gov 通过了标准安全测试,其部署也引发了关于偏见、滥用与透明度的伦理问题——Anthropic 通过一套经校准的政策来应对,在安全例外与更广泛的伤害预防理念之间寻求平衡。
ChatGPT 今年有哪些进展?
语音模式与商务方案更新
ChatGPT 也没有闲着。2025 年 6 月 7 日,OpenAI 为付费 ChatGPT 用户升级了 Advanced Voice Mode,显著提升语调与对话自然度——比以往更像与人类交流。就在上周,OpenAI 宣布商务方案更新,引入连接器以接入内部工具、更强的安全控制、用于审计 AI 交互的“记录模式”,以及更灵活的定价档位——旨在让 ChatGPT 更加适配企业、符合公司 IT 政策。
新模型发布与定价灵活性
| Model | Launch Date | Highlights | Price Notes |
|---|---|---|---|
| o3‑pro | June 10–11, 2025 | 更强推理;替代 o1‑pro | 高端档位 |
| o3 API | April 2025 | 强推理模型 | 输入 $2/M,输出 $8/M;可享折扣 |
| GPT‑4.1 | April 14, 2025 | 1M‑token context;优化编码 | 比 GPT‑4o 便宜约 26% |
| GPT‑4.5 | Feb 27, 2025 | 更拟人;将于 7 月中旬逐步下线 | 价格昂贵 |
| o3‑mini / o4‑mini | April 16, 2025 | 缩小版推理与多模态版本 | 免费/低价档位 |
- 面向开发者:o3 降价让深度推理模型更易获得,并提供更友好的预算档位。
- 面向重度用户:o3‑pro 针对高要求任务提供顶级一致性,但可能更慢。
- 订阅:Plus、Pro 与 API 用户现在可在模型选择器中使用 GPT‑4.1、GPT‑4.1‑Mini、o3‑mini 以及新的 o3‑pro。
- 旧版模型:GPT‑4.5 仍处于预览,但将于 7 月 14 日从 API 下线;尚未从 ChatGPT 网页端下线。
插件生态
ChatGPT 的插件生态已经成熟为定制助手的“GPT 商店”。(OpenAI 于 2024 年初正式推出 GPT 商店。)把 GPT 看作迷你应用:有用于写作、研究、编码、客户支持等的各类 GPT。许多旧插件(如网页搜索或图像工具)已迁移为这些 GPT,功能保持一致。你或你的团队也可以构建并分享私有 GPT,ChatGPT Teams/Enterprise 可进行管理。实务上,这意味着 ChatGPT 现在拥有类似应用商店的专业任务环境(例如客服 GPT、AllTrails 徒步 GPT 等),而 Claude 更依赖其内置能力与 API 工具。
ChatGPT(此处为风格化示意图)现已提供诸如大上下文的 GPT‑4.1(最多 100 万令牌上下文)、丰富的 GPT“应用”生态,以及连接内部工具(Drive、GitHub 等)的连接器等高级功能。付费方案也享有更显著改进、更自然的语音模式。
性能与功能对比
我们将从技术人员关心的核心能力来比较 Claude 与 ChatGPT:
编码与开发:
如果以编码能力为衡量标准,Claude Opus 4 在某些基准(如 SWE‑bench 与 Terminal‑bench)上目前略胜 GPT‑4o 与 GPT‑4.1,这得益于其面向持续问题求解的专用架构(,)。但 ChatGPT 的 GPT‑4o 在编码与 STEM 方面表现稳健,同时原生处理图像、文本与音频输入——若你在设计多模态应用,这很有用。配合 GPT‑4.1 及其 mini 版本,你还能以更低算力成本获得更快响应,适合高吞吐任务或免费档用户。
写作与内容:
两者在写作上都很强。Claude Sonnet 4 以自然、清晰的文风受赞。比如,有测试者发现 Sonnet 4 的散文在写作时比 GPT‑4o 更“自然”。另一方面,ChatGPT 以创造力与多模态见长(因为 GPT‑4o 能混合图像与文本,并可访问 GPT 商店)。如果你要撰写营销帖子、文献综述,或需要多语输出(现已可借助语音翻译),ChatGPT 的能力很强。两者都能胜任技术写作、编辑与摘要,但Claude 往往更擅长结构化、技术性内容(事实偏差更少),而 ChatGPT 则更具多样性与“创意”语调。实践中,很多团队会用 Claude 写详尽报告或代码文档,用 ChatGPT 做头脑风暴或博客风格内容。
**研究与分析:**两者都能获取并分析新信息,但风格不同。Claude(即便是免费版)内置网页搜索与 PDF 支持。Pro 版新增Research 模式,可为长报告缓存上下文与工具。ChatGPT 则使用“Deep Research”模式以及一系列插件(Wolfram Alpha、Bing Search 等)来拉取并引用数据。近期更新加入了连接器,意味着企业版 ChatGPT 能同时搜索你的内部文档与网页。我们的观察是,对于事实密集型分析,两者都能表现稳健:ChatGPT 的优势常在于其通过 Advanced Data Analysis 轻松处理表格/图表,而 Claude 则可依靠其持续推理能力(允许它“思考”很长的推理链)。
用户体验与集成能力
对于自定义工具,Claude 现已支持细粒度工具流,在使用重量级工具时使调用更快(例如流式传输大型代码文件而不受 JSON 验证延迟的影响)。另一方面,ChatGPT 的生态——插件、API 支持、面向开发者工作流的 Sora——成熟时间更长,因此你会发现更广泛的预构建集成社区。就我个人测试而言,我欣赏 Claude 流畅的工具使用;若你当下需要更丰富的插件市场,或许会更偏爱 ChatGPT。
以下是一些关键特性与能力的快速对比表:
| Feature / Capability | Claude AI(Anthropic) | ChatGPT(OpenAI) |
|---|---|---|
| Model Family | Opus 4(性能最高)、Sonnet 4(均衡、快速)、Haiku 3.5(更轻量)。另有面向美国政府的专用 Claude Gov 版本。 | GPT‑4.1 / o3(最高性能模型),另有 GPT‑4.1 mini 与 nano 作为更快/更低价选项。另含 GPT‑3.5(o3)变体。 |
| Context Window | 所有 Claude 4 模型的上下文最高达 200,000 令牌。 | GPT‑4.1(API)最高 1,000,000 令牌,GPT‑4o(较早版本)约 128k。 |
| Long-Term Memory | 支持多聊天记忆(Projects)与自定义“记忆”训练数据。 | Plus/Pro 可选聊天记忆(保存偏好),企业可存储会话模板与用户偏好。 |
| Tool Use (Built-in) | 网页搜索、Claude Code(IDE 与终端集成)、代码执行、文件上传、数学求解器。细粒度工具流(测试版)可加速输出。 | 插件/GPT(网页浏览、代码解释器、Wolfram、Zapier 等),GPT 中的图像生成(DALL·E)。内置 Advanced Data Analysis(代码执行)。 |
| Developer Tools | Claude Code 代理(浏览你的代码库、运行测试、与 GitHub 集成)。API 支持代码执行与自定义工具(MCP)。 | API 包含 Model API 与内置开发者工具(如 Functions API)。无原生“代码助手代理”,但社区工具众多(Copilot 等)。 |
| Enterprise Features | Team/Enterprise 套餐包含 SSO、细粒度权限、SCIM、审计日志、数据驻留(美国/欧盟)、域捕获。套餐提供共享管理员控制与使用上限。 | Team/Enterprise 包含 SAML SSO、SCIM、域验证、分析仪表盘、API 访问控制,以及 SOC/ISO 审计。GPT‑4 使用支持灵活的信用点计费。 |
| Government Offering | Claude Gov:面向涉密使用构建的版本(更佳的国防文档理解,对涉密内容更少拒绝)。 | 无独立政府模型,但 Enterprise 套餐支持 HIPAA、BAA、FedRA |
定价与套餐
成本可能是关键因素。以下是 2025 年中期的高层定价对比:
Claude AI:
Free:$0。你可获得基础版 Claude(Sonnet 4 快速模式)与网页搜索,使用量有限。
**Claude Pro:**年付约 $17/月(按月 $20)。可获得每月显著更多使用量、无限“项目”、新的 Code 集成、Research/网页工具。还解锁“延展思考”和高级模型(Opus 4 与 Sonnet 4)。
**Claude Max:**起价 $100/月/用户。面向重度用户——提供 Pro 的最高 20× 使用量、更高输出上限与优先体验高级功能。
Team:$25 每用户每月(年付,按月 $30),至少 5 名用户。包含 Pro 的全部内容外加集中计费/管理与协作工具。(注意:Team 不包含 Claude Code 访问。)
**Enterprise:**定制定价(联系销售)。新增如域 SSO、审计日志、增强的上下文大小、定制 SLA。
ChatGPT(OpenAI):
| Plan | Price (USD/user/mo) | Key Features |
|---|---|---|
| Free | $0 | 可使用 GPT‑4o mini、有限的 GPT‑4o、GPT‑4.1 mini、基于网页的实时搜索、文件上传、数据分析、图像与语音模式(有使用上限)、桌面应用中的代码编辑,以及自定义 GPT。 |
| Plus | $20 | 更高上限、仅 Plus 可用的 GPT‑4.5/4.1、Projects、抢先功能 |
| Pro | $200 | 无限制访问所有模型(GPT‑4o、高级推理模型 o1/o3 等)、无限 Voice、o1 pro 计算、Sora、Operator、deep‑research |
| Team | $25–$30 | 共享工作区、管理工具、连接器、自定义 GPT |
| Enterprise | ~$60+ | 面向企业的功能、合规、AI 咨询 |
Deep Research 查询:Free 用户每月 5 次“轻量”;Plus 与 Team 每月 25 次(其中 15 次轻量);Pro 订阅者每月 250 次(其中 150 次轻量)。
入门
CometAPI 提供统一的 REST 接口,将数百个 AI 模型(包括 Claude 系列)聚合到一致的端点之下,内置 API 密钥管理、使用配额与计费仪表盘。无需同时应对多个供应商的 URL 与凭证。
开发者可通过 CometAPI 访问 Claude Sonnet 4 API(模型:claude-sonnet-4-20250514;claude-sonnet-4-20250514-thinking)以及 Claude Opus 4 API(模型:claude-opus-4-20250514;claude-opus-4-20250514-thinking)等。开始之前,请在 Playground 探索模型能力,并查阅 API 指南 获取详细说明。访问前请确保已登录 CometAPI 并获得 API 密钥。CometAPI 还新增了 cometapi-sonnet-4-20250514 和 cometapi-sonnet-4-20250514-thinking,专用于 Cursor。
开发者可通过 CometAPI 访问 O3 API(模型名:o3-2025-04-16)与 GPT-4.1 API(gpt-4.1;gpt-4.1-mini; gpt-4.1-nano),上述最新模型列表以本文发表日期为准。开始之前,请在 Playground 探索模型能力,并查阅 API 指南 获取详细说明。访问前请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方的价格,帮助你集成。Cometapi 最新的 chatgpt API 是 o3-Pro API。
总结
Claude 的优势在于深度推理、安全与编码——技术实力强,面向开发者工作流。ChatGPT 的优势在于功能广度、创造力与生态——极其多才、易用。两大平台都在快速迭代。伦理方面,它们面临相同挑战(偏见、幻觉、数据权益),两家公司都表示正以持续研究与合规实践认真应对。
