Claude Opus 4.5:体验如何——要花多少钱?

CometAPI
AnnaNov 23, 2025
Claude Opus 4.5:体验如何——要花多少钱?

Anthropic 的 Claude 系列一直是 2025 年前沿模型竞赛中发展最快的脉络之一。过去几周,多条泄露、社交帖子与调查报道指向即将推出的 Claude Opus 4.5(常缩写为“Opus 4.5”)——在部分消息源的内部引用中称为 Neptune V6——并称该模型已与外部红队成员共享进行越狱测试。公开细节仍然零碎,本文汇总现有报道,解释泄露对能力与安全性的含义,并给出关于可能定价的理性估计,以及 Opus 4.5 与 Google 的 Gemini 3 和 OpenAI 的 GPT-5.1 的对比。

什么是 Claude Opus 4.5?

Claude 4.5 家族的前沿成员

Anthropic 使用 “Opus”“Sonnet”“Haiku” 来表示模型家族与能力层级。Opus 是 Anthropic 在 4.x 世代中最高能力模型的标签(例如 Opus 4.1)。Sonnet 与 Haiku 分别用于中等与较小层级。该命名约定使得 “Claude Opus 4.5” 成为 Claude 4.5 系列中新高端版本的逻辑候选。

“Opus” 是 Anthropic 在 Claude 4 家族中的最高容量、最高能力模型的标签——这些模型定位于最困难的推理、研究与编码任务(Opus 4 与 Opus 4.1 是最可见的在产实例)。Opus 模型的设计是在更高的推理成本与更好的长上下文推理、编码表现以及复杂工作流稳健性之间进行权衡,Anthropic 历来将扩展上下文处理与“更深层思考”模式等特性保留给 Opus 层级。

标识符透露了什么:“Opus 4.5” 与 “Neptune V6”

公开信号流中出现了两条单独的线索:

  • 开发者与社区成员报告在 Claude Code CLI 请求与代码仓库讨论中短暂看到字面模型标识符 “Opus 4.5” 与 “Neptune V6”——这是当内部名称渗入日志或 PR 时常见的早期泄露足迹。
  • 多家媒体与社区帖子称开发/红队实例的内部代号为 Neptune V6;Anthropic 历来使用内部的 Neptune 工作台名称来表示预发布/红队快照。因此,Neptune 名称很可能映射到一个内部测试实例,其外部产品名称将被称为 Claude Opus 4.5。

结论: 公开信号指向 Claude Opus 4.5 是 Claude 4.5 系列中预期的高能力成员,目前处于测试阶段,并(截至最近报道)在积极红队中。该信号集合一致且可信,但并不等同于官方产品发布。

泄露如何出现,其可靠性如何?

可见证据轨迹

当前叙事由三种模式促成:

  1. 在开发工具/拉取请求中出现的模型标识符:观察者注意到在 Claude Code CLI 的拉取请求或内部工具日志中出现 “Claude Opus 4.5”/“Neptune V6” 字符串——这通常是内部模型名称已迁移到可见工作流中的早期指标。一条简短的 X/Twitter 帖子及后续转发将该目击事件推送到更广社区。
  2. Reddit 与社区讨论:以 Claude 为焦点的子版块一直在讨论用户报告的变更、Sonnet/Opus 的可用性与性能中的异常,一些用户声称在其测试环境中瞥见 4.5 变体。社区帖子虽嘈杂,但作为早期信号仍有价值。
  3. Anthropic Shares New AI Model with Red Team Members:AIPRM 的首席工程师 Tibor Blaho 在 X(原 Twitter)发帖称 Anthropic 于周二将 Neptune V6 LLM 发送给红队测试人员。值得注意的是,泄露者还提到这家 AI 公司为外部安全评估者发起了一个为期 10 天的挑战。如果他们在 10 天内找到一个经确认的、通用的越狱方法,将获得额外奖励。

应该有多自信?

宜采取适度谨慎。该证据链是早期模型泄露的经典模式:内部标识符泄露到工具或日志中,社区成员发现它们,记者随后报道。这一模式过去曾先于合法发布——但偶尔也指向不会面向公众发布的内部试验。简言之:日志中出现以 Neptune 为代号的测试与 Opus 4.5 标识符的“存在”是可信的。

Claude Opus 4.5 会是什么样(功能与性能)?

Opus 4.1 已经具备的能力

根据 Anthropic 的公告与产品文档:Opus 4.1 改进了智能体工作流、真实世界编码与稳健的多步推理。它位于 Anthropic 家族的高端,通过 Claude API、Claude Code 以及 AWS Bedrock、Google Vertex AI 等伙伴渠道提供。由于 Opus 类模型面向复杂工程与企业任务,它们配备大型上下文窗口与安全/护栏层。

Sonnet 4.5 带来的改进对假设中的 Opus 4.5 的启示

Sonnet 4.5 在编码能力、智能体工具使用与扩展推理方面推进——这些领域与 Opus 的使命直接重叠。Sonnet 4.5 还在数学与与金融、网络安全相关的领域知识上有所提升;Anthropic 将 Sonnet 4.5 描述为“最佳编码模型”,最适合基于智能体的工作流。这使得合理预期任何即将到来的 Opus 4.5 会借鉴 Sonnet 的架构或训练改进,并在 Opus 的更高能力范畴中加以放大。

推测的 Claude Opus 4.5 功能集(推断)

如果 Opus 4.5 遵循以往 Opus 升级的产品逻辑,我们可以合理期待:

  • 默认更强的多步推理与“扩展思考”:更好的内部思维链条、更长且可靠的链条用于复杂规划与多智能体编排(Sonnet 4.5 已强化的领域)。
  • 更高的编码与软件工程能力:更少的代码臆造、更好的跨文件推理、改进的错误修补与测试生成,以及更长的上下文窗口以覆盖大型代码库——Opus 系列明确面向这些任务。
  • 改进的工具使用与智能体编排:更稳定的工具调用,更好的子任务与异步工作流编排(对 Copilot 式智能体与“办公智能体”集成至关重要)。
  • 企业安全、合规与可解释性功能:更强的护栏、系统卡与 ASL 分类,呼应 Sonnet 4.5 的方法。
  • 多模态升级(可能):在混合工作流中更好的图像/代码/文档理解——尽管 Sonnet 率先发力,Opus 可能进一步推动。

性能预期

测量性能可能会遵循家族更新所见的模式:Opus 4.5 将力图超越 Opus 4.1,并在编码与智能体基准上挑战或匹配 Sonnet 4.5 的成绩——但以更高的每 token 成本,定位于更少但更苛求的用例(企业工程、研究与智能体自动化)。如果 Sonnet 4.5 在编码与推理方面大幅提升,那么 Opus 4.5 的定位将是为关键任务提供“最高”可靠性与最佳的一次性正确率。


Claude Opus 4.5 会花多少钱?

Anthropic 当下的收费(H3)

Anthropic 的公开消费者订阅(Claude Pro)与其 API 定价提供了最佳参考:

  • 消费者/Pro 订阅:Claude Pro 面向个人生产力使用,年付为 $17/月,月付为 $20/月。消费者由此可在 Claude.ai 上获得更高端模型与功能的访问。
  • API/Opus 定价(Opus 4/4.1 的已确认定价):Anthropic 在 2025 年公开文档与多份定价摘要中为 Opus 类 API 设定了大约 $15 / 1M 输入 token 与 $75 / 1M 输出 token。Anthropic 还提供提示缓存与批处理折扣(提示缓存可显著降低重复提示成本;批量处理对大型作业可获得约 ~50% 的降幅)。这些 Opus 费率显著高于 Sonnet/Haiku 层级,体现了 Opus 的高端定位。

对 Opus 4.5 发布的定价估计

如果发布 Opus 4.5,最保守(且最可能)的定价情景是:

不变价(最可能):Anthropic 将 Opus 4.5 置于与 4.1 相同的 Opus 定价档——即约 $15 / $75 每百万 token——并通过缓存/批处理激励逐步改变实际成本。历史上,Opus 4.1 的发布并未提高 Opus 基线定价,因此一次增量改进可能遵循相同模式。

传闻中的 Opus 4.5 如何与 Gemini 3 和 GPT-5.1 对比?

(我比较当前公开的主张与基准:Gemini 3(Google)、GPT-5.1(OpenAI)与 Anthropic 的 Opus 家族。对于 Opus 4.5,我基于 Opus 4.1 与 Sonnet 4.5 的理性外推。)

当下的 Gemini 3 与 GPT-5.1

  • Gemini 3(Google):Google 于 2025 年 11 月公开发布 Gemini 3,将其定位为迄今最强的多模态与推理模型,具备新的智能体功能、强多模态(文本/图像/视频/音频)推理,并在多个基准(LMArena、GPQA、MathArena、MMMU 系列)上取得领先。Google 正在将 Gemini 3 集成到 Gemini 应用、Google Cloud 与开发者工具之中。
  • GPT-5.1(OpenAI):OpenAI 于 2025 年 11 月中发布 GPT-5.1,作为 GPT-5 的升级,包含两个变体:GPT-5.1 Instant(更敏捷、更具对话性)与 GPT-5.1 Thinking(在复杂任务上的持久性更强)。OpenAI 强调对话改进、更“温暖”的输出与更多用户个性化选项;他们将 GPT-5.1 定位为对 GPT-5 的迭代升级。

正面预期

原始推理与基准领导力:公开基准显示 Gemini 3 在多项指标上树立新标杆(LMArena Elo、多模态基准)。GPT-5.1 被定位为更平滑、更具对话性的 GPT-5 迭代,并在复杂任务上表现强劲;Sonnet 4.5 与 Opus 4.1 在编码与智能体任务上仍具竞争力。若 Opus 4.5 落地,其调优目标很可能是超越 Opus 4.1 在编码与可靠性上的表现,但从 Gemini 3 的公开基准主张来看,Google 可能在许多尖端多模态与推理指标上暂时占优。

编码与“使用计算机”:Anthropic 强调 Sonnet 4.5 的编码优势,且 Anthropic 称 Sonnet 在许多测试中是最佳编码模型;Opus 历来聚焦最困难的编码与智能体用例。尽管如此,Google 与 OpenAI 正在大力投入代码工具与智能体平台——Gemini 3 包含 “vibe coding” 与智能体集成,OpenAI 亦持续通过 GPT 家族推进代码能力。

多模态与智能体工作流:Google 的 Gemini 系列历来强调广泛的多模态理解(图像、视频、音频、文本);Gemini 3 在此方面大幅迭代。Anthropic 的 Claude 系列优先工具使用与智能体安全;Sonnet 4.5 提升了智能体能力,但 Opus 4.1/4.5 预计更偏向深度与可靠性,而非多媒体广度。GPT-5.1 尝试兼顾两者,并强调对话性与定制化。

哪一个“胜出”取决于产品目标:多模态创造力与大生态自动化 → Gemini 3;关键任务工程、编码与安全敏感自动化 → Opus/Sonnet;广泛的对话定制化 → GPT-5.1。

最终结论:预期与如何规划

Anthropic 正在快速迭代:Sonnet 4.5 重新平衡了编码与智能体任务的成本与能力,而 Opus 4.1 是当前面向关键任务工程与智能体编排的高端模型。关于 Claude Opus 4.5 的传闻可信且与 Anthropic 的发布节奏一致——但尚未官方确认。一旦/如果 Opus 4.5 发布,预计其在推理、编码可靠性与智能体稳定性上相较 Opus 4.1 将有增量但意义显著的提升;预计定价仍维持 Opus 的高端档(类似输入/输出定价与企业分层),并继续作为面向重输出工作负载的高投入选择。

开发者可通过 CometAPI 访问 Gemini 3 Pro Preview APIClaude Sonnet 4.5 API。开始之前,请在 CometAPIPlayground 探索模型能力,并查阅 API 指南以获取详细说明。访问前,请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的方案,帮助你完成集成。

Ready to Go?→ 立即注册 CometAPI

如果你想了解更多关于 AI 的技巧、指南与新闻,请在 VKXDiscord 上关注我们!

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣