Claude Mythos(Opus 5)泄露:发生了什么以及可以期待什么

CometAPI
AnnaMar 29, 2026
Claude Mythos(Opus 5)泄露:发生了什么以及可以期待什么

截至 2026 年 3 月 29 日,“Claude Mythos”的故事与其说是一次完成的公开发布,不如说更像是一段看起来是 Anthropic 下一大步的泄露预览。该公司意外地在一个可公开搜索的数据缓存中暴露了博客草稿内容,揭示了一款尚未发布的模型,Anthropic 将其描述为一次“重大跃升”和“迄今为止我们构建的最强模型”。Anthropic 已确认正与一小部分早期访问客户共同开发并测试该模型。

这之所以重要,是因为 Anthropic 当前公开的模型阵容仍以 Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Haiku 4.5 为中心。换言之,此次泄露并非确认的公开产品发布,而是对 Anthropic 可能在筹备的下一层级的一瞥。

目前,CometAPI 已经提供前沿 Claude 模型的 API,例如 Claude Opus 4.6Claude Sonnet 4.6。一旦 Claude Mythos 在 CometAPI 上线,你就可以与来自 Gemini 和 OpenAI 的顶级模型进行对比测试。CometAPI 聚合了最优秀的模型。

什么是 Claude Mythos?

Claude Mythos 是 Anthropic 迄今为止最先进的 AI 模型,泄露的内部文档将其描述为“迄今为止我们开发过的最强大的 AI 模型”。它引入了一个新的性能层级——内部称为“Capybara”——位于该公司现有的 Opus 系列之上,而 Opus 迄今一直代表着 Claude 能力的顶点。

Anthropic 现有模型家族遵循清晰的分层:

  • Opus:体量最大、能力最强、成本最高(例如,Claude Opus 4.6 以及更早在 2025 年 11 月发布的 Opus 4.5)。
  • Sonnet:速度与智能的平衡。
  • Haiku:最快且最具性价比,适合轻量任务。

Mythos/Capybara 打破了这一模式,作为体量显著更大、计算更密集的模型。博客草稿明确表示它“比我们的 Opus 模型更大、更智能——而 Opus 迄今为止是我们最强的”。命名“Mythos”的意图在于唤起“连接知识与思想的深层联结组织”,意味着跨领域更深层次、更一体化的推理能力。

这并非一次小幅的渐进式更新。Anthropic 的发言人确认公司正在“开发一款在推理、编码和网络安全方面有实质性进步的通用模型”,并认为它是“一次重大跃升,也是我们迄今为止能力最强的模型”。训练已完成,该模型已在一小组早期访问客户中进行真实环境测试。

作为背景,Claude 的进化非常迅速。Claude 3 Opus(2024 年)率先树立基准,其后是 Claude 3.5 Sonnet、Claude 4 变体,以及 2025 年的 Opus 4.5/4.6。Mythos 似乎是顺理成章的继任者——社区推测其为“Opus 5”——将前沿 AI 推向新领域,同时也引发严肃的安全问题。

Claude Mythos 如何泄露?

泄露发生在 2026 年 3 月 27 日前后,原因是一处直白但令人尴尬的 CMS(内容管理系统)人为配置错误。近 3,000 个未发布资产——包括博客草稿、图片、PDF、音频文件,甚至内部文档——被留在一个可公开搜索的数据存储中(有时称为“数据湖”)。

资产默认设置为“public”,且 URL 可被猜测。安全研究人员 Roy Paz(LayerX Security)和 Alexandre Pauwels(剑桥大学)发现了该缓存并通知了媒体。

泄露材料包括:

  • 两篇近乎相同的博客草稿(一个以“Claude Mythos”为题,另一个为“Claude Capybara”)。
  • 包含标题与计划发布日期的结构化网页数据。
  • 过去发布活动中未使用的营销资产。
  • 一份关于由 Anthropic CEO Dario Amodei 主持、仅限受邀参加的 CEO 闭门静修活动的内部 PDF。

Anthropic 很快将事件确认为 CMS 配置中的“人为错误”,并移除了公共访问权限。没有证据显示存在恶意意图或模型权重泄露——仅有营销与规划文档被曝光。

此事件凸显了 AI 行业中日益突出的一个脆弱点:快速迭代与内部文档产出往往快于安全的发布流程。其他实验室也发生过类似泄漏,但这一次对一款尚未发布的旗舰模型提供了不同寻常的翔实洞见。

泄露的基准分数与性能声明

泄露草稿未披露精确数值分数——Anthropic 尚未发布官方基准。然而,两版草稿的措辞明确且一致:

“相比我们此前最好的模型 Claude Opus 4.6,Capybara 在软件编码、学术推理和网络安全等测试上取得了显著更高的分数。”

草稿进一步描述该模型“目前在网络能力方面远超任何其他 AI 模型”,并“预示着新一波模型将以远高于防御者的速度利用漏洞”。

这些基准类别实际测量什么?

  • 软件编码(例如,SWE-Bench Verified、HumanEval、LiveCodeBench):真实世界的软件工程任务,包括修复 bug、实现新特性以及仓库级理解。Opus 4.6 已在许多编码排行榜中领先;若此处出现“显著”飞跃,意味着 Mythos 能自主处理当前需要高级工程师参与的复杂多文件代码库。
  • 学术推理(例如,GPQA、MMLU-Pro、MATH、FrontierMath):研究生层面的科学、数学与多步逻辑问题。此处的提升意味着更强的链式推理与知识综合能力。
  • 网络安全:漏洞发现、利用生成、红队模拟与防御加固。这是最被强调、也最令人担忧的领域。

虽然此前的 Claude 模型(Opus 4.5/4.6)已取得优异成绩——例如,Opus 4.5 在 SWE-Bench Verified 上得分约为 ~80.9%——但泄露中的表述将 Mythos 定位在质变的另一个级别。

模型特性与技术概况

除基准之外,草稿还揭示了若干定义性特征:

  • 规模与成本:“为我们提供服务成本非常高,对于客户来说也会非常昂贵。”这暗示巨大的参数规模与高推理成本,初期可用性将局限于企业与高价值用例。
  • 推理深度:强调知识领域之间的“深层联结组织”,意味着更强的长上下文理解与跨域综合。
  • 代理性能力:早期访问似乎面向需要高级编码代理与网络安全工具的组织。
  • 安全优先理念:与 Anthropic 的“宪法式 AI”方法一致,公司在更广泛发布前优先进行风险评估,尤其是网络安全方面。

网络安全影响:最大的警示信号

泄露中最引人注目的是公司对该模型双重用途潜力的自我警示。由于其在网络能力上“遥遥领先”,Mythos 可能:

  • 自主发现零日漏洞。
  • 大规模生成复杂的利用代码。
  • 以快于人类防御者响应的速度模拟高级持续性威胁(APT)。

草稿明确表示,公司希望“更加谨慎行事”,并与网络防御方分享发现,以为“即将到来的 AI 驱动利用浪潮”做好准备。

市场反应立竿见影:2026 年 3 月 27–28 日,网络安全板块股价大幅下跌,投资者将风险定价为进攻性 AI 能力可能快于防御工具的发展。

这与更广泛的行业趋势一致。OpenAI 同样在诸如 GPT-5.3-Codex 等模型中标注了较高的网络能力。现实事件已显示国家行为体(例如,一个中国组织)利用 Claude 变体实施渗透行动。Mythos 将进一步放大此类威胁。

积极的一面:向防御型组织开放早期访问,可能加速安全编码实践、自动化补丁与威胁狩猎,从长远看有望让互联网更安全。

对比表:Claude Mythos 与以往模型

AspectClaude Opus 4.6 (Current Flagship)Claude Mythos / Capybara (Leaked)Key Takeaway
TierOpus新的“Capybara”层(高于 Opus)架构上的重大跃迁
Coding Performance强(例如,~80.9% SWE-Bench)大幅更高有望媲美或超越高级工程师的生产力
Academic Reasoning出色大幅更高更深的多步逻辑与知识整合
Cybersecurity具备能力(漏洞检测)领先于任何当前模型质变式飞跃;带来双重用途风险
Inference Cost高(按 Opus 定价)非常昂贵(更高)初期仅面向企业
Release Status普遍可用仅早期访问测试审慎、以安全为中心的发布
Overall Capability2025 年的最先进水平“重大跃升”/“迄今最强”新的前沿基准

结论:窥见下一代 AI 时代的一角

Claude Mythos 的泄露为我们难得地、未加修饰地呈现了 Anthropic 的路线图。它证实公司在核心能力方面实现了真正的“重大跃升”,同时也承认随之而来的深刻风险——尤其是在网络安全方面。无论最终被冠以 Opus 5 还是新的 Capybara 层,Mythos 都在昭示:前沿 AI 正步入一个能力超越安全部署节奏的阶段。

准备体验 CometAPI?你可以先成为我们的用户,获得免费 $1 额度,并在 Claude Mythos 上线时收到通知。

以低成本 获取顶级模型

阅读更多