Claude Mythos（Opus 5）泄露：发生了什么以及可以期待什么

截至 2026 年 3 月 29 日，“Claude Mythos”的故事与其说是一次完成的公开发布，不如说更像是一段看起来是 Anthropic 下一大步的泄露预览。该公司意外地在一个可公开搜索的数据缓存中暴露了博客草稿内容，揭示了一款尚未发布的模型，Anthropic 将其描述为一次“重大跃升”和“迄今为止我们构建的最强模型”。Anthropic 已确认正与一小部分早期访问客户共同开发并测试该模型。

这之所以重要，是因为 Anthropic 当前公开的模型阵容仍以 Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Haiku 4.5 为中心。换言之，此次泄露并非确认的公开产品发布，而是对 Anthropic 可能在筹备的下一层级的一瞥。

目前，CometAPI 已经提供前沿 Claude 模型的 API，例如 Claude Opus 4.6 和 Claude Sonnet 4.6。一旦 Claude Mythos 在 CometAPI 上线，你就可以与来自 Gemini 和 OpenAI 的顶级模型进行对比测试。CometAPI 聚合了最优秀的模型。

什么是 Claude Mythos?

Claude Mythos 是 Anthropic 迄今为止最先进的 AI 模型，泄露的内部文档将其描述为“迄今为止我们开发过的最强大的 AI 模型”。它引入了一个新的性能层级——内部称为“Capybara”——位于该公司现有的 Opus 系列之上，而 Opus 迄今一直代表着 Claude 能力的顶点。

Anthropic 现有模型家族遵循清晰的分层：

Opus：体量最大、能力最强、成本最高（例如，Claude Opus 4.6 以及更早在 2025 年 11 月发布的 Opus 4.5）。
Sonnet：速度与智能的平衡。
Haiku：最快且最具性价比，适合轻量任务。

Mythos/Capybara 打破了这一模式，作为体量显著更大、计算更密集的模型。博客草稿明确表示它“比我们的 Opus 模型更大、更智能——而 Opus 迄今为止是我们最强的”。命名“Mythos”的意图在于唤起“连接知识与思想的深层联结组织”，意味着跨领域更深层次、更一体化的推理能力。

这并非一次小幅的渐进式更新。Anthropic 的发言人确认公司正在“开发一款在推理、编码和网络安全方面有实质性进步的通用模型”，并认为它是“一次重大跃升，也是我们迄今为止能力最强的模型”。训练已完成，该模型已在一小组早期访问客户中进行真实环境测试。

作为背景，Claude 的进化非常迅速。Claude 3 Opus（2024 年）率先树立基准，其后是 Claude 3.5 Sonnet、Claude 4 变体，以及 2025 年的 Opus 4.5/4.6。Mythos 似乎是顺理成章的继任者——社区推测其为“Opus 5”——将前沿 AI 推向新领域，同时也引发严肃的安全问题。

Claude Mythos 如何泄露？

泄露发生在 2026 年 3 月 27 日前后，原因是一处直白但令人尴尬的 CMS（内容管理系统）人为配置错误。近 3,000 个未发布资产——包括博客草稿、图片、PDF、音频文件，甚至内部文档——被留在一个可公开搜索的数据存储中（有时称为“数据湖”）。

资产默认设置为“public”，且 URL 可被猜测。安全研究人员 Roy Paz（LayerX Security）和 Alexandre Pauwels（剑桥大学）发现了该缓存并通知了媒体。

泄露材料包括：

两篇近乎相同的博客草稿（一个以“Claude Mythos”为题，另一个为“Claude Capybara”）。
包含标题与计划发布日期的结构化网页数据。
过去发布活动中未使用的营销资产。
一份关于由 Anthropic CEO Dario Amodei 主持、仅限受邀参加的 CEO 闭门静修活动的内部 PDF。

Anthropic 很快将事件确认为 CMS 配置中的“人为错误”，并移除了公共访问权限。没有证据显示存在恶意意图或模型权重泄露——仅有营销与规划文档被曝光。

此事件凸显了 AI 行业中日益突出的一个脆弱点：快速迭代与内部文档产出往往快于安全的发布流程。其他实验室也发生过类似泄漏，但这一次对一款尚未发布的旗舰模型提供了不同寻常的翔实洞见。

泄露的基准分数与性能声明

泄露草稿未披露精确数值分数——Anthropic 尚未发布官方基准。然而，两版草稿的措辞明确且一致：

“相比我们此前最好的模型 Claude Opus 4.6，Capybara 在软件编码、学术推理和网络安全等测试上取得了显著更高的分数。”

草稿进一步描述该模型“目前在网络能力方面远超任何其他 AI 模型”，并“预示着新一波模型将以远高于防御者的速度利用漏洞”。

这些基准类别实际测量什么？

软件编码（例如，SWE-Bench Verified、HumanEval、LiveCodeBench）：真实世界的软件工程任务，包括修复 bug、实现新特性以及仓库级理解。Opus 4.6 已在许多编码排行榜中领先；若此处出现“显著”飞跃，意味着 Mythos 能自主处理当前需要高级工程师参与的复杂多文件代码库。
学术推理（例如，GPQA、MMLU-Pro、MATH、FrontierMath）：研究生层面的科学、数学与多步逻辑问题。此处的提升意味着更强的链式推理与知识综合能力。
网络安全：漏洞发现、利用生成、红队模拟与防御加固。这是最被强调、也最令人担忧的领域。

虽然此前的 Claude 模型（Opus 4.5/4.6）已取得优异成绩——例如，Opus 4.5 在 SWE-Bench Verified 上得分约为 ~80.9%——但泄露中的表述将 Mythos 定位在质变的另一个级别。

模型特性与技术概况

除基准之外，草稿还揭示了若干定义性特征：

规模与成本：“为我们提供服务成本非常高，对于客户来说也会非常昂贵。”这暗示巨大的参数规模与高推理成本，初期可用性将局限于企业与高价值用例。
推理深度：强调知识领域之间的“深层联结组织”，意味着更强的长上下文理解与跨域综合。
代理性能力：早期访问似乎面向需要高级编码代理与网络安全工具的组织。
安全优先理念：与 Anthropic 的“宪法式 AI”方法一致，公司在更广泛发布前优先进行风险评估，尤其是网络安全方面。

网络安全影响：最大的警示信号

泄露中最引人注目的是公司对该模型双重用途潜力的自我警示。由于其在网络能力上“遥遥领先”，Mythos 可能：

自主发现零日漏洞。
大规模生成复杂的利用代码。
以快于人类防御者响应的速度模拟高级持续性威胁（APT）。

草稿明确表示，公司希望“更加谨慎行事”，并与网络防御方分享发现，以为“即将到来的 AI 驱动利用浪潮”做好准备。

市场反应立竿见影：2026 年 3 月 27–28 日，网络安全板块股价大幅下跌，投资者将风险定价为进攻性 AI 能力可能快于防御工具的发展。

这与更广泛的行业趋势一致。OpenAI 同样在诸如 GPT-5.3-Codex 等模型中标注了较高的网络能力。现实事件已显示国家行为体（例如，一个中国组织）利用 Claude 变体实施渗透行动。Mythos 将进一步放大此类威胁。

积极的一面：向防御型组织开放早期访问，可能加速安全编码实践、自动化补丁与威胁狩猎，从长远看有望让互联网更安全。

对比表：Claude Mythos 与以往模型

Aspect	Claude Opus 4.6 (Current Flagship)	Claude Mythos / Capybara (Leaked)	Key Takeaway
Tier	Opus	新的“Capybara”层（高于 Opus）	架构上的重大跃迁
Coding Performance	强（例如，~80.9% SWE-Bench）	大幅更高	有望媲美或超越高级工程师的生产力
Academic Reasoning	出色	大幅更高	更深的多步逻辑与知识整合
Cybersecurity	具备能力（漏洞检测）	领先于任何当前模型	质变式飞跃；带来双重用途风险
Inference Cost	高（按 Opus 定价）	非常昂贵（更高）	初期仅面向企业
Release Status	普遍可用	仅早期访问测试	审慎、以安全为中心的发布
Overall Capability	2025 年的最先进水平	“重大跃升”/“迄今最强”	新的前沿基准

结论：窥见下一代 AI 时代的一角

Claude Mythos 的泄露为我们难得地、未加修饰地呈现了 Anthropic 的路线图。它证实公司在核心能力方面实现了真正的“重大跃升”，同时也承认随之而来的深刻风险——尤其是在网络安全方面。无论最终被冠以 Opus 5 还是新的 Capybara 层，Mythos 都在昭示：前沿 AI 正步入一个能力超越安全部署节奏的阶段。

准备体验 CometAPI？你可以先成为我们的用户，获得免费 $1 额度，并在 Claude Mythos 上线时收到通知。

什么是 Claude Mythos?

Claude Mythos 如何泄露？

泄露的基准分数与性能声明

这些基准类别实际测量什么？

模型特性与技术概况

网络安全影响：最大的警示信号

对比表：Claude Mythos 与以往模型

结论：窥见下一代 AI 时代的一角

以低成本获取顶级模型

阅读更多

Claude Mythos（Opus 5）泄露：发生了什么以及可以期待什么

什么是 Claude Mythos?

Claude Mythos 如何泄露？

泄露的基准分数与性能声明

这些基准类别实际测量什么？

模型特性与技术概况

网络安全影响：最大的警示信号

对比表：Claude Mythos 与以往模型

结论：窥见下一代 AI 时代的一角

以低成本 获取顶级模型

阅读更多

以低成本获取顶级模型