Claude Mythos Preview 是 Anthropic 最新且最强大的前沿 AI 模型,相较于此前的 Claude 模型(如 Opus 4.6)实现了显著飞跃。它于 2026 年 4 月 7 日作为 Project Glasswing 的一部分发布,是一个通用型语言模型,在智能体式编码、复杂推理,尤其是网络安全任务方面展现出前所未有的优势。与此前通过 API 或聊天界面向公众开放的 Claude 版本不同,Mythos Preview 仍处于严格门控的研究预览阶段。由于其具备以自主方式发现并串联高危漏洞(包括主流操作系统、网页浏览器和基础软件中的零日)的非凡能力,它并未面向大众开放使用。
对于通过 Claude API 的普通用户,我推荐使用 CometAPI。它聚合了来自不同领域的最强模型,包括 Claude 4.6 系列,并采用按量付费模式,API 价格显著低于官方定价。
在这篇全面的指南中,我们将详细拆解 Claude Mythos Preview 是什么、它在编程、推理、安全和 AI 研发方面如何主导各类基准评测、它如何通过链式攻击识别并利用漏洞、目前谁可以访问、合作伙伴的实际用例,以及普通用户未来可能(或不可能)期待的内容。
What Is Claude Mythos Preview?
Claude Mythos Preview 是迄今为止 Anthropic 最先进的 AI 模型——一个全新的“Mythos”级别,位于其产品线中现有的 Opus 层级之上。它建立在 Claude 家族的“宪法式 AI”原则之上,但在能力上实现了质的“台阶式跃迁”,尤其体现在自主智能体行为方面。它在内部开发阶段曾被引用(早期泄露中提到“Capybara”),擅长需要深度代码理解、多步推理与自主工具使用的长周期任务。
关键差异点包括:
- Agentic autonomy(智能体式自主性):可在隔离环境中运行,假设潜在缺陷、执行测试、调试,并在最少的人类引导下输出完整的概念验证(PoC)利用程序。
- 规模与效率:可处理海量代码库、超长上下文(通过压缩可达数百万 tokens),并执行远超以往模型的复杂推理链。
- 网络安全专长(涌现,而非专门微调):在更强的编码与推理能力的下游效果上,已在所有主流操作系统与浏览器中识别出数以千计的高危漏洞。
Anthropic 将其描述为“我们迄今发布的最具网络安全能力的模型”,几乎在所有内部与已知外部评估中达到饱和。它的定位不是消费者聊天机器人,而是在 AI 时代用于软件安全变革的工具。
Why Isn’t Claude Mythos Preview Publicly Released?
Anthropic 做出了不将 Claude Mythos Preview 面向大众开放的审慎决定。主要原因在于:如果落入不当之手,其能力会带来不可接受的进攻性网络安全风险。该模型可以以自主方式发现零日漏洞,并以惊人的速度与规模开发复杂的链式利用,将传统从“发现到利用”的窗口期从数月(甚至数年)压缩至数分钟或数小时。
Anthropic 表示:“Claude Mythos Preview 能力的大幅提升使我们决定不将其广泛开放。相反,我们将它作为防御性网络安全项目的一部分,与一小部分合作伙伴共同使用。”
具体风险包括:
- 非专业人员也可能在一夜之间生成可用的利用程序。
- 对安全姿态薄弱的小型企业网络发动端到端的自主攻击。
- 被不良行为者获取并扩散,放大网络犯罪成本(全球已估计为每年约 ~$500 billion)。
与其广泛发布,Anthropic 启动了 Project Glasswing——与大型科技公司、网络安全企业和开源维护者协作的防御性倡议。目标是在漏洞被广泛利用之前,先为防御者争取修复时间。Anthropic 承诺提供价值 $100 million 的使用额度以及 $4 million 的开源安全捐赠。
这是 Anthropic 首次完全不向公众开放其前沿模型,凸显了这次能力跃迁的严肃性。
Claude Mythos Preview Benchmark Data Overview
Claude Mythos Preview 在多个基准中呈现出相较于 Claude Opus 4.6(以及 GPT-5.4 Pro、Gemini 3.1 Pro 等竞争者)持续且往往显著的提升。以下是从 Anthropic 的系统卡片与 Project Glasswing 公告中提取的关键基准。所有分数均使用标准化评测框架,在适用情况下应用了记忆过滤。
Programming & Coding Skills
Mythos Preview 在需要真实世界代码编辑、调试与智能体式工作流的软件工程任务中创下新纪录。
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 | Improvement | Notes |
|---|---|---|---|---|
| SWE-bench Verified | 93.9% | 80.8% | +13.1% | 500 problems; memorization-filtered |
| SWE-bench Pro | 77.8% | 53.4% | +24.4% | 731 problems |
| SWE-bench Multilingual | 87.3% | 77.8% | +9.5% | 297 problems |
| SWE-bench Multimodal | 59.0% | 27.1% | +31.9% | Internal harness |
| Terminal-Bench 2.0 | 82.0% (92.1% extended) | 65.4% | +16.6% | Agentic terminal tasks |
Claude Mythos Preview 在编码基准上表现卓越:
- **SWE-bench Pro:**77.8%(对比 Opus 4.6 的 53.4%)
- **SWE-bench Verified:**93.9%(对比 80.8%)
- **Terminal-Bench 2.0:**82.0%(对比 65.4%)
这些基准评估真实世界的工程任务,例如调试、打补丁和仓库级推理。
结果表明,Mythos Preview 不仅在“生成代码”——它正在以软件工程师的方式运行。
Reasoning & Mathematical Skills
在研究生水平与竞赛级问题上取得大幅进步。
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 | Improvement | Notes |
|---|---|---|---|---|
| USAMO 2026 | 97.6% | 42.3% | +55.3% | Proof-based; 6 problems |
| Humanity’s Last Exam (HLE, no tools) | 56.8% | 40.0% | +16.8% | 2,500 questions |
| HLE (with tools) | 64.7% | 53.1% | +11.6% | Web/code tools |
| GPQA Diamond | 94.6% | 91.3% | +3.3% | Graduate-level science |
| GraphWalks BFS (long context) | 80.0% | 38.7% | +41.3% | 256K–1M tokens |
在推理基准中:
- **GPQA Diamond:**94.6%
- **Humanity’s Last Exam(使用工具):**64.7%
这些分数表明它在复杂、多步推理任务上表现强劲,尤其是在引入外部工具时。
Cybersecurity & Security Skills
这是最突出的类别。Mythos Preview 在既有测试中接近饱和,并在真实漏洞复现与利用上表现出色。
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 | Improvement | Notes |
|---|---|---|---|---|
| CyberGym | 83.1% (0.83 pass@1) | 66.6% (0.67) | +16.5% | 1,507 targeted vuln tasks |
| Cybench | 100% pass@1 | Lower (not specified) | — | 35 challenges |
| Firefox 147 Exploitation | Dramatically higher (reliable PoCs) | 2/several hundred attempts | Qualitative leap | Proof-of-concept from crashes |
安全是最重要的基准类别:
- **CyberGym:**83.1%(对比 Opus 4.6 的 66.6%)
这反映了模型的能力:
- 识别漏洞
- 理解利用机理
- 复现真实世界攻击场景
这正是该模型被视为高风险的关键原因。
AI 研发能力
Mythos Preview 显著加速研究任务(例如内核优化上实现 399.42× 的加速,对比 Opus 4.6 的 190×)。它在多模态智能体基准中也领先,如 OSWorld(79.6% 对比 72.7%)与 BrowseComp(86.9%,同时减少 4.9× 的 token 使用)。
这些数据印证了 Mythos Preview 是 Anthropic 所称的前沿 AI 历史上最明确的一次“跃迁”。
How Claude Mythos Preview Works: Finding Vulnerabilities and Executing Chain Attacks
Mythos Preview 的网络安全实力源自其智能体式编码循环,而非专项训练。典型工作流程为:
- 在隔离容器中启动并载入目标源代码。
- 基于代码审查假设潜在缺陷。
- 使用工具执行、调试并迭代。
- 输出排序的漏洞报告与可工作的 PoC 利用程序。
真实案例:
- 27 年历史的 OpenBSD TCP SACK DoS(1998 RFC):竞争条件 + 有符号整数溢出导致 NULL 指针写入。约运行 ~1,000 次后发现(约 $50 计算成本)。
- 16 年历史的 FFmpeg H.264 越界写(2003):在 500 万次模糊测试与人工审查中幸存。
- Linux 内核权限提升:将 2–4 个漏洞(越界、UAF 等)串联 → 绕过 KASLR → 读取内核结构体 → 堆喷射 → 获取 root。
- 网页浏览器沙箱逃逸:利用 JIT 堆喷射,将读/写原语串联以逃逸渲染器与操作系统沙箱。
- FreeBSD NFS RCE:17 年历史的栈溢出 → 跨 RPC 数据包拆分的 20 段 ROP 链 → 无需认证远程 root。
它在 N-day 利用(仅给出 CVE 与 git 提交哈希)与黑盒二进制测试中同样表现优异。合作伙伴反馈其在私有网络攻防演练中完成了端到端任务——此前人类专家预计需 10+ 小时。
通过使用工具可以跟踪模型内部与“作弊”“奖励黑客”“痛苦”等概念相对应的神经特征是否被激活,并且还能将内部状态翻译成人类语言,类似一台读心机。量化数据显示,在 7.6% 的回合中,模型会在内部识别到自己正在被评估。大多数时候,它选择不表达这一点。
系统卡片中的原话是:“Claude Mythos Preview is the best-aligned of any model that we have trained to date by essentially all available measures.” 以及 “when it does perform misaligned actions on rare occasions, these can be very concerning.”
Use Cases for Claude Mythos Preview
合作伙伴正在将 Mythos Preview 用于:
- 主动漏洞扫描:面向自家与开源代码库。
- 黑盒二进制分析与终端加固。
- 渗透测试与红队模拟。
- 加速关键基础设施补丁开发(操作系统内核、浏览器、加密库等)。
- 日常规模分析(如 AWS 评估 400 trillion 网络流量)。
开源维护者因此获得工具来修复那些在传统测试中存活多年的缺陷。净效应是:披露到修复的周期更短,生产系统中的可利用缺陷更少。
Who Can Access Claude Mythos Preview Now?
访问权限严格限于 Project Glasswing 的参与方:
- 首发合作伙伴:Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks。
- 其他组织:约 40 家负责关键软件与开源基础设施的机构。
- 平台:Claude API、Amazon Bedrock(US East)、Google Cloud Vertex AI、Microsoft Foundry。
- 定价:前期提供价值 $100M 的免费使用额度;之后输入每百万 tokens $25 / 输出每百万 tokens $125。
- 开源路径:维护者可通过 Claude for Open Source 计划申请。
安全专业人士之后可申请加入 Cyber Verification Program。普通公众与一般用户在发布时无法访问。
What Can Ordinary Users Use It For?
目前,没有——Claude Mythos Preview 对个人用户、开发者或受限计划之外的企业不可用。Anthropic 计划将其能力的更安全“衍生”纳入未来公共版 Claude 模型(如下一代 Opus),并配备更强的防护措施。当前,普通用户继续使用 Claude 4 系列模型进行编码、推理与通用任务,而业界在防御性场景中利用 Mythos Preview。Claude Opus 4.6 是当前面向广泛可用的智能体与编码最智能的模型,Claude Sonnet 4.6 则在速度与智能间提供最佳平衡。
对于日常工作而言,Mythos Preview 更像是指示 Claude 能力走向的信号,而非多数人可以直接尝试的工具。对普通用户来说,可操作的应用仍是熟悉的方向:通过公共 Claude 产品进行编码协助、推理支持、研究辅助、文档分析与工作流自动化。不同之处在于,Mythos Preview 展示了当 Anthropic 允许其在受限、聚焦安全的环境中运行时,这一模型家族能走多远。
Claude Opus 4.6 and Sonnet 4.6 APIs 在 CometAPI 上可享 8 折优惠。
Comparison table: Claude Mythos Preview vs. Opus 4.6
| Benchmark / capability | Claude Mythos Preview | Claude Opus 4.6 | Why it matters |
|---|---|---|---|
| SWE-bench Pro | 77.8% | 53.4% | 更强的智能体式编码 |
| Terminal-Bench 2.0 | 82.0% | 65.4% | 更佳的终端与工具执行能力 |
| SWE-bench Multimodal | 59.0% | 27.1% | 更好地处理文本/代码/图像混合流程 |
| SWE-bench Multilingual | 87.3% | 77.8% | 更强的跨语言编码能力 |
| SWE-bench Verified | 93.9% | 80.8% | 更强的软件修复能力 |
| GPQA Diamond | 94.6% | 91.3% | 推理略胜一筹 |
| Humanity’s Last Exam, no tools | 56.8% | 40.0% | 在受限条件下更强的高难度推理 |
| Humanity’s Last Exam, with tools | 64.7% | 53.1% | 更强的工具增强推理 |
| BrowseComp | 86.9% | 83.7% | 更强的智能体式搜索 |
| OSWorld-Verified | 79.6% | 72.7% | 更强的计算机使用任务能力 |
| CyberGym | 83.1% | 66.6% | 更强的安全漏洞复现能力 |
| OSS-Fuzz-style testing | 10 tier-5 hijacks | 1 tier-3 result in the cited comparison | 利用能力跃迁更大 |
Conclusion
Claude Mythos Preview 不只是又一个渐进式模型——它在网络安全上重新定义了 AI 能做到什么,同时也提出了关于安全部署的深刻问题。通过将其门控并将能力注入 Project Glasswing,Anthropic 采取了原则性立场:最强大的工具应首先用于保护我们赖以运行的系统。目前,Mythos Preview 属于经过审查的一小群防御者;对其他人而言,它是下一阶段 AI 能力的预览。
你可以在 CometAPI 上使用 Claude API 为 Claude Mythos 的到来做好准备。准备好了吗?
