截至 2026 年 3 月 29 日,有關「Claude Mythos」的故事與其說是已完成的公開發佈,不如說是一次外洩的搶先預覽,顯示出 Anthropic 的下一個重大步伐。該公司不慎在可公開搜尋的資料快取中暴露了部落格草稿內容,揭示了一個尚未發佈的模型,Anthropic 將其描述為一次「階段性飛躍」以及「我們迄今打造的最強大模型」。Anthropic 證實正與一小群早期存取客戶開發並測試該模型。
這點之所以重要,是因為 Anthropic 目前對外的模型陣容仍以 Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Haiku 4.5 為核心。換言之,這次外洩並非已確認的公開產品發佈,而是偷跑的下一級別預覽,顯示 Anthropic 可能正在準備的產品線。
目前,CometAPI 已經提供尖端 Claude 模型的 API,例如 Claude Opus 4.6 與 Claude Sonnet 4.6。一旦 Claude Mythos 在 CometAPI 上線,您可以與 Gemini 和 OpenAI 的頂級模型進行對比測試。CometAPI 聚合了最優秀的模型。
What Is Claude Mythos?
Claude Mythos 是迄今為止 Anthropic 最先進的 AI 模型,在外洩的內部文件中被描述為「遠遠是我們迄今開發過最強大的 AI 模型」。它引入了一個新的效能層級——內部稱為「Capybara」——位於公司既有 Opus 系列之上,而 Opus 一直被視為 Claude 能力的巔峰。
Anthropic 目前的模型家族有明確的層級:
- Opus:最大、最強、也最昂貴(例如,Claude Opus 4.6,以及於 2025 年 11 月發佈較早的 Opus 4.5)。
- Sonnet:在速度與智能之間取得平衡。
- Haiku:速度最快、對輕量任務而言最具成本效益。
Mythos/Capybara 打破了這個模式,作為一個顯著更大、計算量更高的模型。部落格草稿明確表示,它「比我們的 Opus 模型更大、更智能——而 Opus 迄今為止是我們最強大的」。選用「Mythos」這個名稱,意在喚起「連結知識與想法之間的深層結締組織」,象徵跨領域更深、更整合的推理。
這不是一次小幅的漸進更新。Anthropic 的發言人證實,公司正在「開發一個在推理、編程和網路安全方面有重大進展的通用模型」,並將其視為「一次階段性飛躍,且是我們迄今打造的最強大模型」。訓練已完成,該模型已在一小群早期存取客戶中進行真實世界測試。
作為背景,Claude 的演進極為迅速。Claude 3 Opus(2024)樹立了早期基準,之後是 Claude 3.5 Sonnet、Claude 4 系列與 2025 年的 Opus 4.5/4.6。Mythos 看似是合乎邏輯的接班者——可能就是社群揣測的「Opus 5」——將前沿 AI 推進到新的領域,同時也帶來嚴肅的安全問題。
How Was Claude Mythos Leaked?
這次外洩發生在 2026 年 3 月 27 日前後,起因是 Anthropic 的內容管理系統(CMS)出現簡單但尷尬的人為錯誤設定。將近 3,000 個未發佈的資產——包括部落格草稿、圖片、PDF、音訊檔,甚至內部文件——被置於一個可公開搜尋的資料儲存庫(有時稱為「資料湖」)中。
資產預設為「public」,且 URL 可被猜測。資安研究人員 Roy Paz(LayerX Security)與 Alexandre Pauwels(University of Cambridge)發現了這個快取並通知媒體。
外洩資料包括:
- 兩篇幾乎相同的部落格草稿(一篇以「Claude Mythos」為標題,另一篇為「Claude Capybara」)。
- 具結構的網頁資料,包含標題與計畫的發佈日期。
- 過去發佈中未使用的行銷素材。
- 一份關於僅限受邀的 CEO 研討會的內部 PDF,該活動由 Anthropic CEO Dario Amodei 主持。
Anthropic 很快將事件確認為 CMS 設定中的「人為錯誤」,並移除了公開存取。沒有證據顯示惡意意圖或模型權重外洩——僅有行銷與規劃文件曝光。
這起事件凸顯了 AI 產業中日益增長的脆弱性:快速的迭代與內部文件往往超前於安全的發佈流程。其他實驗室也曾發生類似外洩,但這次提供了對未發佈旗艦模型罕見且詳盡的洞見。
Leaked Benchmark Scores and Performance Claims
草稿中未披露精確數值分數——Anthropic 尚未發佈官方基準。不過,兩個版本的草稿在語氣上清晰且一致:
「與我們先前最佳的模型 Claude Opus 4.6 相比,Capybara 在軟體編程、學術推理與網路安全等測試中取得了戲劇性更高的分數。」
該模型進一步被描述為「在資安能力上目前遠遠領先於任何其他 AI 模型」,並且「預示著一波即將到來的模型,能夠以遠超於防守者努力的方式利用漏洞」。
這些基準類別實際在衡量什麼?
- Software Coding(例如 SWE-Bench Verified、HumanEval、LiveCodeBench):真實世界的軟體工程任務,包括修復錯誤、實作新功能與倉庫層級的理解。Opus 4.6 已在許多編程排行榜領先;若此處有「戲劇性的」躍進,意味著 Mythos 能夠自主處理目前需要資深工程師才能勝任的複雜、多檔案程式碼庫。
- Academic Reasoning(例如 GPQA、MMLU-Pro、MATH、FrontierMath):研究所層級的科學、數學與多步邏輯問題。此處的提升象徵更強的多步推理與知識綜整能力。
- Cybersecurity:漏洞發掘、攻擊構建、紅隊模擬與防禦強化。這是被最強調、也最令人擔憂的領域。
雖然先前的 Claude 模型(Opus 4.5/4.6)已取得強勢表現——例如,Opus 4.5 在 SWE-Bench Verified 上約為 80.9%——但此次外洩的說法將 Mythos 置於質上不同的層次。
Model Characteristics and Technical Profile
除了基準測試之外,草稿揭示了幾個關鍵特徵:
- Scale and Cost:「對我們來說服務成本非常高,對客戶而言也會非常昂貴。」這意味著極大的參數規模與高昂的推論成本,使初期可用性僅限於企業與高價值用例。
- Reasoning Depth:對「知識領域之間的深層連結組織」的強調,暗示更優異的長脈絡理解與跨領域綜合能力。
- Agentic Capabilities:早期存取似乎鎖定需要先進編程代理與資安工具的組織。
- Safety-First Philosophy:延續 Anthropic 的憲法式 AI 方針,公司在更廣泛發佈之前優先進行風險評估,特別是在資安方面。
Cybersecurity Implications: The Biggest Red Flag
此次外洩最引人注目的,是 Anthropic 對模型雙重用途潛力的自我警示。由於在資安能力上「遙遙領先」,Mythos 可能:
- 自主發現零日漏洞。
- 大規模生成高複雜度的攻擊程式碼。
- 以快於人類防守者反應的速度,模擬高階持續性威脅(APT)。
草稿明確表示,公司希望「格外謹慎行事」,並與資安防守者分享發現,以為「一波即將到來的 AI 驅動攻擊」做好準備。
市場反應即刻顯現:在 2026 年 3 月 27–28 日,網路安全類股大跌,投資人將進攻性 AI 能力可能超越防禦工具的風險反映在價格上。
這與整體產業趨勢一致。OpenAI 也在類似 GPT-5.3-Codex 的模型中標示了高資安能力。真實世界事件已顯示國家級行為者(例如某中國團體)使用 Claude 變體進行滲透行動。Mythos 將使這類威脅如虎添翼。
正面的一面:若能讓防禦方早期存取,或可加速安全編碼實踐、自動修補與威脅獵捕,長期而言有望讓網路更安全。
Comparison Table: Claude Mythos vs. Previous Models
| Aspect | Claude Opus 4.6 (Current Flagship) | Claude Mythos / Capybara (Leaked) | Key Takeaway |
|---|---|---|---|
| Tier | Opus | 新的「Capybara」層級(高於 Opus) | 重大架構躍進 |
| Coding Performance | 強勁(例如,~80.9% SWE-Bench) | 戲劇性更高 | 可能媲美或超越資深工程師的生產力 |
| Academic Reasoning | 優異 | 戲劇性更高 | 更深的多步邏輯與知識整合 |
| Cybersecurity | 有能力(可進行漏洞偵測) | 遠超任何現有模型 | 質的飛躍;提高雙重用途風險 |
| Inference Cost | 高(Opus 定價) | 非常昂貴(更高) | 初期僅限企業 |
| Release Status | 普遍可用 | 僅限早期存取測試 | 審慎、以安全為重的發佈 |
| Overall Capability | 2025 年的 SOTA | 「階段性飛躍」/「迄今最強大」 | 全新前沿基準 |
Conclusion: A Leaked Glimpse into the Next AI Era
Claude Mythos 的外洩提供了對 Anthropic 路線圖難得且未經修飾的一瞥。它證實公司在核心能力上達成了真正的「階段性飛躍」,同時也承認伴隨而來的深刻風險——尤其是在網路安全方面。不論最終被稱為 Opus 5 還是新的 Capybara 層級,Mythos 都在宣示前沿 AI 正進入一個能力超越安全部署時間表的階段。
Ready to experience CometAPI?您可以先成為我們的用戶並獲得免費的 $1 額度,並在 Claude Mythos 上線時收到通知。
