Claude Mythos(Opus 5) 洩漏: 發生了什麼與有何可期待

截至 2026 年 3 月 29 日，有關「Claude Mythos」的故事與其說是已完成的公開發佈，不如說是一次外洩的搶先預覽，顯示出 Anthropic 的下一個重大步伐。該公司不慎在可公開搜尋的資料快取中暴露了部落格草稿內容，揭示了一個尚未發佈的模型，Anthropic 將其描述為一次「階段性飛躍」以及「我們迄今打造的最強大模型」。Anthropic 證實正與一小群早期存取客戶開發並測試該模型。

這點之所以重要，是因為 Anthropic 目前對外的模型陣容仍以 Claude Opus 4.6、Claude Sonnet 4.6 和 Claude Haiku 4.5 為核心。換言之，這次外洩並非已確認的公開產品發佈，而是偷跑的下一級別預覽，顯示 Anthropic 可能正在準備的產品線。

目前，CometAPI 已經提供尖端 Claude 模型的 API，例如 Claude Opus 4.6 與 Claude Sonnet 4.6。一旦 Claude Mythos 在 CometAPI 上線，您可以與 Gemini 和 OpenAI 的頂級模型進行對比測試。CometAPI 聚合了最優秀的模型。

What Is Claude Mythos?

Claude Mythos 是迄今為止 Anthropic 最先進的 AI 模型，在外洩的內部文件中被描述為「遠遠是我們迄今開發過最強大的 AI 模型」。它引入了一個新的效能層級——內部稱為「Capybara」——位於公司既有 Opus 系列之上，而 Opus 一直被視為 Claude 能力的巔峰。

Anthropic 目前的模型家族有明確的層級：

Opus：最大、最強、也最昂貴（例如，Claude Opus 4.6，以及於 2025 年 11 月發佈較早的 Opus 4.5）。
Sonnet：在速度與智能之間取得平衡。
Haiku：速度最快、對輕量任務而言最具成本效益。

Mythos/Capybara 打破了這個模式，作為一個顯著更大、計算量更高的模型。部落格草稿明確表示，它「比我們的 Opus 模型更大、更智能——而 Opus 迄今為止是我們最強大的」。選用「Mythos」這個名稱，意在喚起「連結知識與想法之間的深層結締組織」，象徵跨領域更深、更整合的推理。

這不是一次小幅的漸進更新。Anthropic 的發言人證實，公司正在「開發一個在推理、編程和網路安全方面有重大進展的通用模型」，並將其視為「一次階段性飛躍，且是我們迄今打造的最強大模型」。訓練已完成，該模型已在一小群早期存取客戶中進行真實世界測試。

作為背景，Claude 的演進極為迅速。Claude 3 Opus（2024）樹立了早期基準，之後是 Claude 3.5 Sonnet、Claude 4 系列與 2025 年的 Opus 4.5/4.6。Mythos 看似是合乎邏輯的接班者——可能就是社群揣測的「Opus 5」——將前沿 AI 推進到新的領域，同時也帶來嚴肅的安全問題。

How Was Claude Mythos Leaked?

這次外洩發生在 2026 年 3 月 27 日前後，起因是 Anthropic 的內容管理系統（CMS）出現簡單但尷尬的人為錯誤設定。將近 3,000 個未發佈的資產——包括部落格草稿、圖片、PDF、音訊檔，甚至內部文件——被置於一個可公開搜尋的資料儲存庫（有時稱為「資料湖」）中。

資產預設為「public」，且 URL 可被猜測。資安研究人員 Roy Paz（LayerX Security）與 Alexandre Pauwels（University of Cambridge）發現了這個快取並通知媒體。

外洩資料包括：

兩篇幾乎相同的部落格草稿（一篇以「Claude Mythos」為標題，另一篇為「Claude Capybara」）。
具結構的網頁資料，包含標題與計畫的發佈日期。
過去發佈中未使用的行銷素材。
一份關於僅限受邀的 CEO 研討會的內部 PDF，該活動由 Anthropic CEO Dario Amodei 主持。

Anthropic 很快將事件確認為 CMS 設定中的「人為錯誤」，並移除了公開存取。沒有證據顯示惡意意圖或模型權重外洩——僅有行銷與規劃文件曝光。

這起事件凸顯了 AI 產業中日益增長的脆弱性：快速的迭代與內部文件往往超前於安全的發佈流程。其他實驗室也曾發生類似外洩，但這次提供了對未發佈旗艦模型罕見且詳盡的洞見。

Leaked Benchmark Scores and Performance Claims

草稿中未披露精確數值分數——Anthropic 尚未發佈官方基準。不過，兩個版本的草稿在語氣上清晰且一致：

「與我們先前最佳的模型 Claude Opus 4.6 相比，Capybara 在軟體編程、學術推理與網路安全等測試中取得了戲劇性更高的分數。」

該模型進一步被描述為「在資安能力上目前遠遠領先於任何其他 AI 模型」，並且「預示著一波即將到來的模型，能夠以遠超於防守者努力的方式利用漏洞」。

這些基準類別實際在衡量什麼？

Software Coding（例如 SWE-Bench Verified、HumanEval、LiveCodeBench）：真實世界的軟體工程任務，包括修復錯誤、實作新功能與倉庫層級的理解。Opus 4.6 已在許多編程排行榜領先；若此處有「戲劇性的」躍進，意味著 Mythos 能夠自主處理目前需要資深工程師才能勝任的複雜、多檔案程式碼庫。
Academic Reasoning（例如 GPQA、MMLU-Pro、MATH、FrontierMath）：研究所層級的科學、數學與多步邏輯問題。此處的提升象徵更強的多步推理與知識綜整能力。
Cybersecurity：漏洞發掘、攻擊構建、紅隊模擬與防禦強化。這是被最強調、也最令人擔憂的領域。

雖然先前的 Claude 模型（Opus 4.5/4.6）已取得強勢表現——例如，Opus 4.5 在 SWE-Bench Verified 上約為 80.9%——但此次外洩的說法將 Mythos 置於質上不同的層次。

Model Characteristics and Technical Profile

除了基準測試之外，草稿揭示了幾個關鍵特徵：

Scale and Cost：「對我們來說服務成本非常高，對客戶而言也會非常昂貴。」這意味著極大的參數規模與高昂的推論成本，使初期可用性僅限於企業與高價值用例。
Reasoning Depth：對「知識領域之間的深層連結組織」的強調，暗示更優異的長脈絡理解與跨領域綜合能力。
Agentic Capabilities：早期存取似乎鎖定需要先進編程代理與資安工具的組織。
Safety-First Philosophy：延續 Anthropic 的憲法式 AI 方針，公司在更廣泛發佈之前優先進行風險評估，特別是在資安方面。

Cybersecurity Implications: The Biggest Red Flag

此次外洩最引人注目的，是 Anthropic 對模型雙重用途潛力的自我警示。由於在資安能力上「遙遙領先」，Mythos 可能：

自主發現零日漏洞。
大規模生成高複雜度的攻擊程式碼。
以快於人類防守者反應的速度，模擬高階持續性威脅（APT）。

草稿明確表示，公司希望「格外謹慎行事」，並與資安防守者分享發現，以為「一波即將到來的 AI 驅動攻擊」做好準備。

市場反應即刻顯現：在 2026 年 3 月 27–28 日，網路安全類股大跌，投資人將進攻性 AI 能力可能超越防禦工具的風險反映在價格上。

這與整體產業趨勢一致。OpenAI 也在類似 GPT-5.3-Codex 的模型中標示了高資安能力。真實世界事件已顯示國家級行為者（例如某中國團體）使用 Claude 變體進行滲透行動。Mythos 將使這類威脅如虎添翼。

正面的一面：若能讓防禦方早期存取，或可加速安全編碼實踐、自動修補與威脅獵捕，長期而言有望讓網路更安全。

Comparison Table: Claude Mythos vs. Previous Models

Aspect	Claude Opus 4.6 (Current Flagship)	Claude Mythos / Capybara (Leaked)	Key Takeaway
Tier	Opus	新的「Capybara」層級（高於 Opus）	重大架構躍進
Coding Performance	強勁（例如，~80.9% SWE-Bench）	戲劇性更高	可能媲美或超越資深工程師的生產力
Academic Reasoning	優異	戲劇性更高	更深的多步邏輯與知識整合
Cybersecurity	有能力（可進行漏洞偵測）	遠超任何現有模型	質的飛躍；提高雙重用途風險
Inference Cost	高（Opus 定價）	非常昂貴（更高）	初期僅限企業
Release Status	普遍可用	僅限早期存取測試	審慎、以安全為重的發佈
Overall Capability	2025 年的 SOTA	「階段性飛躍」/「迄今最強大」	全新前沿基準

Conclusion: A Leaked Glimpse into the Next AI Era

Claude Mythos 的外洩提供了對 Anthropic 路線圖難得且未經修飾的一瞥。它證實公司在核心能力上達成了真正的「階段性飛躍」，同時也承認伴隨而來的深刻風險——尤其是在網路安全方面。不論最終被稱為 Opus 5 還是新的 Capybara 層級，Mythos 都在宣示前沿 AI 正進入一個能力超越安全部署時間表的階段。

Ready to experience CometAPI？您可以先成為我們的用戶並獲得免費的 $1 額度，並在 Claude Mythos 上線時收到通知。

What Is Claude Mythos?

How Was Claude Mythos Leaked?

Leaked Benchmark Scores and Performance Claims

這些基準類別實際在衡量什麼？

Model Characteristics and Technical Profile

Cybersecurity Implications: The Biggest Red Flag

Comparison Table: Claude Mythos vs. Previous Models

Conclusion: A Leaked Glimpse into the Next AI Era

以低成本存取頂級模型

閱讀更多

Claude Mythos(Opus 5) 洩漏: 發生了什麼與有何可期待

What Is Claude Mythos?

How Was Claude Mythos Leaked?

Leaked Benchmark Scores and Performance Claims

這些基準類別實際在衡量什麼？

Model Characteristics and Technical Profile

Cybersecurity Implications: The Biggest Red Flag

Comparison Table: Claude Mythos vs. Previous Models

Conclusion: A Leaked Glimpse into the Next AI Era

以低成本 存取頂級模型

閱讀更多

以低成本存取頂級模型