Claude Mythos（Opus 5）流出：何が起きたのか、何を期待すべきか

2026年3月29日現在、「Claude Mythos」をめぐる話題は、完成した一般公開というよりも、Anthropic の次の大きな一歩を示すリークされたプレビューに近い。Anthropic は公開検索可能なデータキャッシュにブログの下書きコンテンツを誤って露出させ、同社が「飛躍的な進歩」「これまでで最も高性能」と表現する未公開モデルの存在が明らかになった。Anthropic は、このモデルを少数のアーリーアクセス顧客とともに開発・テストしていることを確認している。

それが重要なのは、Anthropic の現行の公開モデルのラインアップが依然として Claude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5 を中心としているためである。言い換えれば、このリークは公開製品の確定発表ではなく、Anthropic が準備している可能性のある次のティアを垣間見せるものだ。

現在、CometAPI はすでに最先端の Claude モデル（Claude Opus 4.6 や Claude Sonnet 4.6 など）向けの API を提供している。Claude Mythos が CometAPI で利用可能になれば、Gemini や OpenAI のトップモデルと比較テストを行える。CometAPI は最良のモデルを集約している。

Claude Mythos とは？

Claude Mythos は、リークされた内部文書で「これまでに開発した AI モデルの中で群を抜いて最も強力」と記述された、Anthropic のこれまでで最も高度な AI モデルである。これは社内で「Capybara」と呼ばれる新たなパフォーマンスティアを導入しており、これまで Claude の能力の頂点を示していた Opus 系列の上に位置づけられる。

Anthropic の現行モデルファミリーは明確な階層構造に従っている。

Opus: 最大規模・最高能力・最も高価格（例：Claude Opus 4.6、および 2025 年 11 月にリリースされた Opus 4.5）
Sonnet: 速度と知性のバランス型
Haiku: 軽量タスク向けに最速かつコスト効率が高い

Mythos/Capybara は、この枠組みを打ち破る大幅に大型で計算資源集約型のモデルである。ドラフトのブログ記事には、同モデルが「当社の Opus モデルよりも大きく、より賢い――これまではそれらが最も強力だった」と明記されている。「Mythos」という名称には、知識とアイデアを結びつける「深い結合組織」を想起させる意図があり、分野横断のより深い統合的推論を示唆している。

これは小幅な改善ではない。Anthropic の広報は、同社が「推論、コーディング、サイバーセキュリティにおいて有意な進歩を備えた汎用モデル」を開発中であり、これを「飛躍的な進歩、そして当社史上最も高性能」と位置づけていると認めた。学習は完了しており、モデルはすでに少数のアーリーアクセス顧客との実環境テスト段階にある。

参考までに、Claude の進化は急速だった。Claude 3 Opus（2024 年）が初期ベンチマークを打ち立て、その後に Claude 3.5 Sonnet、Claude 4 系、そして 2025 年の Opus 4.5/4.6 が続いた。Mythos はその論理的後継であり、コミュニティで「Opus 5」と推測されてきたものに相当する可能性がある。フロンティア AI を新たな領域へ押し広げると同時に、深刻な安全上の懸念も提起している。

Claude Mythos はどのように流出したのか？

このリークは 2026 年 3 月 27 日ごろ、Anthropic のコンテンツ管理システム（CMS）の単純だが気まずい人的ミスによる設定不備が原因で発生した。未公開アセット 3,000 件（ブログの下書き、画像、PDF、音声ファイル、さらには内部文書まで）が、一般に検索可能なデータストア（「データレイク」とも）に置かれていた。

アセットはデフォルトで「public」に設定され、URL も推測可能だった。セキュリティ研究者の Roy Paz（LayerX Security）と Alexandre Pauwels（University of Cambridge）がこのキャッシュを発見し、メディアに通報した。

流出資料には次のものが含まれていた。

ほぼ同一のブログ下書き 2 本（1 本は「Claude Mythos」、もう 1 本は「Claude Capybara」のタイトル）
見出しや予定公開日を含む構造化されたウェブページデータ
過去のローンチからの未使用マーケティング素材
Anthropic の CEO Dario Amodei が主催する、招待制の CEO リトリートに関する社内向け PDF

Anthropic はこの事故を CMS 設定の「人的ミス」としてすばやく認め、公開アクセスを遮断した。悪意ある意図やモデルの重みの侵害を示す証拠はなく、露出したのはマーケティングや計画文書のみとされる。

この出来事は、AI 業界に広がる脆弱性を浮き彫りにしている。急速な反復と内部ドキュメントの増加が、安全な公開ワークフローを追い越しがちな点だ。他の研究所でも類似のリークは起きているが、今回のものは未発表のフラッグシップモデルに関する異例に詳細な洞察を与えた。

流出したベンチマークと性能主張

正確な数値スコアはドラフトでは開示されていない――Anthropic は公式ベンチマークをまだ公開していない。しかし、両方のドラフトで使われている言葉は明確かつ一貫している。

「当社の従来の最良モデルである Claude Opus 4.6 と比べて、Capybara はソフトウェアコーディング、アカデミックな推論、サイバーセキュリティなどのテストで飛躍的に高いスコアを獲得します。」

さらに同モデルは「現在、サイバー能力において他のどの AI モデルよりもはるかに先行しており、防御側の取り組みを大きく上回る形で脆弱性を悪用できるモデルの波を予兆している」とも記されている。

これらのベンチマークは実際に何を測っているのか？

Software Coding（例：SWE-Bench Verified、HumanEval、LiveCodeBench）: バグ修正、機能実装、リポジトリレベルの理解など、実世界のソフトウェア工学タスク。すでに Opus 4.6 は多くのコーディング系リーダーボードで先行していた。ここで「飛躍」があるなら、現在はシニアエンジニアを要する複雑なマルチファイルのコードベースを自律的に扱える可能性を意味する。
Academic Reasoning（例：GPQA、MMLU-Pro、MATH、FrontierMath）: 大学院レベルの科学・数学・多段階の論理問題。ここでの改善は、より強力な多段推論と知識統合を示す。
Cybersecurity: 脆弱性発見、エクスプロイト生成、レッドチーミングのシミュレーション、防御強化。最も強調され、同時に最も懸念される領域。

従来の Claude モデル（Opus 4.5/4.6）も強力だった――たとえば Opus 4.5 は SWE-Bench Verified で ~80.9% を記録。しかし、リークされた主張は Mythos を質的に異なるリーグへ位置づけている。

モデルの特徴と技術プロファイル

ベンチマーク以外にも、ドラフトは次の決定的な特徴を明かしている。

規模とコスト: 「当社にとって提供コストが非常に高く、顧客にとっても非常に高価になる」。これは膨大なパラメータ数と高い推論コストを示唆し、当初の提供はエンタープライズや高付加価値ユースケースに限定される見込み。
推論の深さ: 知識領域間の「深い結合組織」を強調しており、長いコンテキストの理解と分野横断的な統合の強化を示唆。
エージェント的機能: 先行提供は、高度なコーディングエージェントやサイバーセキュリティツールを必要とする組織を対象としている模様。
安全最優先の方針: Anthropic の Constitutional AI アプローチに沿い、特にサイバーセキュリティ面のリスク評価を優先し、広範な公開を慎重に進める姿勢。

サイバーセキュリティへの含意：最大のレッドフラッグ

このリークで最も目を引くのは、同モデルの軍民両用（デュアルユース）可能性に関する Anthropic 自身の警告だ。サイバー能力で「はるか先行」することで、Mythos は次のことを可能にし得る。

ゼロデイ脆弱性の自律的発見
高度なエクスプロイトコードの大規模生成
人間の防御側の対応より速く高度持続的脅威（APTs）をシミュレート

ドラフトは、同社が「特別な慎重さをもって行動」し、「差し迫る AI 駆動のエクスプロイトの波」に備えるために防御側と知見を共有したいと明言している。

市場の反応は即時だった。2026 年 3 月 27～28 日にサイバーセキュリティ関連株が急落し、攻撃的な AI 能力が防御ツールを凌駕するリスクが織り込まれた。

これは業界全体の動向とも一致する。OpenAI も GPT-5.3-Codex のようなモデルで高いサイバー能力を示唆している。実世界では、国家主体（例：中国のグループ）が浸透作戦に Claude 系のバリアントを用いた事例もすでに報告されている。Mythos はこうした脅威を一段と増幅しかねない。

ポジティブな側面: 防御側の組織への先行提供は、安全なコーディング実践、自動パッチ適用、スレットハンティングを加速させ、長期的にはインターネットをより安全にする可能性がある。

比較表：Claude Mythos と従来モデル

項目	Claude Opus 4.6（現行フラッグシップ）	Claude Mythos / Capybara（リーク）	要点
ティア	Opus	新たな「Capybara」ティア（Opus の上位）	アーキテクチャ上の大きな飛躍
コーディング性能	強力（例：~80.9% SWE-Bench）	飛躍的に向上	シニアエンジニアの生産性に匹敵・超過する可能性
学術的推論	優秀	飛躍的に向上	より深い多段推論と知識統合
サイバーセキュリティ	有能（脆弱性検知など）	現行のどのモデルよりもはるか先行	質的飛躍。両刃のリスクを高める
推論コスト	高い（Opus 価格帯）	非常に高い（さらに高コスト）	当初はエンタープライズ限定
リリース状況	一般提供	アーリーアクセスのテストのみ	慎重で安全重視の段階的展開
総合能力	2025 年の最先端	「飛躍的進歩」/「これまでで最も強力」	新たなフロンティアのベンチマーク

結論：次の AI 時代を垣間見るリーク

Claude Mythos のリークは、Anthropic のロードマップを珍しくフィルターなしで示すものだ。コア能力の真の「飛躍的進歩」を達成したことを裏づける一方で、とりわけサイバーセキュリティに関する深刻なリスクを同時に認めてもいる。Opus 5 と呼ばれようが、新たな Capybara ティアであろうが、Mythos はフロンティア AI が能力面で安全な展開のタイムラインを上回る段階へ入りつつあることを示している。

CometAPI を体験する準備はできていますか？まずはユーザー登録して無料の $1 クレジットを受け取り、Claude Mythos が利用可能になった際の通知を受け取ることができる。

Claude Mythos とは？

Claude Mythos はどのように流出したのか？

流出したベンチマークと性能主張

これらのベンチマークは実際に何を測っているのか？

モデルの特徴と技術プロファイル

サイバーセキュリティへの含意：最大のレッドフラッグ

比較表：Claude Mythos と従来モデル

結論：次の AI 時代を垣間見るリーク

トップモデルを低コストで利用

もっと読む

Claude Mythos（Opus 5）流出：何が起きたのか、何を期待すべきか

Claude Mythos とは？

Claude Mythos はどのように流出したのか？

流出したベンチマークと性能主張

これらのベンチマークは実際に何を測っているのか？

モデルの特徴と技術プロファイル

サイバーセキュリティへの含意：最大のレッドフラッグ

比較表：Claude Mythos と従来モデル

結論：次の AI 時代を垣間見るリーク

トップモデルを 低コストで利用

もっと読む

トップモデルを低コストで利用