Claude Mythos(Opus 5) geleakt: Was ist passiert und was ist zu erwarten

Stand 29. März 2026 ist die Geschichte um „Claude Mythos“ weniger eine abgeschlossene öffentliche Markteinführung als vielmehr eine geleakte Vorschau auf das, was wie der nächste große Schritt von Anthropic aussieht. Das Unternehmen hat versehentlich Entwürfe von Blog-Inhalten in einem öffentlich durchsuchbaren Daten-Cache offengelegt und damit ein unveröffentlichtes Modell enthüllt, das Anthropic als einen „Sprung“ und „das bislang leistungsfähigste, das wir entwickelt haben“ beschreibt. Anthropic bestätigte, dass es das Modell mit einer kleinen Gruppe von Early-Access-Kunden entwickelt und testet.

Das ist relevant, weil Anthropics derzeitige öffentliche Modellpalette weiterhin auf Claude Opus 4.6, Claude Sonnet 4.6 und Claude Haiku 4.5 ausgerichtet ist. Mit anderen Worten: Der Leak ist keine bestätigte öffentliche Produkteinführung; er ist ein geleiteter Ausblick auf die nächste Stufe, die Anthropic vorbereiten könnte.

Derzeit bietet CometAPI bereits APIs für hochmoderne Claude-Modelle, etwa Claude Opus 4.6 und Claude Sonnet 4.6. Sobald Claude Mythos auf CometAPI verfügbar ist, können Sie Vergleichstests gegen Top-Modelle von Gemini und OpenAI durchführen. CometAPI aggregiert die besten Modelle.

Was ist Claude Mythos?

Claude Mythos ist Anthropics bisher fortschrittlichstes KI-Modell, in geleakten internen Dokumenten beschrieben als „mit großem Abstand das leistungsstärkste KI-Modell, das wir je entwickelt haben“. Es führt eine neue Leistungsstufe ein—intern „Capybara“ genannt—die oberhalb der bisherigen Opus-Reihe angesiedelt ist, die bislang die Spitze der Claude-Fähigkeiten markierte.

Anthropics aktuelle Modellfamilie folgt einer klaren Hierarchie:

Opus: Größtes, leistungsfähigstes und teuerstes (z. B. Claude Opus 4.6 und das frühere Opus 4.5, veröffentlicht im November 2025).
Sonnet: Ausgewogen in Geschwindigkeit und Intelligenz.
Haiku: Am schnellsten und kosteneffizient für leichte Aufgaben.

Mythos/Capybara durchbricht dieses Muster als deutlich größeres, rechenintensiveres Modell. Entwürfe von Blogposts führen ausdrücklich aus, es sei „größer und intelligenter als unsere Opus-Modelle—die bislang unsere leistungsstärksten waren“. Der Name „Mythos“ wurde gewählt, um „die tiefen Verbindungsschichten zu evozieren, die Wissen und Ideen miteinander verknüpfen“, was auf ein tieferes, stärker integriertes Reasoning über Domänen hinweg hindeutet.

Dies ist kein kleiner inkrementeller Schritt. Ein Sprecher von Anthropic bestätigte, dass das Unternehmen „ein universelles Modell mit bedeutenden Fortschritten in Reasoning, Coding und Cybersicherheit“ entwickelt und es als „einen Sprung und das bislang leistungsfähigste“ betrachtet. Das Training ist abgeschlossen, und das Modell wird bereits in realen Szenarien mit einer kleinen Gruppe von Early-Access-Kunden getestet.

Zum Kontext: Die Entwicklung von Claude verlief rasant. Claude 3 Opus (2024) setzte frühe Benchmarks, gefolgt von Claude 3.5 Sonnet, Varianten von Claude 4 sowie Opus 4.5/4.6 im Jahr 2025. Mythos erscheint als logischer Nachfolger—potenziell das, was die Community als „Opus 5“ spekuliert hat—und treibt Frontier-KI in neues Terrain, während ernste Sicherheitsfragen aufgeworfen werden.

Wie kam es zum Leak von Claude Mythos?

Der Leak ereignete sich am oder um den 27. März 2026 aufgrund einer einfachen, aber peinlichen Fehlkonfiguration des Content-Management-Systems (CMS) bei Anthropic. Nahezu 3.000 unveröffentlichte Assets—darunter Entwürfe von Blogposts, Bilder, PDFs, Audiodateien und sogar interne Dokumente—lagen in einem öffentlich durchsuchbaren Datenspeicher (manchmal „Data Lake“ genannt).

Assets waren standardmäßig auf „öffentlich“ gesetzt, mit erratbaren URLs. Die Sicherheitsforscher Roy Paz (LayerX Security) und Alexandre Pauwels (University of Cambridge) entdeckten den Cache und informierten Medien.

Zu den geleakten Materialien gehörten:

Zwei nahezu identische Blog-Entwürfe (einer mit dem Titel „Claude Mythos“, der andere „Claude Capybara“).
Strukturierte Webseitendaten mit Überschriften und einem geplanten Veröffentlichungsdatum.
Unverwendete Marketing-Assets aus früheren Launches.
Ein internes PDF über ein nur auf Einladung zugängliches CEO-Retreat, veranstaltet von Anthropic-CEO Dario Amodei.

Anthropic bestätigte den Vorfall zügig als „menschlichen Fehler“ in der CMS-Konfiguration und entfernte den öffentlichen Zugriff. Es gibt keine Hinweise auf böswillige Absichten oder ein Abfließen von Modellgewichten—offengelegt wurden ausschließlich Marketing- und Planungsdokumente.

Das Ereignis unterstreicht eine wachsende Verwundbarkeit in der KI-Branche: Rasante Iteration und interne Dokumentation überholen oft sichere Veröffentlichungs-Workflows. Ähnliche Leaks gab es auch bei anderen Labs, doch dieser bot ungewöhnlich detaillierte Einblicke in ein unveröffentlichtes Flaggschiffmodell.

Geleakte Benchmark-Ergebnisse und Leistungsbehauptungen

Exakte numerische Werte wurden in den geleakten Entwürfen nicht genannt—Anthropic hat noch keine offiziellen Benchmarks veröffentlicht. Die Sprache ist jedoch eindeutig und in beiden Entwürfen konsistent:

„Verglichen mit unserem bisher besten Modell, Claude Opus 4.6, erzielt Capybara dramatisch höhere Werte in Tests zu Software-Coding, akademischem Reasoning und Cybersicherheit, unter anderem.“

Das Modell wird ferner beschrieben als „derzeit weit vor jedem anderen KI-Modell bei Cyber-Fähigkeiten“ und als eines, das „eine bevorstehende Welle von Modellen ankündigt, die Schwachstellen in einem Tempo ausnutzen können, das die Anstrengungen der Verteidiger bei weitem übertrifft“.

Was messen diese Benchmark-Kategorien tatsächlich?

Software-Coding (z. B. SWE-Bench Verified, HumanEval, LiveCodeBench): Realitätsnahe Aufgaben der Softwaretechnik, einschließlich Bugfixing, Implementierung von Features und Verständnis auf Repository-Ebene. Opus 4.6 führte bereits viele Coding-Ranglisten an; ein „dramatischer“ Sprung hieße, dass Mythos komplexe, mehrdateienübergreifende Codebasen autonom bewältigen könnte, die derzeit Senior Engineers erfordern.
Akademisches Reasoning (z. B. GPQA, MMLU-Pro, MATH, FrontierMath): Aufgaben auf Graduiertenniveau in Naturwissenschaften, Mathematik und mehrstufiger Logik. Verbesserungen deuten auf stärkeres Chain-of-Thought-Reasoning und Wissenssynthese hin.
Cybersicherheit: Schwachstellenfindung, Exploit-Generierung, Red-Teaming-Simulationen und defensive Härtung. Dies ist der am stärksten betonte—und besorgniserregendste—Bereich.

Während frühere Claude-Modelle (Opus 4.5/4.6) starke Resultate erzielten—z. B. erreichte Opus 4.5 ~80,9 % auf SWE-Bench Verified—positionieren die geleakten Aussagen Mythos in einer qualitativ anderen Liga.

Modelleigenschaften und technisches Profil

Abseits von Benchmarks zeigen die Entwürfe mehrere prägende Merkmale:

Skalierung und Kosten: „Für uns sehr teuer im Betrieb und für unsere Kunden sehr teuer in der Nutzung.“ Das impliziert eine enorme Parameterzahl und hohe Inferenzkosten, mit anfänglich begrenzter Verfügbarkeit für Enterprise- und hochkarätige Use Cases.
Tiefe des Reasonings: Die Betonung auf „tiefen Verbindungsschichten“ zwischen Wissensdomänen deutet auf überlegene Langkontext-Verständnisfähigkeit und domänenübergreifende Synthese hin.
Agentenfähigkeiten: Der Early Access scheint auf Organisationen ausgerichtet, die fortgeschrittene Coding-Agenten und Cybersicherheitstools benötigen.
Sicherheitsorientierte Philosophie: Im Einklang mit Anthropics Constitutional-AI-Ansatz priorisiert das Unternehmen die Risikoabschätzung—insbesondere in der Cybersicherheit—vor einer breiteren Veröffentlichung.

Auswirkungen auf die Cybersicherheit: Das größte Warnsignal

Das auffälligste Element des Leaks ist Anthropics eigene Warnung vor dem Dual-Use-Potenzial des Modells. Indem Mythos „weit voraus“ bei Cyber-Fähigkeiten ist, könnte es:

Zero-Day-Schwachstellen autonom entdecken.
Ausgereiften Exploit-Code in großem Maßstab generieren.
Advanced Persistent Threats (APTs) schneller simulieren, als menschliche Verteidiger reagieren können.

Der Entwurf stellt ausdrücklich fest, dass das Unternehmen „mit besonderer Vorsicht handeln“ und Erkenntnisse mit Cyber-Verteidigern teilen möchte, um „eine bevorstehende Welle von KI-getriebenen Exploits“ vorzubereiten.

Die Marktreaktion erfolgte umgehend: Cybersicherheitsaktien stürzten am 27.–28. März 2026 ab, als Investoren das Risiko einpreisten, dass offensive KI-Fähigkeiten defensiven Tools davonlaufen könnten.

Das deckt sich mit breiteren Branchentrends. OpenAI hat ähnlich hohe Cyber-Fähigkeiten in Modellen wie GPT-5.3-Codex markiert. Reale Vorfälle zeigen bereits, dass staatliche Akteure (z. B. eine chinesische Gruppe) Claude-Varianten für Infiltrationskampagnen nutzen. Mythos würde derartige Bedrohungen massiv verstärken.

Positive Seite: Ein früher Zugang für Verteidigungsorganisationen könnte sichere Codierpraktiken, automatisiertes Patchen und Threat Hunting beschleunigen—und das Internet langfristig sicherer machen.

Vergleichstabelle: Claude Mythos vs. vorherige Modelle

Aspekt	Claude Opus 4.6 (Aktuelles Flaggschiff)	Claude Mythos / Capybara (geleakt)	Kernaussage
Stufe	Opus	Neue „Capybara“-Stufe (über Opus)	Großer Architektursprung
Codingleistung	Stark (z. B. ~80.9% SWE-Bench)	Dramatisch höher	Potenzial, die Produktivität von Senior Engineers zu erreichen oder zu übertreffen
Akademisches Reasoning	Exzellent	Dramatisch höher	Tiefere Mehrschrittlogik und Wissensintegration
Cybersicherheit	Fähig (Schwachstellenerkennung)	Weit voraus gegenüber aktuellen Modellen	Qualitativer Sprung; erhöhtes Dual-Use-Risiko
Inference-Kosten	Hoch (Opus-Preise)	Sehr teuer (noch höher)	Zunächst nur für Enterprises
Release-Status	Allgemein verfügbar	Nur Early-Access-Tests	Umsichtige, sicherheitsfokussierte Einführung
Gesamtleistung	Stand der Technik 2025	„Sprung“/„Bisher leistungsstärkstes“	Neuer Frontier-Benchmark

Fazit: Ein geleakter Blick in die nächste KI-Ära

Der Claude-Mythos-Leak bietet einen seltenen, ungefilterten Blick auf Anthropics Roadmap. Er bestätigt, dass das Unternehmen einen echten „Sprung“ bei den Kernfähigkeiten erreicht hat und gleichzeitig die tiefgreifenden Risiken—insbesondere in der Cybersicherheit—anerkennt, die mit solcher Leistungsfähigkeit einhergehen. Ob als Opus 5 etikettiert oder als neue Capybara-Stufe: Mythos signalisiert, dass Frontier-KI in eine Phase eintritt, in der Fähigkeiten sichere Rollout-Zeitpläne überholen.

Bereit, CometAPI auszuprobieren? Sie können zunächst unser Nutzer werden und ein kostenloses $1-Guthaben erhalten sowie Benachrichtigungen, sobald Claude Mythos live geht.