Claude Mythos(Opus 5) wyciekł: co się stało i czego się spodziewać

Na dzień 29 marca 2026 r. historia „Claude Mythos” dotyczy mniej zakończonej publicznej premiery, a bardziej wyciekniętego podglądu tego, co wygląda na kolejny duży krok Anthropic. Firma przypadkowo ujawniła szkicowe treści blogowe w publicznie przeszukiwalnym magazynie danych, odsłaniając niewydany model, który Anthropic opisał jako „skok jakościowy” i „najbardziej zaawansowany, jaki dotąd stworzyliśmy”. Anthropic potwierdził, że rozwija i testuje ten model z niewielką grupą klientów we wczesnym dostępie.

Ma to znaczenie, ponieważ obecna publiczna oferta modeli Anthropic nadal koncentruje się na Claude Opus 4.6, Claude Sonnet 4.6 i Claude Haiku 4.5. Innymi słowy, wyciek nie jest potwierdzoną publiczną premierą produktu; to wyciekający wgląd w kolejny poziom, który Anthropic może przygotowywać.

Obecnie CometAPI już udostępnia interfejsy API dla najnowocześniejszych modeli Claude, takich jak Claude Opus 4.6 i Claude Sonnet 4.6. Gdy tylko Claude Mythos będzie dostępny w CometAPI, będzie można przeprowadzać testy porównawcze z czołowymi modelami od Gemini i OpenAI. CometAPI agreguje najlepsze modele.

Czym jest Claude Mythos?

Claude Mythos to jak dotąd najbardziej zaawansowany model AI Anthropic, opisany w wyciekłych dokumentach wewnętrznych jako „zdecydowanie najpotężniejszy model AI, jaki kiedykolwiek opracowaliśmy”. Wprowadza nowy poziom wydajności — wewnętrznie określany jako „Capybara” — który plasuje się powyżej dotychczasowej linii Opus, będącej do tej pory szczytem możliwości Claude.

Obecna rodzina modeli Anthropic ma wyraźną hierarchię:

Opus: Największa, najbardziej zdolna i najdroższa (np. Claude Opus 4.6 oraz wcześniejszy Opus 4.5 wydany w listopadzie 2025 r.).
Sonnet: Zrównoważona szybkość i inteligencja.
Haiku: Najszybsza i najbardziej opłacalna do lekkich zadań.

Mythos/Capybara przełamuje ten schemat jako model znacząco większy i bardziej zasobochłonny obliczeniowo. Szkicowe wpisy na blogu wprost stwierdzają, że jest „większy i bardziej inteligentny niż nasze modele Opus — które do tej pory były naszymi najpotężniejszymi”. Nazwa „Mythos” została wybrana, aby przywoływać „głębokie tkanki łączące wiedzę i idee”, co sygnalizuje głębsze, bardziej zintegrowane rozumowanie międzydomenowe.

To nie drobna, przyrostowa aktualizacja. Rzecznik Anthropic potwierdził, że firma „opracowuje model ogólnego zastosowania z istotnymi postępami w zakresie rozumowania, kodowania i cyberbezpieczeństwa” i uważa go za „skok jakościowy oraz najbardziej zdolny model, jaki dotąd stworzyliśmy”. Trening został zakończony, a model przechodzi już testy w rzeczywistych warunkach z małą grupą klientów we wczesnym dostępie.

Dla kontekstu, ewolucja Claude była szybka. Claude 3 Opus (2024) ustanowił wczesne benchmarki, następnie pojawiły się Claude 3.5 Sonnet, warianty Claude 4 oraz Opus 4.5/4.6 w 2025 r. Mythos wydaje się logicznym następcą — potencjalnie tym, co społeczność spekulowała jako „Opus 5” — przesuwając granice AI na nowe terytoria, jednocześnie podnosząc poważne kwestie bezpieczeństwa.

Jak doszło do wycieku Claude Mythos?

Wyciek nastąpił około 27 marca 2026 r. wskutek prostnej, ale zawstydzającej pomyłki ludzkiej w konfiguracji systemu zarządzania treścią (CMS) Anthropic. Prawie 3000 nieopublikowanych zasobów — w tym szkice wpisów blogowych, obrazy, pliki PDF, pliki audio, a nawet dokumenty wewnętrzne — pozostawiono w publicznie przeszukiwalnym magazynie danych (czasem nazywanym „data lake”).

Zasoby były domyślnie ustawione jako „publiczne”, z łatwymi do odgadnięcia adresami URL. Badacze bezpieczeństwa Roy Paz (LayerX Security) i Alexandre Pauwels (University of Cambridge) odkryli ten cache i powiadomili media.

Wyciekłe materiały obejmowały:

Dwa niemal identyczne szkice wpisów na blogu (jeden zatytułowany „Claude Mythos”, drugi „Claude Capybara”).
Ustrukturyzowane dane stron WWW z nagłówkami i planowaną datą publikacji.
Niewykorzystane materiały marketingowe z przeszłych premier.
Wewnętrzny plik PDF dotyczący zamkniętego spotkania CEO organizowanego przez CEO Anthropic, Dario Amodei.

Anthropic szybko potwierdził incydent jako „błąd ludzki” w konfiguracji CMS i zablokował publiczny dostęp. Nie ma dowodów na złośliwe działanie ani naruszenie wag modelu — ujawniono jedynie materiały marketingowe i planistyczne.

To wydarzenie uwypukla rosnącą podatność w branży AI: szybkie iteracje i dokumentacja wewnętrzna często wyprzedzają bezpieczne procesy publikacyjne. Podobne wycieki zdarzały się w innych laboratoriach, lecz ten dostarczył wyjątkowo szczegółowego wglądu w niewydany model flagowy.

Wycieki wyników benchmarków i deklaracje wydajności

Dokładne wartości liczbowe nie zostały ujawnione w szkicach — Anthropic nie opublikował jeszcze oficjalnych benchmarków. Język użyty w obu wersjach szkiców jest jednak jednoznaczny i spójny:

„W porównaniu z naszym dotychczas najlepszym modelem, Claude Opus 4.6, Capybara uzyskuje dramatycznie wyższe wyniki w testach programowania, rozumowania akademickiego i cyberbezpieczeństwa, między innymi.”

Model jest ponadto opisany jako „obecnie daleko przed jakimkolwiek innym modelem AI w zakresie zdolności cyber” oraz taki, który „zapowiada nadchodzącą falę modeli, zdolnych do wykorzystywania podatności w tempie daleko wyprzedzającym wysiłki obrońców”.

Co tak naprawdę mierzą te kategorie benchmarków?

Programowanie (np. SWE-Bench Verified, HumanEval, LiveCodeBench): Rzeczywiste zadania inżynierii oprogramowania, w tym naprawa błędów, implementacja funkcji i rozumienie repozytoriów na poziomie całych projektów. Opus 4.6 już prowadził w wielu rankingach kodowania; „dramatyczny” skok oznaczałby, że Mythos może autonomicznie obsługiwać złożone, wieloplikowe bazy kodu, które obecnie wymagają starszych inżynierów.
Rozumowanie akademickie (np. GPQA, MMLU-Pro, MATH, FrontierMath): Zadania na poziomie studiów magisterskich z zakresu nauk ścisłych, matematyki i wieloetapowego rozumowania logicznego. Poprawa tutaj sygnalizuje silniejsze rozumowanie łańcuchowe i syntezę wiedzy.
Cyberbezpieczeństwo: Odkrywanie podatności, generowanie exploitów, symulacje red-teamingu oraz wzmacnianie zabezpieczeń. To najbardziej podkreślany obszar — i najbardziej niepokojący.

Choć wcześniejsze modele Claude (Opus 4.5/4.6) osiągały mocne wyniki — np. Opus 4.5 uzyskał ~80.9% w SWE-Bench Verified — wyciekłe deklaracje lokują Mythos jakościowo w innej lidze.

Cechy modelu i profil techniczny

Poza benchmarkami, szkice ujawniają kilka cech definiujących:

Skala i koszt: „Bardzo drogi dla nas w utrzymaniu i bardzo drogi dla naszych klientów w użyciu.” Sugeruje to ogromną liczbę parametrów i wysokie koszty wnioskowania, co ograniczy początkową dostępność do zastosowań korporacyjnych i wysokowartościowych.
Głębokość rozumowania: Nacisk na „głębokie tkanki łączące” między domenami wiedzy sugeruje lepsze rozumienie długiego kontekstu i syntezę międzydziedzinową.
Zdolności agentowe: Wczesny dostęp wydaje się kierowany do organizacji potrzebujących zaawansowanych agentów do kodowania i narzędzi cyberbezpieczeństwa.
Filozofia bezpieczeństwa na pierwszym miejscu: Zgodnie z podejściem Anthropic do „konstytucyjnej AI”, firma priorytetyzuje ocenę ryzyka — zwłaszcza w cyberbezpieczeństwie — przed szerszym udostępnieniem.

Implikacje dla cyberbezpieczeństwa: największy sygnał ostrzegawczy

Najbardziej uderzającym elementem wycieku jest ostrzeżenie samego Anthropic dotyczące podwójnego zastosowania modelu. Będąc „daleko przed” w zdolnościach cyber, Mythos mógłby:

Autonomicznie odkrywać podatności typu zero-day.
Generować na dużą skalę wyrafinowany kod exploitów.
Symulować zaawansowane trwałe zagrożenia (APT) szybciej, niż obrońcy są w stanie reagować.

Szkic wprost stwierdza, że firma chce „działać ze szczególną ostrożnością” i podzielić się ustaleniami z obrońcami cyber, aby przygotować się na „nadciągającą falę exploitów napędzanych przez AI”.

Reakcja rynku była natychmiastowa: akcje spółek z sektora cyberbezpieczeństwa spadły 27–28 marca 2026 r., gdy inwestorzy zdyskontowali ryzyko, że ofensywne możliwości AI mogą wyprzedzić narzędzia obronne.

To wpisuje się w szersze trendy branżowe. OpenAI podobnie sygnalizował wysokie zdolności cyber w modelach takich jak GPT-5.3-Codex. Rzeczywiste incydenty już pokazują, że aktorzy państwowi (np. chińska grupa) wykorzystują warianty Claude do kampanii infiltracyjnych. Mythos mógłby te zagrożenia spotęgować.

Pozytywna strona: Wczesny dostęp dla organizacji defensywnych może przyspieszyć bezpieczne praktyki kodowania, automatyczne łatanie i hunting zagrożeń — potencjalnie czyniąc internet bezpieczniejszym w długim okresie.

Tabela porównawcza: Claude Mythos vs. poprzednie modele

Aspekt	Claude Opus 4.6 (obecny flagowiec)	Claude Mythos / Capybara (wyciek)	Kluczowy wniosek
Poziom	Opus	Nowy poziom „Capybara” (powyżej Opus)	Duży skok architektoniczny
Wydajność w programowaniu	Wysoka (np. ~80.9% SWE-Bench)	Dramatycznie wyższa	Potencjał, by dorównać lub przewyższyć produktywność seniorów
Rozumowanie akademickie	Doskonałe	Dramatycznie wyższe	Głębsze, wieloetapowe wnioskowanie i integracja wiedzy
Cyberbezpieczeństwo	Zdolny (wykrywanie podatności)	Daleko przed jakimkolwiek obecnym modelem	Skok jakościowy; nasila ryzyka podwójnego zastosowania
Koszt wnioskowania	Wysoki (cennik Opus)	Bardzo wysoki (jeszcze wyższy)	Początkowo tylko dla przedsiębiorstw
Status wydania	Powszechnie dostępny	Tylko testy dla wczesnego dostępu	Celowe, zorientowane na bezpieczeństwo wdrażanie
Ogólne możliwości	Stan sztuki 2025	„Skok jakościowy” / „Najpotężniejszy dotąd”	Nowy punkt odniesienia na granicy możliwości

Konkluzja: Wyciekający wgląd w następną erę AI

Wyciek dotyczący Claude Mythos oferuje rzadki, niesfiltrowany wgląd w plan działania Anthropic. Potwierdza, że firma osiągnęła prawdziwy „skok jakościowy” w kluczowych możliwościach, jednocześnie uznając głębokie ryzyka — zwłaszcza w cyberbezpieczeństwie — które towarzyszą takiej mocy. Niezależnie od tego, czy zostanie nazwany Opus 5, czy nowym poziomem Capybara, Mythos sygnalizuje, że AI z pogranicza wchodzi w fazę, w której możliwości wyprzedzają bezpieczne harmonogramy wdrożeń.

Gotowi, aby wypróbować CometAPI? Najpierw możesz zostać naszym użytkownikiem i otrzymać darmowy kredyt w wysokości $1, a także powiadomienia, gdy Claude Mythos stanie się dostępny.