Na dzień 29 marca 2026 r. historia „Claude Mythos” dotyczy mniej zakończonej publicznej premiery, a bardziej wyciekniętego podglądu tego, co wygląda na kolejny duży krok Anthropic. Firma przypadkowo ujawniła szkicowe treści blogowe w publicznie przeszukiwalnym magazynie danych, odsłaniając niewydany model, który Anthropic opisał jako „skok jakościowy” i „najbardziej zaawansowany, jaki dotąd stworzyliśmy”. Anthropic potwierdził, że rozwija i testuje ten model z niewielką grupą klientów we wczesnym dostępie.
Ma to znaczenie, ponieważ obecna publiczna oferta modeli Anthropic nadal koncentruje się na Claude Opus 4.6, Claude Sonnet 4.6 i Claude Haiku 4.5. Innymi słowy, wyciek nie jest potwierdzoną publiczną premierą produktu; to wyciekający wgląd w kolejny poziom, który Anthropic może przygotowywać.
Obecnie CometAPI już udostępnia interfejsy API dla najnowocześniejszych modeli Claude, takich jak Claude Opus 4.6 i Claude Sonnet 4.6. Gdy tylko Claude Mythos będzie dostępny w CometAPI, będzie można przeprowadzać testy porównawcze z czołowymi modelami od Gemini i OpenAI. CometAPI agreguje najlepsze modele.
Czym jest Claude Mythos?
Claude Mythos to jak dotąd najbardziej zaawansowany model AI Anthropic, opisany w wyciekłych dokumentach wewnętrznych jako „zdecydowanie najpotężniejszy model AI, jaki kiedykolwiek opracowaliśmy”. Wprowadza nowy poziom wydajności — wewnętrznie określany jako „Capybara” — który plasuje się powyżej dotychczasowej linii Opus, będącej do tej pory szczytem możliwości Claude.
Obecna rodzina modeli Anthropic ma wyraźną hierarchię:
- Opus: Największa, najbardziej zdolna i najdroższa (np. Claude Opus 4.6 oraz wcześniejszy Opus 4.5 wydany w listopadzie 2025 r.).
- Sonnet: Zrównoważona szybkość i inteligencja.
- Haiku: Najszybsza i najbardziej opłacalna do lekkich zadań.
Mythos/Capybara przełamuje ten schemat jako model znacząco większy i bardziej zasobochłonny obliczeniowo. Szkicowe wpisy na blogu wprost stwierdzają, że jest „większy i bardziej inteligentny niż nasze modele Opus — które do tej pory były naszymi najpotężniejszymi”. Nazwa „Mythos” została wybrana, aby przywoływać „głębokie tkanki łączące wiedzę i idee”, co sygnalizuje głębsze, bardziej zintegrowane rozumowanie międzydomenowe.
To nie drobna, przyrostowa aktualizacja. Rzecznik Anthropic potwierdził, że firma „opracowuje model ogólnego zastosowania z istotnymi postępami w zakresie rozumowania, kodowania i cyberbezpieczeństwa” i uważa go za „skok jakościowy oraz najbardziej zdolny model, jaki dotąd stworzyliśmy”. Trening został zakończony, a model przechodzi już testy w rzeczywistych warunkach z małą grupą klientów we wczesnym dostępie.
Dla kontekstu, ewolucja Claude była szybka. Claude 3 Opus (2024) ustanowił wczesne benchmarki, następnie pojawiły się Claude 3.5 Sonnet, warianty Claude 4 oraz Opus 4.5/4.6 w 2025 r. Mythos wydaje się logicznym następcą — potencjalnie tym, co społeczność spekulowała jako „Opus 5” — przesuwając granice AI na nowe terytoria, jednocześnie podnosząc poważne kwestie bezpieczeństwa.
Jak doszło do wycieku Claude Mythos?
Wyciek nastąpił około 27 marca 2026 r. wskutek prostnej, ale zawstydzającej pomyłki ludzkiej w konfiguracji systemu zarządzania treścią (CMS) Anthropic. Prawie 3000 nieopublikowanych zasobów — w tym szkice wpisów blogowych, obrazy, pliki PDF, pliki audio, a nawet dokumenty wewnętrzne — pozostawiono w publicznie przeszukiwalnym magazynie danych (czasem nazywanym „data lake”).
Zasoby były domyślnie ustawione jako „publiczne”, z łatwymi do odgadnięcia adresami URL. Badacze bezpieczeństwa Roy Paz (LayerX Security) i Alexandre Pauwels (University of Cambridge) odkryli ten cache i powiadomili media.
Wyciekłe materiały obejmowały:
- Dwa niemal identyczne szkice wpisów na blogu (jeden zatytułowany „Claude Mythos”, drugi „Claude Capybara”).
- Ustrukturyzowane dane stron WWW z nagłówkami i planowaną datą publikacji.
- Niewykorzystane materiały marketingowe z przeszłych premier.
- Wewnętrzny plik PDF dotyczący zamkniętego spotkania CEO organizowanego przez CEO Anthropic, Dario Amodei.
Anthropic szybko potwierdził incydent jako „błąd ludzki” w konfiguracji CMS i zablokował publiczny dostęp. Nie ma dowodów na złośliwe działanie ani naruszenie wag modelu — ujawniono jedynie materiały marketingowe i planistyczne.
To wydarzenie uwypukla rosnącą podatność w branży AI: szybkie iteracje i dokumentacja wewnętrzna często wyprzedzają bezpieczne procesy publikacyjne. Podobne wycieki zdarzały się w innych laboratoriach, lecz ten dostarczył wyjątkowo szczegółowego wglądu w niewydany model flagowy.
Wycieki wyników benchmarków i deklaracje wydajności
Dokładne wartości liczbowe nie zostały ujawnione w szkicach — Anthropic nie opublikował jeszcze oficjalnych benchmarków. Język użyty w obu wersjach szkiców jest jednak jednoznaczny i spójny:
„W porównaniu z naszym dotychczas najlepszym modelem, Claude Opus 4.6, Capybara uzyskuje dramatycznie wyższe wyniki w testach programowania, rozumowania akademickiego i cyberbezpieczeństwa, między innymi.”
Model jest ponadto opisany jako „obecnie daleko przed jakimkolwiek innym modelem AI w zakresie zdolności cyber” oraz taki, który „zapowiada nadchodzącą falę modeli, zdolnych do wykorzystywania podatności w tempie daleko wyprzedzającym wysiłki obrońców”.
Co tak naprawdę mierzą te kategorie benchmarków?
- Programowanie (np. SWE-Bench Verified, HumanEval, LiveCodeBench): Rzeczywiste zadania inżynierii oprogramowania, w tym naprawa błędów, implementacja funkcji i rozumienie repozytoriów na poziomie całych projektów. Opus 4.6 już prowadził w wielu rankingach kodowania; „dramatyczny” skok oznaczałby, że Mythos może autonomicznie obsługiwać złożone, wieloplikowe bazy kodu, które obecnie wymagają starszych inżynierów.
- Rozumowanie akademickie (np. GPQA, MMLU-Pro, MATH, FrontierMath): Zadania na poziomie studiów magisterskich z zakresu nauk ścisłych, matematyki i wieloetapowego rozumowania logicznego. Poprawa tutaj sygnalizuje silniejsze rozumowanie łańcuchowe i syntezę wiedzy.
- Cyberbezpieczeństwo: Odkrywanie podatności, generowanie exploitów, symulacje red-teamingu oraz wzmacnianie zabezpieczeń. To najbardziej podkreślany obszar — i najbardziej niepokojący.
Choć wcześniejsze modele Claude (Opus 4.5/4.6) osiągały mocne wyniki — np. Opus 4.5 uzyskał ~80.9% w SWE-Bench Verified — wyciekłe deklaracje lokują Mythos jakościowo w innej lidze.
Cechy modelu i profil techniczny
Poza benchmarkami, szkice ujawniają kilka cech definiujących:
- Skala i koszt: „Bardzo drogi dla nas w utrzymaniu i bardzo drogi dla naszych klientów w użyciu.” Sugeruje to ogromną liczbę parametrów i wysokie koszty wnioskowania, co ograniczy początkową dostępność do zastosowań korporacyjnych i wysokowartościowych.
- Głębokość rozumowania: Nacisk na „głębokie tkanki łączące” między domenami wiedzy sugeruje lepsze rozumienie długiego kontekstu i syntezę międzydziedzinową.
- Zdolności agentowe: Wczesny dostęp wydaje się kierowany do organizacji potrzebujących zaawansowanych agentów do kodowania i narzędzi cyberbezpieczeństwa.
- Filozofia bezpieczeństwa na pierwszym miejscu: Zgodnie z podejściem Anthropic do „konstytucyjnej AI”, firma priorytetyzuje ocenę ryzyka — zwłaszcza w cyberbezpieczeństwie — przed szerszym udostępnieniem.
Implikacje dla cyberbezpieczeństwa: największy sygnał ostrzegawczy
Najbardziej uderzającym elementem wycieku jest ostrzeżenie samego Anthropic dotyczące podwójnego zastosowania modelu. Będąc „daleko przed” w zdolnościach cyber, Mythos mógłby:
- Autonomicznie odkrywać podatności typu zero-day.
- Generować na dużą skalę wyrafinowany kod exploitów.
- Symulować zaawansowane trwałe zagrożenia (APT) szybciej, niż obrońcy są w stanie reagować.
Szkic wprost stwierdza, że firma chce „działać ze szczególną ostrożnością” i podzielić się ustaleniami z obrońcami cyber, aby przygotować się na „nadciągającą falę exploitów napędzanych przez AI”.
Reakcja rynku była natychmiastowa: akcje spółek z sektora cyberbezpieczeństwa spadły 27–28 marca 2026 r., gdy inwestorzy zdyskontowali ryzyko, że ofensywne możliwości AI mogą wyprzedzić narzędzia obronne.
To wpisuje się w szersze trendy branżowe. OpenAI podobnie sygnalizował wysokie zdolności cyber w modelach takich jak GPT-5.3-Codex. Rzeczywiste incydenty już pokazują, że aktorzy państwowi (np. chińska grupa) wykorzystują warianty Claude do kampanii infiltracyjnych. Mythos mógłby te zagrożenia spotęgować.
Pozytywna strona: Wczesny dostęp dla organizacji defensywnych może przyspieszyć bezpieczne praktyki kodowania, automatyczne łatanie i hunting zagrożeń — potencjalnie czyniąc internet bezpieczniejszym w długim okresie.
Tabela porównawcza: Claude Mythos vs. poprzednie modele
| Aspekt | Claude Opus 4.6 (obecny flagowiec) | Claude Mythos / Capybara (wyciek) | Kluczowy wniosek |
|---|---|---|---|
| Poziom | Opus | Nowy poziom „Capybara” (powyżej Opus) | Duży skok architektoniczny |
| Wydajność w programowaniu | Wysoka (np. ~80.9% SWE-Bench) | Dramatycznie wyższa | Potencjał, by dorównać lub przewyższyć produktywność seniorów |
| Rozumowanie akademickie | Doskonałe | Dramatycznie wyższe | Głębsze, wieloetapowe wnioskowanie i integracja wiedzy |
| Cyberbezpieczeństwo | Zdolny (wykrywanie podatności) | Daleko przed jakimkolwiek obecnym modelem | Skok jakościowy; nasila ryzyka podwójnego zastosowania |
| Koszt wnioskowania | Wysoki (cennik Opus) | Bardzo wysoki (jeszcze wyższy) | Początkowo tylko dla przedsiębiorstw |
| Status wydania | Powszechnie dostępny | Tylko testy dla wczesnego dostępu | Celowe, zorientowane na bezpieczeństwo wdrażanie |
| Ogólne możliwości | Stan sztuki 2025 | „Skok jakościowy” / „Najpotężniejszy dotąd” | Nowy punkt odniesienia na granicy możliwości |
Konkluzja: Wyciekający wgląd w następną erę AI
Wyciek dotyczący Claude Mythos oferuje rzadki, niesfiltrowany wgląd w plan działania Anthropic. Potwierdza, że firma osiągnęła prawdziwy „skok jakościowy” w kluczowych możliwościach, jednocześnie uznając głębokie ryzyka — zwłaszcza w cyberbezpieczeństwie — które towarzyszą takiej mocy. Niezależnie od tego, czy zostanie nazwany Opus 5, czy nowym poziomem Capybara, Mythos sygnalizuje, że AI z pogranicza wchodzi w fazę, w której możliwości wyprzedzają bezpieczne harmonogramy wdrożeń.
Gotowi, aby wypróbować CometAPI? Najpierw możesz zostać naszym użytkownikiem i otrzymać darmowy kredyt w wysokości $1, a także powiadomienia, gdy Claude Mythos stanie się dostępny.
