Claude Mythos(Opus 5) wyciekł: co się stało i czego się spodziewać

CometAPI
AnnaMar 29, 2026
Claude Mythos(Opus 5) wyciekł: co się stało i czego się spodziewać

Na dzień 29 marca 2026 r. historia „Claude Mythos” dotyczy mniej zakończonej publicznej premiery, a bardziej wyciekniętego podglądu tego, co wygląda na kolejny duży krok Anthropic. Firma przypadkowo ujawniła szkicowe treści blogowe w publicznie przeszukiwalnym magazynie danych, odsłaniając niewydany model, który Anthropic opisał jako „skok jakościowy” i „najbardziej zaawansowany, jaki dotąd stworzyliśmy”. Anthropic potwierdził, że rozwija i testuje ten model z niewielką grupą klientów we wczesnym dostępie.

Ma to znaczenie, ponieważ obecna publiczna oferta modeli Anthropic nadal koncentruje się na Claude Opus 4.6, Claude Sonnet 4.6 i Claude Haiku 4.5. Innymi słowy, wyciek nie jest potwierdzoną publiczną premierą produktu; to wyciekający wgląd w kolejny poziom, który Anthropic może przygotowywać.

Obecnie CometAPI już udostępnia interfejsy API dla najnowocześniejszych modeli Claude, takich jak Claude Opus 4.6 i Claude Sonnet 4.6. Gdy tylko Claude Mythos będzie dostępny w CometAPI, będzie można przeprowadzać testy porównawcze z czołowymi modelami od Gemini i OpenAI. CometAPI agreguje najlepsze modele.

Czym jest Claude Mythos?

Claude Mythos to jak dotąd najbardziej zaawansowany model AI Anthropic, opisany w wyciekłych dokumentach wewnętrznych jako „zdecydowanie najpotężniejszy model AI, jaki kiedykolwiek opracowaliśmy”. Wprowadza nowy poziom wydajności — wewnętrznie określany jako „Capybara” — który plasuje się powyżej dotychczasowej linii Opus, będącej do tej pory szczytem możliwości Claude.

Obecna rodzina modeli Anthropic ma wyraźną hierarchię:

  • Opus: Największa, najbardziej zdolna i najdroższa (np. Claude Opus 4.6 oraz wcześniejszy Opus 4.5 wydany w listopadzie 2025 r.).
  • Sonnet: Zrównoważona szybkość i inteligencja.
  • Haiku: Najszybsza i najbardziej opłacalna do lekkich zadań.

Mythos/Capybara przełamuje ten schemat jako model znacząco większy i bardziej zasobochłonny obliczeniowo. Szkicowe wpisy na blogu wprost stwierdzają, że jest „większy i bardziej inteligentny niż nasze modele Opus — które do tej pory były naszymi najpotężniejszymi”. Nazwa „Mythos” została wybrana, aby przywoływać „głębokie tkanki łączące wiedzę i idee”, co sygnalizuje głębsze, bardziej zintegrowane rozumowanie międzydomenowe.

To nie drobna, przyrostowa aktualizacja. Rzecznik Anthropic potwierdził, że firma „opracowuje model ogólnego zastosowania z istotnymi postępami w zakresie rozumowania, kodowania i cyberbezpieczeństwa” i uważa go za „skok jakościowy oraz najbardziej zdolny model, jaki dotąd stworzyliśmy”. Trening został zakończony, a model przechodzi już testy w rzeczywistych warunkach z małą grupą klientów we wczesnym dostępie.

Dla kontekstu, ewolucja Claude była szybka. Claude 3 Opus (2024) ustanowił wczesne benchmarki, następnie pojawiły się Claude 3.5 Sonnet, warianty Claude 4 oraz Opus 4.5/4.6 w 2025 r. Mythos wydaje się logicznym następcą — potencjalnie tym, co społeczność spekulowała jako „Opus 5” — przesuwając granice AI na nowe terytoria, jednocześnie podnosząc poważne kwestie bezpieczeństwa.

Jak doszło do wycieku Claude Mythos?

Wyciek nastąpił około 27 marca 2026 r. wskutek prostnej, ale zawstydzającej pomyłki ludzkiej w konfiguracji systemu zarządzania treścią (CMS) Anthropic. Prawie 3000 nieopublikowanych zasobów — w tym szkice wpisów blogowych, obrazy, pliki PDF, pliki audio, a nawet dokumenty wewnętrzne — pozostawiono w publicznie przeszukiwalnym magazynie danych (czasem nazywanym „data lake”).

Zasoby były domyślnie ustawione jako „publiczne”, z łatwymi do odgadnięcia adresami URL. Badacze bezpieczeństwa Roy Paz (LayerX Security) i Alexandre Pauwels (University of Cambridge) odkryli ten cache i powiadomili media.

Wyciekłe materiały obejmowały:

  • Dwa niemal identyczne szkice wpisów na blogu (jeden zatytułowany „Claude Mythos”, drugi „Claude Capybara”).
  • Ustrukturyzowane dane stron WWW z nagłówkami i planowaną datą publikacji.
  • Niewykorzystane materiały marketingowe z przeszłych premier.
  • Wewnętrzny plik PDF dotyczący zamkniętego spotkania CEO organizowanego przez CEO Anthropic, Dario Amodei.

Anthropic szybko potwierdził incydent jako „błąd ludzki” w konfiguracji CMS i zablokował publiczny dostęp. Nie ma dowodów na złośliwe działanie ani naruszenie wag modelu — ujawniono jedynie materiały marketingowe i planistyczne.

To wydarzenie uwypukla rosnącą podatność w branży AI: szybkie iteracje i dokumentacja wewnętrzna często wyprzedzają bezpieczne procesy publikacyjne. Podobne wycieki zdarzały się w innych laboratoriach, lecz ten dostarczył wyjątkowo szczegółowego wglądu w niewydany model flagowy.

Wycieki wyników benchmarków i deklaracje wydajności

Dokładne wartości liczbowe nie zostały ujawnione w szkicach — Anthropic nie opublikował jeszcze oficjalnych benchmarków. Język użyty w obu wersjach szkiców jest jednak jednoznaczny i spójny:

„W porównaniu z naszym dotychczas najlepszym modelem, Claude Opus 4.6, Capybara uzyskuje dramatycznie wyższe wyniki w testach programowania, rozumowania akademickiego i cyberbezpieczeństwa, między innymi.”

Model jest ponadto opisany jako „obecnie daleko przed jakimkolwiek innym modelem AI w zakresie zdolności cyber” oraz taki, który „zapowiada nadchodzącą falę modeli, zdolnych do wykorzystywania podatności w tempie daleko wyprzedzającym wysiłki obrońców”.

Co tak naprawdę mierzą te kategorie benchmarków?

  • Programowanie (np. SWE-Bench Verified, HumanEval, LiveCodeBench): Rzeczywiste zadania inżynierii oprogramowania, w tym naprawa błędów, implementacja funkcji i rozumienie repozytoriów na poziomie całych projektów. Opus 4.6 już prowadził w wielu rankingach kodowania; „dramatyczny” skok oznaczałby, że Mythos może autonomicznie obsługiwać złożone, wieloplikowe bazy kodu, które obecnie wymagają starszych inżynierów.
  • Rozumowanie akademickie (np. GPQA, MMLU-Pro, MATH, FrontierMath): Zadania na poziomie studiów magisterskich z zakresu nauk ścisłych, matematyki i wieloetapowego rozumowania logicznego. Poprawa tutaj sygnalizuje silniejsze rozumowanie łańcuchowe i syntezę wiedzy.
  • Cyberbezpieczeństwo: Odkrywanie podatności, generowanie exploitów, symulacje red-teamingu oraz wzmacnianie zabezpieczeń. To najbardziej podkreślany obszar — i najbardziej niepokojący.

Choć wcześniejsze modele Claude (Opus 4.5/4.6) osiągały mocne wyniki — np. Opus 4.5 uzyskał ~80.9% w SWE-Bench Verified — wyciekłe deklaracje lokują Mythos jakościowo w innej lidze.

Cechy modelu i profil techniczny

Poza benchmarkami, szkice ujawniają kilka cech definiujących:

  • Skala i koszt: „Bardzo drogi dla nas w utrzymaniu i bardzo drogi dla naszych klientów w użyciu.” Sugeruje to ogromną liczbę parametrów i wysokie koszty wnioskowania, co ograniczy początkową dostępność do zastosowań korporacyjnych i wysokowartościowych.
  • Głębokość rozumowania: Nacisk na „głębokie tkanki łączące” między domenami wiedzy sugeruje lepsze rozumienie długiego kontekstu i syntezę międzydziedzinową.
  • Zdolności agentowe: Wczesny dostęp wydaje się kierowany do organizacji potrzebujących zaawansowanych agentów do kodowania i narzędzi cyberbezpieczeństwa.
  • Filozofia bezpieczeństwa na pierwszym miejscu: Zgodnie z podejściem Anthropic do „konstytucyjnej AI”, firma priorytetyzuje ocenę ryzyka — zwłaszcza w cyberbezpieczeństwie — przed szerszym udostępnieniem.

Implikacje dla cyberbezpieczeństwa: największy sygnał ostrzegawczy

Najbardziej uderzającym elementem wycieku jest ostrzeżenie samego Anthropic dotyczące podwójnego zastosowania modelu. Będąc „daleko przed” w zdolnościach cyber, Mythos mógłby:

  • Autonomicznie odkrywać podatności typu zero-day.
  • Generować na dużą skalę wyrafinowany kod exploitów.
  • Symulować zaawansowane trwałe zagrożenia (APT) szybciej, niż obrońcy są w stanie reagować.

Szkic wprost stwierdza, że firma chce „działać ze szczególną ostrożnością” i podzielić się ustaleniami z obrońcami cyber, aby przygotować się na „nadciągającą falę exploitów napędzanych przez AI”.

Reakcja rynku była natychmiastowa: akcje spółek z sektora cyberbezpieczeństwa spadły 27–28 marca 2026 r., gdy inwestorzy zdyskontowali ryzyko, że ofensywne możliwości AI mogą wyprzedzić narzędzia obronne.

To wpisuje się w szersze trendy branżowe. OpenAI podobnie sygnalizował wysokie zdolności cyber w modelach takich jak GPT-5.3-Codex. Rzeczywiste incydenty już pokazują, że aktorzy państwowi (np. chińska grupa) wykorzystują warianty Claude do kampanii infiltracyjnych. Mythos mógłby te zagrożenia spotęgować.

Pozytywna strona: Wczesny dostęp dla organizacji defensywnych może przyspieszyć bezpieczne praktyki kodowania, automatyczne łatanie i hunting zagrożeń — potencjalnie czyniąc internet bezpieczniejszym w długim okresie.

Tabela porównawcza: Claude Mythos vs. poprzednie modele

AspektClaude Opus 4.6 (obecny flagowiec)Claude Mythos / Capybara (wyciek)Kluczowy wniosek
PoziomOpusNowy poziom „Capybara” (powyżej Opus)Duży skok architektoniczny
Wydajność w programowaniuWysoka (np. ~80.9% SWE-Bench)Dramatycznie wyższaPotencjał, by dorównać lub przewyższyć produktywność seniorów
Rozumowanie akademickieDoskonałeDramatycznie wyższeGłębsze, wieloetapowe wnioskowanie i integracja wiedzy
CyberbezpieczeństwoZdolny (wykrywanie podatności)Daleko przed jakimkolwiek obecnym modelemSkok jakościowy; nasila ryzyka podwójnego zastosowania
Koszt wnioskowaniaWysoki (cennik Opus)Bardzo wysoki (jeszcze wyższy)Początkowo tylko dla przedsiębiorstw
Status wydaniaPowszechnie dostępnyTylko testy dla wczesnego dostępuCelowe, zorientowane na bezpieczeństwo wdrażanie
Ogólne możliwościStan sztuki 2025„Skok jakościowy” / „Najpotężniejszy dotąd”Nowy punkt odniesienia na granicy możliwości

Konkluzja: Wyciekający wgląd w następną erę AI

Wyciek dotyczący Claude Mythos oferuje rzadki, niesfiltrowany wgląd w plan działania Anthropic. Potwierdza, że firma osiągnęła prawdziwy „skok jakościowy” w kluczowych możliwościach, jednocześnie uznając głębokie ryzyka — zwłaszcza w cyberbezpieczeństwie — które towarzyszą takiej mocy. Niezależnie od tego, czy zostanie nazwany Opus 5, czy nowym poziomem Capybara, Mythos sygnalizuje, że AI z pogranicza wchodzi w fazę, w której możliwości wyprzedzają bezpieczne harmonogramy wdrożeń.

Gotowi, aby wypróbować CometAPI? Najpierw możesz zostać naszym użytkownikiem i otrzymać darmowy kredyt w wysokości $1, a także powiadomienia, gdy Claude Mythos stanie się dostępny.

Dostęp do najlepszych modeli po niskich kosztach

Czytaj więcej