Claude Mythos(Opus 5) Sızdırıldı: Ne oldu ve neler beklenebilir

29 Mart 2026 itibarıyla “Claude Mythos” hikâyesi, tamamlanmış bir genel lansmandan çok, Anthropic’in bir sonraki büyük adımı gibi görünen sızdırılmış bir önizleme hakkında. Şirket, herkese açık olarak aranabilen bir veri önbelleğinde taslak blog içeriğini yanlışlıkla erişime açarak, Anthropic’in “köklü bir sıçrama” ve “bugüne kadar geliştirdiğimiz en yetkin” diye tanımladığı, yayımlanmamış bir modeli ifşa etti. Anthropic, modeli küçük bir erken erişim müşteri grubuyla geliştirdiğini ve test ettiğini doğruladı.

Bu önemli çünkü Anthropic’in mevcut genel model serisi hâlâ Claude Opus 4.6, Claude Sonnet 4.6 ve Claude Haiku 4.5 etrafında dönüyor. Başka bir deyişle, bu sızıntı teyit edilmiş bir genel ürün lansmanı değil; Anthropic’in hazırlamakta olabileceği bir sonraki kademeye dair sızmış bir bakış.

Şu anda, CometAPI zaten Claude Opus 4.6 ve Claude Sonnet 4.6 gibi en ileri Claude modelleri için API’ler sunuyor. Claude Mythos CometAPI’de kullanılabilir olduğunda, Gemini ve OpenAI’nin üst düzey modellerine karşı karşılaştırmalı testler yapabilirsiniz. CometAPI en iyi modelleri bir araya getirir.

Claude Mythos Nedir?

Claude Mythos, sızdırılan dahili belgelerde “açık ara şimdiye kadar geliştirdiğimiz en güçlü yapay zekâ modeli” olarak tanımlanan, Anthropic’in bugüne kadarki en gelişmiş yapay zekâ modeli. Mevcut Opus serisinin üzerinde konumlanan—içeride “Capybara” olarak anılan—yeni bir performans kademesi sunuyor; Opus serisi şimdiye dek Claude’un yeteneklerinin zirvesini temsil ediyordu.

Anthropic’in mevcut model ailesi net bir hiyerarşi izliyor:

Opus: En büyük, en yetkin ve en pahalı (ör. Claude Opus 4.6 ve Kasım 2025’te yayımlanan daha eski Opus 4.5).
Sonnet: Hız ve zekâ arasında dengeli.
Haiku: En hızlı ve hafif görevler için en uygun maliyetli.

Mythos/Capybara, çok daha büyük ve daha fazla hesaplama gerektiren bir model olarak bu kalıbı kırıyor. Taslak blog yazıları, bunun “Opus modellerimizden daha büyük ve daha zeki—ki onlar şimdiye kadar en güçlü modellerimizdi” olduğunu açıkça belirtiyor. “Mythos” adı, “bilgi ve fikirleri birbirine bağlayan derin bağ dokularını” çağrıştırması için seçildi; bu da alanlar arası daha derin, daha bütünleşik akıl yürütmeye işaret ediyor.

Bu, küçük bir artımsal güncelleme değil. Anthropic’in sözcüsü, şirketin “akıl yürütme, kodlama ve siber güvenlikte anlamlı ilerlemeler sunan genel amaçlı bir model” geliştirdiğini ve bunu “köklü bir sıçrama ve bugüne kadar geliştirdiğimiz en yetkin model” olarak gördüğünü doğruladı. Eğitimi tamamlandı ve model, küçük bir erken erişim müşteri grubuyla gerçek dünya testlerinden geçiyor.

Bağlam açısından, Claude’un evrimi hızlıydı. Claude 3 Opus (2024) erken ölçütleri belirledi; ardından Claude 3.5 Sonnet, Claude 4 varyantları ve 2025’te Opus 4.5/4.6 geldi. Mythos, topluluğun “Opus 5” olarak speküle ettiği şeye mantıksal bir halef gibi görünüyor—sınır yapay zekâyı yeni bir alana iterken ciddi güvenlik sorularını da gündeme getiriyor.

Claude Mythos Nasıl Sızdı?

Sızıntı, 27 Mart 2026 civarında, Anthropic’in içerik yönetim sistemindeki (CMS) basit ama utanç verici bir insan hatası yapılandırması nedeniyle gerçekleşti. Taslak blog yazıları, görseller, PDF’ler, ses dosyaları ve hatta dahili belgeler de dahil olmak üzere yayımlanmamış neredeyse 3.000 öğe, herkese açık olarak aranabilen bir veri deposunda (bazen “data lake” olarak adlandırılır) bırakıldı.

Öğeler varsayılan olarak “public”e ayarlanmıştı ve URL’leri tahmin edilebilirdi. Güvenlik araştırmacıları Roy Paz (LayerX Security) ve Alexandre Pauwels (Cambridge University) önbelleği keşfederek medya kuruluşlarını uyardılar.

Sızdırılan materyaller şunları içeriyordu:

İki neredeyse özdeş taslak blog yazısı (biri “Claude Mythos”, diğeri “Claude Capybara” başlıklı).
Başlıklar ve planlanan yayın tarihi içeren yapılandırılmış web sayfası verileri.
Geçmiş lansmanlardan kullanılmamış pazarlama varlıkları.
Anthropic CEO’su Dario Amodei’nin ev sahipliğinde davetiyeli bir CEO inzivasına dair dahili bir PDF.

Anthropic, olayı CMS yapılandırmasındaki “insan hatası” olarak hızla doğruladı ve herkese açık erişimi kaldırdı. Kötü niyet veya model ağırlıklarının ihlali olduğuna dair bir kanıt yok; yalnızca pazarlama ve planlama belgeleri ortaya çıktı.

Bu olay, yapay zekâ sektöründe büyüyen bir zafiyeti vurguluyor: hızlı yineleme ve dahili dokümantasyon, güvenli yayınlama iş akışlarını sıkça geride bırakıyor. Benzer sızıntılar diğer laboratuvarlarda da meydana geldi, ancak bu sızıntı, yayımlanmamış bir amiral gemisi modele dair olağanüstü ayrıntılı bir içgörü sundu.

Sızan Kıyaslama Skorları ve Performans İddiaları

Sızdırılan taslaklarda kesin sayısal skorlar açıklanmadı—Anthropic henüz resmi kıyaslamalar yayımlamadı. Ancak dil, her iki taslakta da açık ve tutarlı:

“Önceki en iyi modelimiz Claude Opus 4.6 ile karşılaştırıldığında, Capybara yazılım kodlama, akademik akıl yürütme ve siber güvenlik gibi testlerde dramatik biçimde daha yüksek skorlar alıyor.”

Model ayrıca “siber yeteneklerde şu anda diğer tüm yapay zekâ modellerinin çok ilerisinde” ve “savunucuların çabalarını çok geride bırakacak şekilde zafiyetlerden yararlanabilen bir model dalgasının habercisi” olarak tanımlanıyor.

Bu kıyaslama kategorileri gerçekte neyi ölçüyor?

Yazılım Kodlama (ör. SWE-Bench Verified, HumanEval, LiveCodeBench): Hata düzeltme, özellik uygulama ve depo düzeyinde anlama dahil gerçek dünya yazılım mühendisliği görevleri. Opus 4.6 zaten birçok kodlama sıralamasında liderdi; burada “dramatik” bir sıçrama, Mythos’un şu anda kıdemli mühendisler gerektiren karmaşık, çok dosyalı kod tabanlarını özerk biçimde ele alabileceği anlamına gelir.
Akademik Akıl Yürütme (ör. GPQA, MMLU-Pro, MATH, FrontierMath): Lisansüstü düzey bilim, matematik ve çok adımlı mantık problemleri. Buradaki gelişmeler, daha güçlü zincirleme akıl yürütme ve bilgi sentezine işaret eder.
Siber Güvenlik: Zafiyet keşfi, exploit üretimi, red-teaming simülasyonları ve savunma sertleştirmesi. En fazla vurgu yapılan—ve en endişe verici—alan budur.

Önceki Claude modelleri (Opus 4.5/4.6) güçlü sonuçlar elde etmişti—örneğin, Opus 4.5 SWE-Bench Verified’da ~80.9% skor aldı—ancak sızdırılan iddialar, Mythos’u niteliksel olarak farklı bir lige yerleştiriyor.

Model Özellikleri ve Teknik Profil

Kıyaslamaların ötesinde, taslaklar birkaç belirleyici özelliği açığa çıkarıyor:

Ölçek ve Maliyet: “Bizim sunmamız için çok pahalı ve müşterilerimiz için de çok pahalı olacak.” Bu, muazzam bir parametre sayısına ve yüksek çıkarım maliyetlerine işaret eder; ilk kullanılabilirliği kurumsal ve yüksek değerli kullanım durumlarıyla sınırlayacaktır.
Akıl Yürütme Derinliği: Bilgi alanları arasındaki “derin bağ dokuları” vurgusu, üstün uzun-bağlam anlama ve alanlar arası sentezi ima eder.
Ajanik Yetenekler: Erken erişim, gelişmiş kodlama ajanları ve siber güvenlik araçlarına ihtiyaç duyan kuruluşları hedefliyor gibi görünüyor.
Önce Güvenlik Felsefesi: Anthropic’in anayasal yapay zekâ yaklaşımıyla tutarlı olarak, özellikle siber güvenlikte risk değerlendirmesine öncelik veriliyor.

Siber Güvenlik Yansımaları: En Büyük Kırmızı Bayrak

Sızıntının en çarpıcı unsuru, modelin çift amaçlı potansiyeline dair Anthropic’in kendi uyarısı. Siber yeteneklerde “çok ileride” olan Mythos şunları yapabilir:

Sıfırıncı gün zafiyetlerini özerk şekilde keşfetmek.
Ölçekli biçimde sofistike exploit kodu üretmek.
Gelişmiş kalıcı tehditleri (APT) savunuculardan daha hızlı simüle etmek.

Taslak, şirketin “ekstra dikkatle hareket etmek” ve “yaklaşan yapay zekâ destekli exploit dalgasına” hazırlanmaları için bulguları siber savunucularla paylaşmak istediğini açıkça belirtiyor.

Piyasa tepkisi anlık oldu: siber güvenlik hisseleri 27–28 Mart 2026’da düştü; yatırımcılar, saldırı odaklı yapay zekâ yeteneklerinin savunma araçlarını geride bırakabileceği riskini fiyatladı.

Bu, daha geniş sektör eğilimleriyle uyumlu. OpenAI, GPT-5.3-Codex gibi modellerde benzer şekilde yüksek siber yetenekleri işaret etti. Gerçek dünya vakaları, devlet aktörlerinin (ör. Çinli bir grup) sızma kampanyaları için Claude türevlerini kullandığını zaten gösteriyor. Mythos, bu tehditleri katlayabilir.

Olumlu taraf: Savunma kuruluşlarına erken erişim, güvenli kodlama uygulamalarını, otomatik yamalamayı ve tehdit avcılığını hızlandırabilir—uzun vadede interneti daha güvenli kılabilir.

Karşılaştırma Tablosu: Claude Mythos ve Önceki Modeller

Boyut	Claude Opus 4.6 (Mevcut amiral gemisi)	Claude Mythos / Capybara (Sızdırılan)	Ana çıkarım
Kademe	Opus	Yeni “Capybara” kademesi (Opus’un üzerinde)	Büyük mimari sıçrama
Kodlama Performansı	Güçlü (ör. ~80.9% SWE-Bench)	Dramatik biçimde daha yüksek	Kıdemli mühendis verimliliğine rakip olabilir veya aşabilir
Akademik Akıl Yürütme	Mükemmel	Dramatik biçimde daha yüksek	Daha derin çok adımlı mantık ve bilgi entegrasyonu
Siber güvenlik	Yetenekli (zafiyet tespiti)	Mevcut tüm modellerin çok ilerisinde	Niteliksel sıçrama; çift amaçlı kullanım risklerini artırır
Çıkarım Maliyeti	Yüksek (Opus fiyatlandırması)	Çok pahalı (daha da yüksek)	Başlangıçta yalnızca kurumsal
Yayın Durumu	Genel kullanıma açık	Yalnızca erken erişim testi	Kasıtlı, güvenlik odaklı yaygınlaştırma
Genel Yetenek	2025’in son teknolojisi	“Köklü sıçrama” / “Şimdiye kadarki en güçlü”	Yeni sınır kıstası

Sonuç: Bir Sonraki Yapay Zekâ Çağına Sızmış Bir Bakış

Claude Mythos sızıntısı, Anthropic’in yol haritasına nadir, filtresiz bir bakış sunuyor. Şirketin çekirdek yeteneklerde gerçek bir “köklü sıçrama”ya ulaştığını teyit ederken, aynı zamanda bu gücün beraberinde getirdiği derin riskleri—özellikle siber güvenlikte—kabul ediyor. Opus 5 olarak adlandırılsın ya da yeni bir Capybara kademesi olsun, Mythos, sınır yapay zekânın yeteneklerinin güvenli dağıtım zaman çizelgelerini geride bıraktığı bir evreye girdiğini gösteriyor.

CometAPI’yi deneyimlemeye hazır mısınız? Önce kullanıcımız olup 1$ ücretsiz kredi alabilir ve Claude Mythos yayına girdiğinde bildirim alabilirsiniz.