Claude Mythos(Opus 5) Terbocor: Apa yang berlaku dan apa yang dijangka

Setakat 29 Mac 2026, kisah “Claude Mythos” kurang berkaitan dengan pelancaran umum yang selesai dan lebih kepada pratonton bocor tentang langkah besar seterusnya Anthropic. Syarikat itu secara tidak sengaja mendedahkan draf kandungan blog dalam cache data yang boleh dicari secara umum, mendedahkan model yang belum diterbitkan yang digambarkan Anthropic sebagai “perubahan ketara” dan “yang paling berkeupayaan yang pernah kami bina setakat ini.” Anthropic mengesahkan ia sedang membangunkan dan menguji model tersebut dengan sekumpulan kecil pelanggan akses awal.

Perkara ini penting kerana barisan model awam Anthropic pada masa ini masih berpusat pada Claude Opus 4.6, Claude Sonnet 4.6, dan Claude Haiku 4.5. Dengan kata lain, kebocoran ini bukan pelancaran produk awam yang disahkan; ia ialah sekilas bocoran tentang tahap seterusnya yang mungkin sedang disediakan oleh Anthropic.

Pada masa ini, CometAPI sudah menyediakan API untuk model Claude terkini, seperti Claude Opus 4.6 dan Claude Sonnet 4.6. Sebaik sahaja Claude Mythos tersedia di CometAPI, anda boleh menjalankan ujian perbandingan terhadap model teratas daripada Gemini dan OpenAI. CometAPI menghimpunkan model-model terbaik.

Apakah Claude Mythos?

Claude Mythos ialah model AI paling maju Anthropic setakat ini, yang digambarkan dalam dokumen dalaman yang terbocor sebagai “jauh model AI paling berkuasa yang pernah kami bangunkan.” Ia memperkenalkan tahap prestasi baharu—secara dalaman dirujuk sebagai “Capybara”—yang berada di atas barisan Opus sedia ada syarikat, yang sehingga kini mewakili kemuncak keupayaan Claude.

Keluarga model Anthropic semasa mengikuti hierarki yang jelas:

Opus: Terbesar, paling berkeupayaan, dan paling mahal (cth., Claude Opus 4.6 dan Opus 4.5 terdahulu yang dikeluarkan pada November 2025).
Sonnet: Keseimbangan kelajuan dan kecerdasan.
Haiku: Paling pantas dan paling menjimatkan kos untuk tugasan ringan.

Mythos/Capybara memecahkan acuan ini sebagai model yang jauh lebih besar dan lebih intensif dari segi pengkomputeran. Draf catatan blog menyatakan secara jelas ia “lebih besar dan lebih pintar daripada model Opus kami—yang sebelum ini merupakan yang paling berkuasa.” Nama “Mythos” dipilih untuk membangkitkan “tisu penghubung yang mendalam yang menghubungkan pengetahuan dan idea,” menandakan penaakulan yang lebih mendalam dan lebih bersepadu merentas domain.

Ini bukan kemas kini kecil secara bertahap. Jurucakap Anthropic mengesahkan bahawa syarikat itu sedang “membangunkan model tujuan am dengan kemajuan bermakna dalam penaakulan, pengkodan, dan keselamatan siber” dan menganggapnya “satu perubahan ketara dan yang paling berkeupayaan yang pernah kami bina setakat ini.” Latihan telah selesai, dan model itu sudah menjalani ujian dunia sebenar dengan sekumpulan kecil pelanggan akses awal.

Untuk konteks, evolusi Claude adalah pantas. Claude 3 Opus (2024) menetapkan penanda awal, diikuti oleh Claude 3.5 Sonnet, varian Claude 4, dan Opus 4.5/4.6 pada 2025. Mythos kelihatan sebagai pengganti yang logik—berkemungkinan apa yang komuniti telah spekulasi sebagai “Opus 5”—memacu AI termaju ke wilayah baharu sambil menimbulkan persoalan keselamatan yang serius.

Bagaimanakah Claude Mythos Terbocor?

Kebocoran berlaku pada atau sekitar 27 Mac 2026, disebabkan salah konfigurasi kesilapan manusia yang mudah tetapi memalukan dalam sistem pengurusan kandungan (CMS) Anthropic. Hampir 3,000 aset yang belum diterbitkan—termasuk draf catatan blog, imej, PDF, fail audio, dan juga dokumen dalaman—telah diletakkan dalam stor data yang boleh dicari secara umum (kadangkala dipanggil “data lake”).

Aset ditetapkan kepada “public” secara lalai, dengan URL yang mudah diteka. Penyelidik keselamatan Roy Paz (LayerX Security) dan Alexandre Pauwels (University of Cambridge) menemui cache tersebut dan memaklumkan kepada media.

Bahan yang terbocor termasuk:

Dua draf catatan blog yang hampir sama (satu bertajuk untuk “Claude Mythos,” satu lagi “Claude Capybara”).
Data halaman web berstruktur dengan tajuk dan tarikh penerbitan yang dirancang.
Aset pemasaran yang tidak digunakan daripada pelancaran lalu.
PDF dalaman tentang retret CEO khusus jemputan yang dianjurkan oleh CEO Anthropic, Dario Amodei.

Anthropic dengan pantas mengesahkan insiden itu sebagai “kesilapan manusia” dalam konfigurasi CMS dan mengalih keluar akses awam. Tiada bukti yang menunjukkan niat jahat atau kebocoran model weights—hanya dokumen pemasaran dan perancangan yang terdedah.

Peristiwa ini menyerlahkan kelemahan yang semakin meningkat dalam industri AI: iterasi pantas dan dokumentasi dalaman sering mengatasi aliran kerja penerbitan yang selamat. Kebocoran serupa telah berlaku di makmal lain, tetapi yang ini memberikan pandangan yang luar biasa terperinci mengenai model utama yang belum dikeluarkan.

Skor Penanda Aras dan Dakwaan Prestasi yang Bocor

Skor berangka tepat tidak didedahkan dalam draf yang terbocor—Anthropic belum menerbitkan penanda arasmya secara rasmi. Namun begitu, bahasanya jelas dan konsisten merentas kedua-dua versi draf:

“Berbanding model terbaik kami sebelum ini, Claude Opus 4.6, Capybara mendapat skor yang jauh lebih tinggi dalam ujian pengkodan perisian, penaakulan akademik, dan keselamatan siber, antara lain.”

Model itu juga digambarkan sebagai “kini jauh mendahului mana-mana model AI lain dalam keupayaan siber” dan satu yang “menandakan gelombang model yang bakal boleh mengeksploit kerentanan dengan cara yang jauh mengatasi usaha para pembela.”

Apakah sebenarnya yang diukur oleh kategori penanda aras ini?

Pengkodan Perisian (cth., SWE-Bench Verified, HumanEval, LiveCodeBench): Tugasan kejuruteraan perisian dunia sebenar, termasuk pembetulan pepijat, pelaksanaan ciri, dan pemahaman pada peringkat repositori. Opus 4.6 sudah mendahului dalam banyak papan pendahulu pengkodan; lonjakan “dramatik” di sini bermakna Mythos boleh mengendalikan codebase berbilang fail yang kompleks secara autonomi yang kini memerlukan jurutera kanan.
Penaakulan Akademik (cth., GPQA, MMLU-Pro, MATH, FrontierMath): Sains peringkat siswazah, matematik, dan masalah logik berbilang langkah. Peningkatan di sini menandakan penaakulan rantaian pemikiran dan sintesis pengetahuan yang lebih kukuh.
Keselamatan Siber: Penemuan kerentanan, penjanaan eksploit, simulasi red-teaming, dan pengukuhan pertahanan. Ini ialah bidang yang paling ditekankan—dan paling membimbangkan.

Walaupun model Claude terdahulu (Opus 4.5/4.6) mencapai keputusan yang kukuh—cth., Opus 4.5 memperoleh ~80.9% pada SWE-Bench Verified—dakwaan yang terbocor meletakkan Mythos dalam liga yang berbeza secara kualitatif.

Ciri Model dan Profil Teknikal

Di luar penanda aras, draf mendedahkan beberapa ciri penentu:

Skala dan Kos: “Sangat mahal untuk kami sediakan, dan akan sangat mahal untuk pelanggan kami gunakan.” Ini membayangkan bilangan parameter yang besar dan kos inferens yang tinggi, menghadkan ketersediaan awal kepada perusahaan dan kes penggunaan bernilai tinggi.
Kedalaman Penaakulan: Penekanan pada “tisu penghubung yang mendalam” antara domain pengetahuan mencadangkan pemahaman konteks panjang dan sintesis rentas domain yang unggul.
Keupayaan Agen: Akses awal nampaknya menyasarkan organisasi yang memerlukan ejen pengaturcaraan lanjutan dan alat keselamatan siber.
Falsafah Keselamatan Diutamakan: Konsisten dengan pendekatan AI konstitusional Anthropic, syarikat memprioritaskan penilaian risiko—terutamanya dalam keselamatan siber—sebelum keluaran yang lebih luas.

Implikasi Keselamatan Siber: Bendera Merah Terbesar

Elemen paling ketara dalam kebocoran ini ialah amaran Anthropic sendiri tentang potensi kegunaan ganda model itu. Dengan “jauh mendahului” dalam keupayaan siber, Mythos boleh:

Menemui kerentanan zero-day secara autonomi.
Menjana kod eksploit canggih pada skala besar.
Mensimulasikan ancaman berterusan lanjutan (APTs) lebih pantas daripada pembela manusia boleh bertindak balas.

Draf tersebut menyatakan secara jelas syarikat mahu “bertindak dengan lebih berhati-hati” dan berkongsi penemuan dengan pembela siber untuk bersiap sedia menghadapi “gelombang eksploitasi dipacu AI yang bakal tiba.”

Reaksi pasaran adalah serta-merta: saham keselamatan siber merosot pada 27–28 Mac 2026, ketika pelabur mengambil kira risiko bahawa keupayaan ofensif AI boleh mengatasi alat pertahanan.

Ini sejajar dengan trend industri yang lebih luas. OpenAI turut menandakan keupayaan siber tinggi dalam model seperti GPT-5.3-Codex. Insiden dunia sebenar sudah menunjukkan aktor negara (cth., sebuah kumpulan China) menggunakan varian Claude untuk kempen penyusupan. Mythos akan menguatkan ancaman sebegitu.

Sisi positif: Akses awal kepada organisasi pertahanan boleh mempercepat amalan pengkodan selamat, tampalan automatik, dan pemburuan ancaman—berpotensi menjadikan internet lebih selamat dalam jangka panjang.

Jadual Perbandingan: Claude Mythos vs. Model Terdahulu

Aspek	Claude Opus 4.6 (Flagship Semasa)	Claude Mythos / Capybara (Bocor)	Intipati Utama
Tahap	Opus	Tahap “Capybara” baharu (di atas Opus)	Lonjakan seni bina utama
Prestasi Pengaturcaraan	Kukuh (cth., ~80.9% SWE-Bench)	Jauh lebih tinggi	Berpotensi menyaingi atau melebihi produktiviti jurutera kanan
Penaakulan Akademik	Cemerlang	Jauh lebih tinggi	Logik berbilang langkah dan integrasi pengetahuan lebih mendalam
Keselamatan Siber	Mampu (pengimejan kerentanan)	Jauh mendahului mana-mana model semasa	Lonjakan kualitatif; meningkatkan risiko kegunaan ganda
Kos Inferens	Tinggi (harga Opus)	Sangat mahal (lebih tinggi lagi)	Pada peringkat awal untuk perusahaan sahaja
Status Keluaran	Umumnya tersedia	Hanya ujian akses awal	Pengeluaran berperingkat dengan fokus kepada keselamatan
Keupayaan Keseluruhan	Terkini pada 2025	“Perubahan ketara” / “Paling berkuasa setakat ini”	Penanda aras had baharu

Kesimpulan: Sekilas Bocoran ke Era AI Seterusnya

Kebocoran Claude Mythos menawarkan pandangan jarang dan tanpa tapisan tentang peta jalan Anthropic. Ia mengesahkan syarikat telah mencapai “perubahan ketara” sebenar dalam keupayaan teras sambil secara serentak mengakui risiko mendalam—terutamanya dalam keselamatan siber—yang datang bersama kuasa sedemikian. Sama ada dilabel “Opus 5” atau tahap Capybara baharu, Mythos menandakan bahawa AI termaju sedang memasuki fasa di mana keupayaan mengatasi garis masa penggunaan yang selamat.

Sedia untuk mencuba CometAPI? Anda boleh menjadi pengguna kami terlebih dahulu dan mendapat kredit percuma $1, serta menerima pemberitahuan apabila Claude Mythos dilancarkan.