Claude Mythos(Opus 5) Bocor: Apa yang Terjadi dan Apa yang Dapat Diharapkan

CometAPI
AnnaMar 29, 2026
Claude Mythos(Opus 5) Bocor: Apa yang Terjadi dan Apa yang Dapat Diharapkan

Per 29 Maret 2026, kisah “Claude Mythos” kurang tentang peluncuran publik yang sudah selesai dan lebih tentang pratinjau yang bocor atas apa yang tampak sebagai langkah besar Anthropic berikutnya. Perusahaan secara tak sengaja mengekspos konten draf blog dalam cache data yang dapat ditelusuri publik, mengungkapkan model yang belum dirilis yang oleh Anthropic digambarkan sebagai “step change” dan “the most capable we’ve built to date.” Anthropic mengonfirmasi bahwa mereka sedang mengembangkan dan menguji model tersebut dengan sekelompok kecil pelanggan early access.

Hal ini penting karena jajaran model publik Anthropic saat ini masih berpusat pada Claude Opus 4.6, Claude Sonnet 4.6, dan Claude Haiku 4.5. Dengan kata lain, kebocoran ini bukan peluncuran produk publik yang telah dikonfirmasi; ini adalah sekilas bocoran tentang tier berikutnya yang mungkin sedang dipersiapkan Anthropic.

Saat ini, CometAPI sudah menyediakan API untuk model Claude mutakhir, seperti Claude Opus 4.6 dan Claude Sonnet 4.6. Setelah Claude Mythos tersedia di CometAPI, Anda dapat melakukan uji perbandingan terhadap model-model teratas dari Gemini dan OpenAI. CometAPI mengagregasikan model-model terbaik.

Apa itu Claude Mythos?

Claude Mythos adalah model AI paling maju dari Anthropic hingga saat ini, digambarkan dalam dokumen internal yang bocor sebagai “by far the most powerful AI model we’ve ever developed.” Model ini memperkenalkan tier performa baru—secara internal disebut “Capybara”—yang berada di atas lini Opus perusahaan, yang hingga kini mewakili puncak kemampuan Claude.

Keluarga model Anthropic saat ini mengikuti hierarki yang jelas:

  • Opus: Terbesar, paling cakap, dan paling mahal (mis. Claude Opus 4.6 dan Opus 4.5 sebelumnya yang dirilis pada November 2025).
  • Sonnet: Keseimbangan antara kecepatan dan kecerdasan.
  • Haiku: Paling cepat dan paling hemat biaya untuk tugas ringan.

Mythos/Capybara mematahkan pola ini sebagai model yang jauh lebih besar dan lebih intensif komputasi. Draf posting blog secara eksplisit menyatakan bahwa model ini “lebih besar dan lebih cerdas daripada model Opus kami—yang, sampai sekarang, merupakan yang terkuat.” Nama “Mythos” dipilih untuk membangkitkan “jaringan konektif yang mendalam yang mengaitkan pengetahuan dan ide,” menandakan penalaran yang lebih dalam dan lebih terintegrasi lintas domain.

Ini bukan pembaruan inkremental kecil. Juru bicara Anthropic mengonfirmasi bahwa perusahaan sedang “mengembangkan model tujuan umum dengan kemajuan bermakna dalam penalaran, pengodean, dan keamanan siber” dan menganggapnya “sebuah step change dan yang paling cakap yang pernah kami bangun hingga saat ini.” Pelatihan telah selesai, dan model tersebut sudah menjalani pengujian dunia nyata dengan sekelompok kecil pelanggan early access.

Sebagai konteks, evolusi Claude berlangsung cepat. Claude 3 Opus (2024) menetapkan tolok ukur awal, diikuti oleh Claude 3.5 Sonnet, varian Claude 4, dan Opus 4.5/4.6 pada 2025. Mythos tampak sebagai penerus logis—berpotensi apa yang komunitas berspekulasi sebagai “Opus 5”—mendorong AI frontier ke wilayah baru sekaligus menimbulkan pertanyaan serius tentang keselamatan.

Bagaimana Claude Mythos Bocor?

Kebocoran terjadi pada atau sekitar 27 Maret 2026, akibat kesalahan konfigurasi manusia yang sederhana namun memalukan pada sistem manajemen konten (CMS) Anthropic. Hampir 3.000 aset yang belum dipublikasikan—termasuk draf posting blog, gambar, PDF, berkas audio, dan bahkan dokumen internal—tertinggal di sebuah penyimpanan data yang bisa ditelusuri publik (kadang disebut “data lake”).

Aset disetel ke “publik” secara default, dengan URL yang mudah ditebak. Peneliti keamanan Roy Paz (LayerX Security) dan Alexandre Pauwels (University of Cambridge) menemukan cache tersebut dan memberi tahu media.

Materi yang bocor mencakup:

  • Dua draf posting blog yang hampir identik (satu berjudul “Claude Mythos,” lainnya “Claude Capybara”).
  • Data laman web terstruktur dengan heading dan tanggal publikasi yang direncanakan.
  • Aset pemasaran yang tidak terpakai dari peluncuran sebelumnya.
  • Sebuah PDF internal tentang retret CEO khusus undangan yang diselenggarakan oleh CEO Anthropic, Dario Amodei.

Anthropic dengan cepat mengonfirmasi insiden tersebut sebagai “kesalahan manusia” dalam konfigurasi CMS dan mencabut akses publik. Tidak ada bukti yang menunjukkan niat jahat atau kebocoran bobot model—hanya dokumen pemasaran dan perencanaan yang terekspos.

Peristiwa ini menyoroti kerentanan yang kian meningkat di industri AI: iterasi yang cepat dan dokumentasi internal sering kali melampaui alur kerja penerbitan yang aman. Kebocoran serupa pernah terjadi di laboratorium lain, tetapi yang satu ini memberikan wawasan yang sangat rinci tentang model andalan yang belum dirilis.

Skor Benchmark yang Bocor dan Klaim Kinerja

Skor numerik yang tepat tidak diungkap dalam draf yang bocor—Anthropic belum menerbitkan benchmark resmi. Namun, bahasanya tegas dan konsisten di kedua versi draf:

“Dibandingkan dengan model terbaik kami sebelumnya, Claude Opus 4.6, Capybara memperoleh skor yang jauh lebih tinggi pada uji pengodean perangkat lunak, penalaran akademik, dan keamanan siber, di antaranya.”

Model tersebut juga digambarkan sebagai “saat ini jauh di depan model AI lain mana pun dalam kapabilitas siber” dan “menandai gelombang mendatang model yang dapat mengeksploitasi kerentanan dengan cara yang jauh melampaui upaya para pembela.”

Apa sebenarnya yang diukur oleh kategori benchmark ini?

  • Software Coding (mis. SWE-Bench Verified, HumanEval, LiveCodeBench): Tugas rekayasa perangkat lunak dunia nyata, termasuk perbaikan bug, implementasi fitur, dan pemahaman tingkat repositori. Opus 4.6 sudah memimpin di banyak papan peringkat pengodean; lonjakan “dramatis” di sini akan berarti Mythos dapat menangani basis kode kompleks multi-berkas secara otonom yang saat ini memerlukan insinyur senior.
  • Academic Reasoning (mis. GPQA, MMLU-Pro, MATH, FrontierMath): Masalah sains, matematika, dan logika multi-langkah tingkat pascasarjana. Peningkatan di sini menandakan penalaran langkah demi langkah yang lebih kuat dan sintesis pengetahuan yang lebih baik.
  • Cybersecurity: Penemuan kerentanan, pembuatan exploit, simulasi red-teaming, dan penguatan defensif. Ini adalah area yang paling ditekankan—dan paling mengkhawatirkan.

Sementara model Claude sebelumnya (Opus 4.5/4.6) meraih hasil kuat—mis., Opus 4.5 memperoleh ~80.9% pada SWE-Bench Verified—klaim yang bocor menempatkan Mythos pada liga yang berbeda secara kualitatif.

Karakteristik Model dan Profil Teknis

Selain benchmark, draf tersebut mengungkap beberapa ciri penentu:

  • Skala dan Biaya: “Sangat mahal bagi kami untuk melayani, dan akan sangat mahal bagi pelanggan kami untuk menggunakan.” Ini mengisyaratkan jumlah parameter yang masif dan biaya inferensi yang tinggi, membatasi ketersediaan awal untuk kasus penggunaan tingkat perusahaan dan bernilai tinggi.
  • Kedalaman Penalaran: Penekanan pada “jaringan konektif yang mendalam” antar domain pengetahuan menunjukkan pemahaman konteks panjang yang superior dan sintesis lintas domain.
  • Kapabilitas Agen: Akses awal tampaknya ditargetkan ke organisasi yang membutuhkan agen pengodean maju dan alat keamanan siber.
  • Filosofi Keselamatan-utama: Sejalan dengan pendekatan Constitutional AI Anthropic, perusahaan memprioritaskan penilaian risiko—terutama dalam keamanan siber—sebelum peluncuran yang lebih luas.

Implikasi Keamanan Siber: Tanda Peringatan Terbesar

Elemen paling mencolok dari kebocoran ini adalah peringatan Anthropic sendiri tentang potensi guna-ganda model tersebut. Dengan “jauh di depan” dalam kapabilitas siber, Mythos berpotensi:

  • Secara otonom menemukan kerentanan zero-day.
  • Menghasilkan kode exploit canggih dalam skala besar.
  • Mensimulasikan advanced persistent threats (APT) lebih cepat daripada respons pembela manusia.

Draf tersebut secara eksplisit menyatakan bahwa perusahaan ingin “bertindak dengan kehati-hatian ekstra” dan berbagi temuan dengan para pembela siber untuk mempersiapkan “gelombang eksploit yang didorong AI yang akan datang.”

Reaksi pasar berlangsung segera: saham-saham keamanan siber anjlok pada 27–28 Maret 2026, ketika investor memperhitungkan risiko bahwa kapabilitas ofensif AI dapat melampaui alat defensif.

Hal ini selaras dengan tren industri yang lebih luas. OpenAI juga menandai kapabilitas siber tinggi pada model seperti GPT-5.3-Codex. Insiden dunia nyata sudah menunjukkan aktor negara (mis., sebuah kelompok Tiongkok) menggunakan varian Claude untuk kampanye infiltrasi. Mythos akan mempercepat ancaman tersebut.

Sisi positif: Akses awal bagi organisasi defensif dapat mempercepat praktik pengodean aman, penambalan otomatis, dan perburuan ancaman—berpotensi membuat internet lebih aman dalam jangka panjang.

Tabel Perbandingan: Claude Mythos vs. Model Sebelumnya

AspekClaude Opus 4.6 (Andalan Saat Ini)Claude Mythos / Capybara (Bocoran)Inti Penting
TierOpusTier “Capybara” baru (di atas Opus)Lompatan arsitektur besar
Performa PengodeanKuat (mis., ~80.9% SWE-Bench)Jauh lebih tinggiPotensi menyaingi atau melampaui produktivitas insinyur senior
Penalaran AkademikSangat baikJauh lebih tinggiLogika multi-langkah yang lebih dalam dan integrasi pengetahuan lebih kuat
Keamanan SiberMumpuni (deteksi kerentanan)Jauh di depan model apa pun saat iniLompatan kualitatif; meningkatkan risiko guna-ganda
Biaya InferensiTinggi (harga Opus)Sangat mahal (lebih tinggi lagi)Awalnya hanya untuk enterprise
Status RilisTersedia secara umumHanya pengujian early-accessPeluncuran bertahap dengan fokus keselamatan
Kapabilitas KeseluruhanState-of-the-art 2025“Step change” / “Terkuat yang pernah ada”Tolok ukur frontier baru

Kesimpulan: Sekilas Kebocoran Menuju Era AI Berikutnya

Kebocoran Claude Mythos menawarkan pandangan langka dan tanpa filter terhadap peta jalan Anthropic. Ini menegaskan bahwa perusahaan telah mencapai “step change” nyata dalam kapabilitas inti sekaligus mengakui risiko mendalam—terutama dalam keamanan siber—yang menyertai kekuatan tersebut. Apakah dilabeli Opus 5 atau tier Capybara baru, Mythos memberi sinyal bahwa AI frontier memasuki fase di mana kapabilitas melampaui lini masa penerapan yang aman.

Siap mencoba CometAPI? Anda dapat menjadi pengguna kami terlebih dahulu dan mendapatkan kredit gratis $1, serta menerima notifikasi saat Claude Mythos tersedia.

Akses Model Terbaik dengan Biaya Rendah

Baca Selengkapnya