Keluarga Claude milik Anthropic telah menjadi salah satu benang yang bergerak paling cepat dalam perlombaan model frontier 2025. Selama beberapa minggu terakhir, sejumlah kebocoran, unggahan sosial, dan tulisan investigatif menyinggung hadirnya Claude Opus 4.5 (sering disingkat “Opus 4.5”) — secara internal dirujuk oleh beberapa sumber sebagai Neptune V6 — dan bahwa model tersebut dibagikan kepada penguji red team eksternal untuk pengujian jailbreak. Rincian publik masih berserak, jadi artikel ini mengumpulkan pelaporan yang tersedia, menjelaskan apa yang diisyaratkan kebocoran tentang kapabilitas dan keselamatan, serta memberikan perkiraan berbasis realita tentang kemungkinan harga dan bagaimana Opus 4.5 mungkin dibandingkan dengan Gemini 3 milik Google dan GPT-5.1 milik OpenAI.
Apa itu Claude Opus 4.5?
Anggota keluarga Claude 4.5 di kelas frontier
Anthropic menggunakan nama seperti “Opus”, “Sonnet”, dan “Haiku” untuk menandai keluarga model dan tingkatan kapasitas. Opus menjadi label untuk model berkapabilitas tertinggi Anthropic dalam generasi 4.x (misalnya, Opus 4.1). Sonnet dan Haiku digunakan untuk tier menengah dan kecil. Konvensi penamaan itu menjadikan “Claude Opus 4.5” kandidat logis untuk rilis kelas atas baru dalam seri Claude 4.5.
“Opus” adalah label Anthropic untuk model berkapsitas dan berkapabilitas tertinggi di keluarga Claude 4 — model yang diposisikan untuk tugas penalaran, riset, dan pengodean paling berat (Opus 4 dan Opus 4.1 adalah contoh live yang paling terlihat). Model Opus dimaksudkan untuk menukar biaya inferensi yang lebih tinggi dengan penalaran konteks panjang yang lebih baik, performa coding yang lebih baik, dan ketangguhan pada alur kerja kompleks, dan Anthropic secara historis menyimpan fitur seperti penanganan konteks yang diperluas dan mode “pemikiran lebih dalam” untuk tier Opus.
Apa yang diisyaratkan pengenal: “Opus 4.5” dan “Neptune V6”
Dua benang terpisah muncul dalam arus sinyal publik:
- Pengembang dan anggota komunitas melaporkan melihat pengenal model literal
Opus 4.5sempat muncul dalam permintaan Claude Code CLI dan diskusi repositori — jejak khas kebocoran dini ketika nama internal “bocor” ke log atau PR. - Beberapa outlet dan unggahan komunitas menyebut nama sandi internal untuk instance pengembangan/red team adalah Neptune V6; Anthropic secara historis menggunakan nama workbench Neptune internal untuk snapshot pra-rilis/red team. Karena itu, nama Neptune wajar dipetakan ke instance pengujian internal dari apa yang secara eksternal akan disebut Claude Opus 4.5.
Intinya: sinyal publik menunjuk bahwa Claude Opus 4.5 adalah anggota berkapabilitas tinggi yang diharapkan dari seri Claude 4.5, saat ini dalam pengujian dan (menurut laporan terbaru) dalam red-teaming aktif. Set sinyal ini konsisten dan masuk akal, tetapi tidak setara dengan pengumuman produk resmi.
Bagaimana kebocoran ini muncul dan seberapa andal?
Jejak bukti yang terlihat
Tiga pola memunculkan kisah saat ini:
- Pengenal model muncul di perkakas pengembang / pull request: pengamat melihat string “Claude Opus 4.5”/“Neptune V6” dalam pull request Claude Code CLI atau log perkakas internal — indikator dini yang lazim bahwa nama model internal telah bermigrasi ke alur kerja yang terlihat. Sebuah unggahan singkat di X/Twitter dan repost berikutnya menandai penampakan itu ke komunitas yang lebih luas.
- Obrolan Reddit dan komunitas: subreddit yang berfokus pada Claude membahas perubahan yang dilaporkan pengguna, ketersediaan Sonnet/Opus dan keanehan dalam kinerja, dan beberapa pengguna mengklaim sempat melihat varian 4.5 di lingkungan beta mereka. Unggahan komunitas memang bising tetapi berguna sebagai sinyal dini.
- Anthropic Shares New AI Model with Red Team Members: Tibor Blaho, lead engineer AIPRM, memposting di X (sebelumnya Twitter) bahwa Anthropic mengirim LLM Neptune V6 kepada penguji Red Team pada hari Selasa. Menariknya, pembocor itu juga menyebut perusahaan AI tersebut meluncurkan tantangan 10 hari bagi penilai keamanan eksternal. Mereka akan menerima hadiah tambahan jika dapat menemukan metode jailbreak universal yang terkonfirmasi dalam 10 hari ke depan.
Seberapa percaya diri seharusnya Anda?
Kewaspadaan moderat tepat. Rantai bukti ini klasik untuk kebocoran model dini: pengenal internal bocor ke perkakas atau log, anggota komunitas menemukannya, lalu jurnalis melaporkannya. Pola itu pernah mendahului rilis yang sah di masa lalu — tetapi sesekali juga menunjuk pada eksperimen internal yang tidak ditujukan untuk rilis publik. Singkatnya: keberadaan tes berkode nama Neptune dan pengenal Opus 4.5 dalam log adalah kredibel.
Seperti apa Claude Opus 4.5 (fitur dan performa)?
Apa yang sudah ditawarkan Opus 4.1
Dari pengumuman Anthropic dan dokumen produk: Opus 4.1 meningkatkan alur kerja agen, coding dunia nyata, dan penalaran multi-langkah yang kokoh. Model ini berada di ujung premium keluarga Anthropic dan tersedia melalui Claude API, Claude Code, serta mitra seperti AWS Bedrock dan Google Vertex AI. Karena model kelas Opus ditargetkan untuk tugas rekayasa dan enterprise yang kompleks, model ini hadir dengan jendela konteks besar dan lapisan keselamatan/guardrail.
Apa yang dibawa Sonnet 4.5 yang menjadi acuan ekspektasi untuk Opus 4.5 hipotetis
Sonnet 4.5 mendorong pada kemampuan coding, penggunaan alat agen, dan penalaran diperluas — area yang secara langsung tumpang tindih dengan misi Opus. Sonnet 4.5 juga memperkenalkan peningkatan dalam matematika dan pengetahuan domain yang relevan untuk finansial dan keamanan siber; Anthropic membingkai Sonnet 4.5 sebagai “model coding terbaik” dan terbaik untuk alur kerja berbasis agen. Ini membuat wajar untuk mengharapkan Opus 4.5 mendatang akan mengadopsi perbaikan arsitektur atau pelatihan Sonnet dan menskalakannya untuk rezim kapabilitas lebih tinggi milik Opus.
Perkiraan set fitur Claude Opus 4.5 (inferensi)
Jika Opus 4.5 mengikuti logika produk dari peningkatan Opus sebelumnya, wajar untuk mengharapkan:
- Penalaran multi-langkah yang lebih kuat dan “pemikiran diperluas” secara default: rantai pemikiran internal yang lebih baik, rantai yang lebih panjang dan andal untuk perencanaan kompleks dan orkestrasi multi-agen (area yang sudah diperkuat Sonnet 4.5).
- Kemampuan coding dan rekayasa perangkat lunak lebih tinggi: lebih sedikit halusinasi dalam kode, penalaran lintas berkas lebih baik, perbaikan bug dan pembuatan pengujian yang lebih baik, serta jendela konteks lebih panjang untuk repositori besar — lini Opus secara eksplisit ditujukan untuk tugas-tugas ini.
- Penggunaan alat dan orkestrasi agen yang lebih baik: pemanggilan alat lebih stabil, orkestrasi sub-tugas dan alur kerja asinkron yang lebih baik (penting untuk agen gaya Copilot dan integrasi “office agent”).
- Fitur keselamatan, kepatuhan, dan keterjelasan untuk enterprise: guardrail yang lebih kuat, system cards dan klasifikasi ASL yang mencerminkan pendekatan Sonnet 4.5.
- Peningkatan multimodal (kemungkinan): pemahaman gambar/kode/dokumen yang lebih baik untuk alur kerja campuran — meski Sonnet memimpin di sana, Opus bisa mendorong lebih jauh.
Ekspektasi performa
Performa terukur kemungkinan mengikuti pola yang terlihat dalam pembaruan keluarga model: Opus 4.5 akan berupaya melampaui Opus 4.1 dan menantang atau menyamai kemenangan Sonnet 4.5 pada tolok ukur coding dan agenik—tetapi dengan biaya per token lebih tinggi dan ditargetkan pada lebih sedikit, namun lebih menuntut, use case (rekayasa enterprise, riset, dan otomasi berbasis agen). Jika Sonnet 4.5 meningkatkan coding dan penalaran secara substansial, Opus 4.5 akan diposisikan untuk menghadirkan reliabilitas tertinggi dan “first pass” correctness terbaik untuk tugas-tugas yang sangat kritis.
Berapa biaya Claude Opus 4.5?
Apa yang Anthropic kenakan hari ini (H3)
Langganan konsumen publik (Claude Pro) dan harga API mereka memberikan panduan terbaik:
- Konsumen / langganan Pro: Claude Pro tercantum $17/bulan (tahunan) atau $20/bulan (bulanan) untuk penggunaan produktivitas individual. Ini memberi konsumen akses ke model dan fitur kelas atas di Claude.ai.
- Harga API / Opus (dikonfirmasi untuk Opus 4 / 4.1): Anthropic menetapkan tarif API kelas Opus sekitar $15 per 1M token input dan $75 per 1M token output untuk Opus 4 / Opus 4.1 dalam dokumen publik 2025 dan berbagai ringkasan harga. Anthropic juga menawarkan diskon prompt caching dan batching (caching prompt dapat memangkas biaya prompt berulang secara drastis; pemrosesan batch dapat memberi pengurangan ~50% untuk pekerjaan besar). Tarif Opus tersebut jauh lebih tinggi daripada tier Sonnet/Haiku dan mencerminkan posisi premium Opus.
Perkiraan harga untuk rilis Opus 4.5
Jika Opus 4.5 dirilis, skenario harga yang paling konservatif (dan mungkin) adalah:
Tidak ada perubahan harga (paling mungkin): Anthropic mempertahankan Opus 4.5 pada slab harga Opus yang sama seperti 4.1 — yaitu, ~$15 / $75 per juta token — dan secara bertahap mengubah biaya aktual melalui insentif caching/batching. Rilis Opus 4.1 secara historis tidak menaikkan harga dasar Opus, jadi peningkatan bertahap dapat mengikuti pola yang sama.
Bagaimana (rumor) Opus 4.5 dibandingkan dengan Gemini 3 dan GPT-5.1?
(Saya membandingkan klaim dan tolok ukur publik saat ini: Gemini 3 (Google), GPT-5.1 (OpenAI), dan keluarga Opus (Anthropic). Untuk Opus 4.5 saya bergantung pada ekstrapolasi beralasan dari Opus 4.1 dan Sonnet 4.5.)
Bagaimana Gemini 3 dan GPT-5.1 saat ini
- Gemini 3 (Google): Google meluncurkan Gemini 3 secara publik pada November 2025, memposisikannya sebagai model multimodal dan penalaran terkuat mereka hingga saat ini dengan fitur agen baru, penalaran multimodal (teks/gambar/video/audio) yang kuat, dan skor tertinggi di banyak tolok ukur (LMArena, GPQA, MathArena, seri MMMU). Google mengintegrasikan Gemini 3 di aplikasi Gemini, Google Cloud, dan perkakas pengembang.
- GPT-5.1 (OpenAI): OpenAI merilis GPT-5.1 pada pertengahan November 2025 sebagai peningkatan atas GPT-5 dengan dua varian: GPT-5.1 Instant (lebih gesit, lebih percakapan) dan GPT-5.1 Thinking (persistensi lebih kuat pada tugas kompleks). OpenAI menekankan peningkatan percakapan, keluaran yang lebih “hangat”, dan lebih banyak opsi personalisasi pengguna; mereka memosisikan GPT-5.1 sebagai peningkatan iteratif atas GPT-5.
Ekspektasi head-to-head
Penalaran mentah dan kepemimpinan tolok ukur: rilis tolok ukur publik menyiratkan Gemini 3 menorehkan skor papan peringkat baru di berbagai metrik (Elo LMArena, tolok ukur multimodal). GPT-5.1 diposisikan sebagai iterasi yang lebih halus dan lebih percakapan dari GPT-5 dan tampil sangat kuat pada tugas kompleks; Sonnet 4.5 dan Opus 4.1 tetap kompetitif pada tugas coding dan agen. Opus 4.5, jika terwujud, kemungkinan disetel untuk mengalahkan Opus 4.1 pada coding dan reliabilitas, tetapi klaim tolok ukur publik Google menyiratkan Gemini 3 sementara unggul di banyak metrik multimodal dan penalaran paling mutakhir.
Coding dan “menggunakan komputer”: Anthropic menekankan kekuatan coding Sonnet 4.5 dan Sonnet kini digambarkan oleh Anthropic sebagai model coding terbaik dalam banyak pengujian; Opus secara historis berfokus pada use case coding dan agen yang paling berat. Meski begitu, Google dan OpenAI berinvestasi besar dalam perkakas kode dan platform agen — Gemini 3 mencakup “vibe coding” dan integrasi agen, dan OpenAI terus mendorong kapabilitas kode melalui keluarga GPT.
Alur kerja multimodal dan agen: lini Gemini dari Google secara historis menekankan pemahaman multimodal yang luas (gambar, video, audio, teks); Gemini 3 mengiterasikannya secara intens. Keluarga Claude dari Anthropic memprioritaskan penggunaan alat dan keselamatan agen; Sonnet 4.5 meningkatkan kapabilitas agen tetapi Opus 4.1/4.5 diperkirakan disetel lebih ke kedalaman dan reliabilitas daripada keluasan multimedia. GPT-5.1 mencoba menyeimbangkan keduanya dengan penekanan pada percakapan dan kustomisasi.
Model mana yang “menang” bergantung pada tujuan produk: kreativitas multimodal dan otomasi ekosistem besar → Gemini 3; rekayasa misi-kritis, coding, dan otomasi sensitif keselamatan → Opus/Sonnet; kustomisasi percakapan yang luas → GPT-5.1.
Putusan akhir: apa yang diharapkan dan bagaimana merencanakan
Anthropic beriterasi cepat: Sonnet 4.5 menyegarkan keseimbangan biaya dan kapabilitas untuk tugas coding dan agen, dan Opus 4.1 berdiri sebagai model premium saat ini untuk rekayasa misi-kritis dan orkestrasi agen. Rumor tentang Claude Opus 4.5 masuk akal dan konsisten dengan irama rilis Anthropic — namun belum resmi. Jika/ketika Opus 4.5 dirilis, harapkan peningkatan bertahap namun bermakna atas Opus 4.1 dalam penalaran, reliabilitas coding, dan stabilitas agen; harapkan harga tetap dalam slab premium Opus (dengan harga input/output serupa dan tier enterprise), dan harapkan model ini tetap menjadi pilihan investasi tinggi untuk beban kerja output yang berat.
Pengembang dapat mengakses Gemini 3 Pro Preview API dan Claude Sonnet 4.5 API melalui CometAPI. Untuk memulai, jelajahi kemampuan model dariCometAPI di Playground dan lihat panduan API untuk instruksi terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.
Siap Meluncur?→ Daftar CometAPI hari ini !
Jika Anda ingin mengetahui lebih banyak tips, panduan, dan berita tentang AI, ikuti kami di VK, X dan Discord!
