Keluarga Claude Anthropic telah menjadi salah satu benang yang bergerak paling pantas dalam perlumbaan model sempadan 2025. Sejak beberapa minggu lalu, beberapa kebocoran, siaran sosial dan penulisan penyiasatan telah menunjukkan yang akan datang Claude Opus 4.5 (sering dipendekkan kepada “Opus 4.5”) — dirujuk secara dalaman oleh beberapa sumber sebagai Neptun V6 — dan kepada model yang dikongsi dengan pasukan merah luaran untuk ujian jailbreak. Butiran awam masih berpecah-belah, jadi artikel ini mengumpul pelaporan yang tersedia, menerangkan maksud kebocoran tentang keupayaan dan keselamatan, dan memberikan anggaran asas kemungkinan harga dan cara Opus 4.5 mungkin bertindan berbanding Gemini 3 Google and GPT-5.1 OpenAI.
Apakah Claude Opus 4.5?
Ahli keluarga Claude 4.5 sempadan
Anthropic telah menggunakan nama seperti "Opus", "Sonnet" dan "Haiku" untuk menandakan keluarga model dan peringkat kapasiti. Opus telah menjadi label untuk model berkeupayaan tertinggi Anthropic dalam generasi 4.x (cth, Opus 4.1). Sonnet dan Haiku telah digunakan untuk peringkat pertengahan dan lebih kecil masing-masing. Konvensyen penamaan itu menjadikan "Claude Opus 4.5" sebagai calon yang logik untuk keluaran teratas baharu dalam siri Claude 4.5.
“Opus” ialah label Anthropic untuk model berkeupayaan tertinggi dan berkeupayaan tertinggi dalam keluarga Claude 4 — model yang diletakkan untuk tugas penaakulan, penyelidikan dan pengekodan yang paling sukar (Opus 4 dan Opus 4.1 ialah contoh langsung yang paling ketara). Model Opus bertujuan untuk memperdagangkan kos inferens yang lebih tinggi untuk penaakulan konteks panjang yang lebih baik, prestasi pengekodan dan keteguhan pada aliran kerja yang kompleks, dan Anthropic telah menyimpan ciri sejarah seperti pengendalian konteks lanjutan dan mod "pemikiran lebih mendalam" untuk peringkat Opus
Perkara yang diberitahu oleh pengecam kepada kami: "Opus 4.5" dan "Neptune V6"
Dua utas berasingan muncul dalam aliran isyarat awam:
- Pembangun dan ahli komuniti melaporkan melihat pengecam model literal
Opus 4.5muncul secara ringkas dalam permintaan CLI dan perbincangan repositori Kod Claude — jejak kebocoran awal klasik apabila nama dalaman dimasukkan ke dalam log atau PR. - Beberapa cawangan dan siaran komuniti mengatakan nama kod dalaman untuk contoh pembangunan/pasukan merah ialah Neptun V6; Anthropic telah menggunakan nama meja kerja dalaman Neptune secara sejarah untuk gambar pra-keluaran/pasukan merah. Oleh itu, nama Neptune secara munasabah memetakan kepada contoh ujian dalaman tentang produk luaran yang akan dipanggil Claude Opus 4.5.
Pokoknya: isyarat awam menunjukkan Claude Opus 4.5 sebagai ahli berkeupayaan tinggi yang dijangkakan dalam siri Claude 4.5, sedang dalam ujian dan (setakat laporan terkini) dalam pasukan merah aktif. Set isyarat adalah konsisten dan munasabah tetapi tidak setara dengan pengumuman produk rasmi.
Bagaimanakah permukaan bocor dan sejauh manakah ia boleh dipercayai?
Jejak bukti yang boleh dilihat
Tiga corak menghasilkan cerita semasa:
- Pengecam model yang muncul dalam permintaan alatan / tarik pembangun: pemerhati melihat rentetan "Claude Opus 4.5"/"Neptune V6" dalam permintaan tarik CLI Kod Claude atau log perkakas dalaman — penunjuk awal biasa bahawa nama model dalaman telah berhijrah ke aliran kerja yang boleh dilihat. Siaran pendek X/Twitter dan siaran semula seterusnya menandakan penampakan itu kepada komuniti yang lebih luas.
- Reddit dan perbualan komuniti: Subreddit tertumpu Claude telah membincangkan perubahan yang dilaporkan pengguna, ketersediaan Sonnet/Opus dan keanehan dalam prestasi, dan sesetengah pengguna mendakwa mempunyai gambaran sekilas tentang 4.5 varian dalam persekitaran beta mereka. Siaran komuniti bising tetapi berguna sebagai isyarat awal.
- Anthropic Kongsi Model AI Baharu dengan Ahli Pasukan Merah: Tibor Blaho, jurutera utama AIPRM, menyiarkan di X (dahulunya Twitter) bahawa Anthropic menghantar Neptune V6 LLM kepada penguji Pasukan Merah pada hari Selasa. Menariknya, pembocor itu juga menyebut bahawa syarikat AI melancarkan cabaran 10 hari untuk penilai keselamatan luar. Mereka akan menerima ganjaran tambahan jika mereka dapat menemui kaedah jailbreak universal yang disahkan dalam tempoh 10 hari akan datang.
Sejauh manakah anda harus yakin?
Berhati-hati sederhana adalah wajar. Rantaian bukti adalah klasik untuk kebocoran model awal: pengecam dalaman bocor ke dalam alatan atau log, ahli komuniti melihatnya dan wartawan melaporkannya. Corak itu telah mendahului keluaran yang sah pada masa lalu — tetapi ia juga kadangkala menunjukkan kepada percubaan yang bersifat dalaman dan tidak ditakdirkan untuk keluaran awam. Pendek kata: the kewujudan ujian dengan nama kod Neptune dan pengecam Opus 4.5 dalam log boleh dipercayai
Apakah keadaan Claude Opus 4.5 (ciri dan prestasi)?
Apa yang telah ditawarkan oleh Opus 4.1
Daripada pengumuman Anthropic dan dokumen produk: Opus 4.1 meningkatkan aliran kerja agen, pengekodan dunia sebenar dan penaakulan pelbagai langkah yang mantap. Ia terletak di hujung premium keluarga Anthropic dan tersedia melalui API Claude, Kod Claude dan rakan kongsi seperti AWS Bedrock dan Google Vertex AI. Oleh kerana model kelas Opus disasarkan pada tugas kejuruteraan dan perusahaan yang kompleks, model tersebut didatangkan dengan tingkap konteks besar dan lapisan keselamatan/pengawal.
Apa yang dibawakan oleh Sonnet 4.5 yang memberitahu jangkaan untuk Opus 4.5 hipotesis
Soneta 4.5 ditolak keupayaan pengekodan, penggunaan alat agen, dan penaakulan lanjutan — kawasan yang bertindih secara langsung dengan misi Opus. Sonnet 4.5 juga memperkenalkan penambahbaikan dalam matematik dan pengetahuan domain yang berkaitan dengan kewangan dan keselamatan siber; Anthropic merangka Sonnet 4.5 sebagai "model pengekodan terbaik" dan terbaik untuk aliran kerja berasaskan ejen. Itu menjadikannya munasabah untuk menjangkakan mana-mana Opus 4.5 yang akan datang akan meminjam seni bina Sonnet atau penambahbaikan latihan dan menskalakannya untuk rejim berkeupayaan tinggi Opus.
Kemungkinan set ciri Claude Opus 4.5 (disimpulkan)
Jika Opus 4.5 mengikut logik produk peningkatan Opus sebelumnya, kami boleh menjangkakan secara munasabah:
- Penaakulan pelbagai langkah yang lebih kukuh dan "pemikiran lanjutan" secara lalai: rangkaian pemikiran dalaman yang lebih baik, rantaian yang lebih dipercayai untuk perancangan yang kompleks dan orkestrasi berbilang ejen (kawasan Sonnet 4.5 telah diperkukuh).
- Keupayaan pengekodan dan kejuruteraan perisian yang lebih tinggi: lebih sedikit halusinasi dalam kod, penaakulan silang fail yang lebih baik, penampalan pepijat dan penjanaan ujian yang lebih baik, dan tetingkap konteks yang lebih panjang untuk repositori besar — barisan Opus ditujukan secara jelas untuk tugasan ini.
- Penggunaan alat yang lebih baik dan orkestrasi ejen: panggilan alat yang lebih stabil, penyusunan sub-tugas yang lebih baik dan aliran kerja tak segerak (penting untuk ejen gaya Copilot dan penyepaduan "ejen pejabat").
- Ciri keselamatan, pematuhan dan kebolehjelasan perusahaan: pagar yang lebih kukuh, kad sistem dan klasifikasi ASL mencerminkan pendekatan Sonnet 4.5.
- Peningkatan multimodal (mungkin): pemahaman imej / kod / dokumen yang lebih baik untuk aliran kerja bercampur — walaupun Sonnet mengetuai caj itu, Opus boleh meneruskannya.
Jangkaan prestasi
Prestasi yang diukur mungkin akan mengikut corak yang dilihat merentas kemas kini keluarga model: Opus 4.5 akan menyasarkan untuk mengungguli Opus 4.1 dan mencabar atau memadankan kemenangan Sonnet 4.5 dalam pengekodan dan penanda aras agenik—tetapi pada kos yang lebih tinggi bagi setiap token dan disasarkan pada kes penggunaan yang lebih sedikit tetapi lebih mencabar (kejuruteraan perusahaan, penyelidikan dan automasi agen). Jika Sonnet 4.5 meningkatkan pengekodan dan penaakulan dengan ketara, Opus 4.5 akan diletakkan untuk menyampaikan tertinggi kebolehpercayaan dan ketepatan "laluan pertama" terbaik untuk tugasan kritikal misi.
Berapakah kos Claude Opus 4.5?
Apakah caj Anthropic hari ini (H3)
Langganan pengguna awam Anthropic (Claude Pro) dan harga API mereka memberikan panduan terbaik:
- Langganan Pengguna / Pro: Claude Pro disenaraikan di $17/bulan (tahunan) or $20/bulan (bulanan) untuk kegunaan produktiviti individu. Ini memberikan pengguna akses kepada model dan ciri yang lebih tinggi di Claude.ai.
- Harga API / Opus (disahkan untuk Opus 4 / 4.1): Anthropic telah menetapkan kadar API kelas Opus pada kira-kira $15 setiap token input 1M and $75 setiap token keluaran 1M untuk Opus 4 / Opus 4.1 pada 2025 dokumen awam dan pelbagai ringkasan harga. Anthropic juga menawarkan caching segera and kumpulan diskaun (caching segera boleh mengurangkan kos segera berulang secara drastik; pemprosesan kelompok boleh mendapat ~50% pengurangan untuk kerja besar). Kadar Opus tersebut jauh lebih tinggi daripada peringkat Sonnet/Haiku dan mencerminkan kedudukan premium Opus.
Anggaran harga untuk keluaran Opus 4.5
Jika Opus 4.5 dikeluarkan, senario harga yang paling konservatif (dan berkemungkinan) ialah:
Tiada perubahan harga (kemungkinan besar): Anthropic mengekalkan Opus 4.5 pada papak harga Opus yang sama seperti 4.1 — iaitu, ~$15 / $75 setiap juta token — dan mengubah kos sebenar secara beransur-ansur melalui insentif caching/batching. Keluaran Opus 4.1 mengikut sejarah tidak menaikkan harga Opus garis dasar, jadi peningkatan tambahan boleh mengikut corak yang sama.
Bagaimanakah Opus 4.5 (dikabarkan) dibandingkan dengan gemini 3 and GPT-5.1?
(Saya membandingkan dakwaan awam dan penanda aras semasa: Gemini 3 (Google), GPT-5.1 (OpenAI) dan keluarga Opus (Anthropic). Untuk Opus 4.5 saya bergantung pada ekstrapolasi beralasan daripada Opus 4.1 dan Sonnet 4.5.)
Apakah Gemini 3 dan GPT-5.1 sekarang
- Gemini 3 (Google): Google melancarkan Gemini 3 secara terbuka pada November 2025, meletakkannya sebagai model multimodal dan penaakulan yang paling berkuasa setakat ini dengan ciri agenik baharu, penaakulan multimodal (teks/imej/video/audio) yang kukuh dan skor tertinggi pada berbilang penanda aras (LMArena, GPQA, MathArena, siri MMMU). Google sedang menyepadukan Gemini 3 merentas apl Gemini, Google Cloud dan alatan pembangun.
- GPT-5.1 (OpenAI): OpenAI melancarkan GPT-5.1 pada pertengahan November 2025 sebagai peningkatan kepada GPT-5 dengan dua varian: GPT-5.1 Segera (lebih pantas, lebih banyak perbualan) dan GPT-5.1 Berfikir (kegigihan yang lebih kuat pada tugas yang kompleks). OpenAI menekankan peningkatan perbualan, output "lebih panas" dan lebih banyak pilihan pemperibadian pengguna; mereka meletakkan GPT-5.1 sebagai peningkatan berulang kepada GPT-5.
Jangkaan kepala ke kepala
Penaakulan mentah dan kepimpinan penanda aras: keluaran penanda aras awam mencadangkan Gemini 3 menetapkan tanda papan pendahulu baharu merentas beberapa metrik (LMArena Elo, penanda aras multimodal). GPT-5.1 diletakkan sebagai lelaran GPT-5 yang lebih lancar dan lebih berbual dan berfungsi dengan sangat kuat pada tugas yang kompleks; Sonnet 4.5 dan Opus 4.1 kekal berdaya saing dalam tugas pengekodan dan agen. Opus 4.5, jika direalisasikan, mungkin akan ditala untuk mengalahkan Opus 4.1 dalam pengekodan dan kebolehpercayaan, tetapi dakwaan penanda aras awam Gemini 3 mencadangkan Google untuk sementara waktu mempunyai kelebihan pada banyak metrik multimodal dan penaakulan yang canggih.
Pengekodan dan "menggunakan komputer": Anthropic telah menekankan kekuatan pengekodan Sonnet 4.5 dan Sonnet kini digambarkan oleh Anthropic sebagai model pengekodan terbaik dalam banyak ujian; Opus secara sejarah memfokuskan pada pengekodan dan kes penggunaan ejen yang paling sukar. Walau bagaimanapun, Google dan OpenAI melabur banyak dalam alat kod dan platform agenik — Gemini 3 termasuk "pengekodan vibe" dan penyepaduan ejen, dan OpenAI terus mendorong keupayaan kod melalui keluarga GPT.
Aliran kerja multimodal dan agenik: Barisan Gemini Google dari segi sejarah menekankan pemahaman multimodal yang luas (imej, video, audio, teks); Gemini 3 mengulanginya dengan banyak. Keluarga Claude Anthropic telah mengutamakan penggunaan alatan dan keselamatan ejen; Sonnet 4.5 meningkatkan keupayaan agen tetapi Opus 4.1/4.5 dijangka akan ditala lebih ke arah kedalaman dan kebolehpercayaan daripada keluasan multi-media. GPT-5.1 cuba mengimbangi kedua-duanya dengan penekanan pada perbualan dan penyesuaian.
Model mana yang "menang" bergantung pada matlamat produk: kreativiti pelbagai mod dan automasi ekosistem yang besar → Gemini 3; kejuruteraan kritikal misi, pengekodan dan automasi sensitif keselamatan → Opus/Sonnet; penyesuaian perbualan yang meluas → GPT-5.1.
Keputusan akhir: apa yang diharapkan dan cara merancang
Anthropic bergerak pantas: Sonnet 4.5 menyegarkan baki kos dan keupayaan untuk pengekodan dan tugas ejen, dan Opus 4.1 berdiri sebagai model premium semasa untuk kejuruteraan kritikal misi dan orkestrasi ejen. Khabar angin tentang Claude Opus 4.5 adalah munasabah dan konsisten dengan irama keluaran Anthropic — tetapi belum rasmi lagi. Jika/apabila Opus 4.5 dihantar, jangkakan keuntungan tambahan tetapi bermakna berbanding Opus 4.1 dalam penaakulan, kebolehpercayaan pengekodan dan kestabilan ejen; menjangkakan harga kekal dalam papak premium Opus (dengan harga input/output dan peringkat perusahaan yang serupa), dan mengharapkan model itu kekal sebagai pilihan pelaburan tinggi untuk beban kerja keluaran yang berat.
Pembangun boleh mengakses API Pratonton Gemini 3 Pro and API Claude Sonnet 4.5 melalui CometAPI. Untuk memulakan, terokai keupayaan model bagiCometAPI dalam Taman Permainan dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. cometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.
Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !
Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI, ikuti kami VK, X and Perpecahan!
