Claude Opus 4.5: apakah rasanya — dan berapakah kosnya?

Keluarga Claude milik Anthropic telah menjadi salah satu jaluran paling pantas bergerak dalam perlumbaan model barisan hadapan 2025. Dalam beberapa minggu kebelakangan ini, beberapa kebocoran, hantaran sosial dan tulisan penyiasatan telah menunjuk kepada Claude Opus 4.5 (sering dipendekkan sebagai “Opus 4.5”) — dirujuk secara dalaman oleh sesetengah sumber sebagai Neptune V6 — dan kepada model yang dikongsi dengan ahli Red Team luar untuk ujian jailbreak. Butiran awam masih terpecah-pecah, jadi artikel ini mengumpulkan liputan yang tersedia, menerangkan implikasi kebocoran terhadap keupayaan dan keselamatan, serta memberikan anggaran berasaskan realiti tentang harga yang mungkin dan bagaimana Opus 4.5 dibandingkan dengan Google’s Gemini 3 dan OpenAI’s GPT-5.1.

Apakah Claude Opus 4.5?

Ahli keluarga Claude 4.5 barisan hadapan

Anthropic telah menggunakan nama seperti “Opus”, “Sonnet”, dan “Haiku” untuk menamakan keluarga model dan aras kapasiti. Opus ialah label untuk model berkeupayaan tertinggi dalam generasi 4.x (contohnya, Opus 4.1). Sonnet dan Haiku masing-masing digunakan untuk aras pertengahan dan kecil. Konvensyen penamaan itu menjadikan “Claude Opus 4.5” calon logik untuk keluaran peringkat tertinggi baharu dalam siri Claude 4.5.

“Opus” ialah label Anthropic untuk model berkapasiti dan berkeupayaan paling tinggi dalam keluarga Claude 4 — model yang diposisikan untuk tugasan penaakulan, penyelidikan dan pengkodan paling sukar (Opus 4 dan Opus 4.1 ialah contoh langsung yang paling ketara). Model Opus bertujuan menukar kos inferens yang lebih tinggi kepada penaakulan konteks panjang yang lebih baik, prestasi pengkodan yang lebih baik dan kekukuhan pada aliran kerja kompleks, dan Anthropic secara sejarah menempahkan ciri seperti pengendalian konteks lanjutan dan mod “pemikiran lebih mendalam” untuk aras Opus

Apa yang diberitahu oleh pengecam: “Opus 4.5” dan “Neptune V6”

Dua jejak berasingan muncul dalam arus isyarat awam:

Pembangun dan ahli komuniti melaporkan melihat pengecam model literal Opus 4.5 muncul seketika dalam permintaan Claude Code CLI dan perbincangan repositori — jejak kebocoran awal klasik apabila nama dalaman terkeluar ke dalam log atau PR.
Beberapa saluran dan hantaran komuniti menyatakan nama kod dalaman untuk instans pembangunan/Red Team ialah Neptune V6; Anthropic secara sejarah menggunakan nama bangku kerja Neptune dalaman untuk petikan pratonton/Red Team pra-keluaran. Oleh itu, nama Neptune berkemungkinan memetakan kepada instans ujian dalaman bagi produk luaran yang akan dinamakan Claude Opus 4.5.

Ringkasnya: isyarat awam menunjukkan Claude Opus 4.5 sebagai ahli berkeupayaan tinggi yang dijangka dalam siri Claude 4.5, kini dalam ujian dan (mengikut laporan terkini) dalam Red Team aktif. Set isyarat adalah konsisten dan munasabah tetapi tidak bersamaan dengan pengumuman produk rasmi.

Bagaimana kebocoran itu muncul dan sejauh mana kebolehpercayaannya?

Jejak bukti yang kelihatan

Tiga pola menghasilkan kisah semasa ini:

Pengecam model muncul dalam peralatan pembangun / pull requests: pemerhati perasan rentetan “Claude Opus 4.5”/“Neptune V6” dalam pull request Claude Code CLI atau log peralatan dalaman — penunjuk awal lazim bahawa nama model dalaman telah berhijrah ke aliran kerja yang kelihatan. Satu hantaran X/Twitter pendek dan siaran semula berikutnya memaklumkan penemuan itu kepada komuniti yang lebih luas.
Reddit dan cakap-cakap komuniti: subreddit berfokus Claude membincangkan perubahan dilaporkan pengguna, ketersediaan Sonnet/Opus dan keanehan prestasi, dan sesetengah pengguna mendakwa terlihat varian 4.5 dalam persekitaran beta mereka. Hantaran komuniti bising tetapi berguna sebagai isyarat awal.
Anthropic Shares New AI Model with Red Team Members: Tibor Blaho, jurutera utama AIPRM, menulis di X (dahulunya Twitter) bahawa Anthropic menghantar LLM Neptune V6 kepada penguji Red Team pada hari Selasa. Menariknya, pembocor itu juga menyebut bahawa syarikat AI tersebut melancarkan cabaran 10 hari untuk penilai keselamatan luar. Mereka akan menerima ganjaran tambahan jika dapat menemui kaedah jailbreak universal yang disahkan dalam tempoh 10 hari akan datang.

Sejauh mana keyakinan yang wajar?

Berwaspada secara sederhana adalah wajar. Rantaian bukti ini klasik untuk kebocoran model awal: pengecam dalaman terkeluar ke dalam peralatan atau log, ahli komuniti mengesannya, dan wartawan melaporkannya. Pola itu pernah mendahului keluaran sah pada masa lalu — tetapi kadangkala ia juga merujuk kepada eksperimen dalaman yang tidak ditujukan untuk keluaran awam. Ringkasnya: kewujudan ujian bernama kod Neptune dan pengecam Opus 4.5 dalam log adalah berwibawa

Bagaimanakah rupa Claude Opus 4.5 (ciri dan prestasi)?

Apa yang sudah ditawarkan oleh Opus 4.1

Daripada pengumuman dan dokumen produk Anthropic: Opus 4.1 mempertingkat aliran kerja agen, pengkodan dunia nyata, dan penaakulan berbilang langkah yang teguh. Ia berada pada hujung premium keluarga Anthropic dan tersedia melalui Claude API, Claude Code, dan rakan seperti AWS Bedrock dan Google Vertex AI. Oleh kerana model kelas Opus disasarkan kepada tugas kejuruteraan dan perusahaan yang kompleks, ia hadir dengan tetingkap konteks besar dan lapisan keselamatan/guardrail.

Apa yang dibawa oleh Sonnet 4.5 yang memaklumkan jangkaan untuk Opus 4.5 hipotesis

Sonnet 4.5 menolak had pada keupayaan pengkodan, penggunaan alat berasaskan agen, dan penaakulan lanjutan — bidang yang bertindih secara langsung dengan misi Opus. Sonnet 4.5 juga memperkenalkan penambahbaikan dalam matematik dan pengetahuan domain yang relevan untuk kewangan dan keselamatan siber; Anthropic membingkaikan Sonnet 4.5 sebagai “model pengkodan terbaik” dan terbaik untuk aliran kerja berasaskan agen. Itu menjadikannya munasabah untuk menjangka sebarang Opus 4.5 akan datang akan mengambil pembaikan seni bina atau latihan Sonnet dan menskalakannya ke rejim keupayaan lebih tinggi Opus.

Set ciri Claude Opus 4.5 yang mungkin (inferens)

Jika Opus 4.5 mengikut logik produk peningkatan Opus sebelum ini, kita boleh menjangka secara munasabah:

Penaakulan berbilang langkah dan “pemikiran lanjutan” yang lebih kukuh secara lalai: rantaian pemikiran dalaman yang lebih baik, rantaian yang lebih panjang dan boleh dipercayai untuk perancangan kompleks dan orkestrasi berbilang agen (satu bidang yang telah diperkukuh oleh Sonnet 4.5).
Keupayaan pengkodan dan kejuruteraan perisian yang lebih tinggi: kurang halusinasi dalam kod, penalaran rentas fail yang lebih baik, penampalan pepijat dan penjanaan ujian yang dipertingkat, serta tetingkap konteks lebih panjang untuk repositori besar — garis Opus jelas disasarkan kepada tugasan ini.
Penggunaan alat dan orkestrasi agen yang dipertingkat: panggilan alat yang lebih stabil, orkestrasi sub-tugas dan aliran kerja tak segerak yang lebih baik (penting untuk agen gaya Copilot dan integrasi “agen pejabat”).
Ciri keselamatan, pematuhan dan kebolehjelasan peringkat perusahaan: guardrail yang lebih kukuh, kad sistem dan klasifikasi ASL yang mencerminkan pendekatan Sonnet 4.5.
Peningkatan multimodal (mungkin): kefahaman imej / kod / dokumen yang lebih baik untuk aliran kerja bercampur — walaupun Sonnet memimpin, Opus boleh menolaknya lebih jauh.

Jangkaan prestasi

Prestasi terukur mungkin mengikuti pola peningkatan keluarga model: Opus 4.5 akan menyasarkan untuk mengatasi Opus 4.1 dan mencabar atau menyamai kemenangan Sonnet 4.5 pada penanda aras pengkodan dan agen — tetapi pada kos per token yang lebih tinggi dan disasarkan kepada kes penggunaan yang lebih sedikit tetapi lebih menuntut (kejuruteraan perusahaan, penyelidikan, dan automasi berasaskan agen). Jika Sonnet 4.5 meningkatkan pengkodan dan penaakulan dengan ketara, Opus 4.5 akan diposisikan untuk menyampaikan kebolehpercayaan tertinggi dan ketepatan “lulus pertama” terbaik untuk tugas kritikal misi.

Berapakah kos Claude Opus 4.5?

Caj Anthropic hari ini (H3)

Langganan pengguna awam (Claude Pro) dan harga API mereka menyediakan panduan terbaik:

Langganan Pengguna / Pro: Claude Pro disenaraikan pada $17/bulan (tahunan) atau $20/bulan (bulanan) untuk kegunaan produktiviti individu. Ini memberi pengguna akses kepada model dan ciri aras tinggi di Claude.ai.
Harga API / Opus (disahkan untuk Opus 4 / 4.1): Anthropic menetapkan kadar API kelas Opus sekitar $15 bagi setiap 1M token input dan $75 bagi setiap 1M token output untuk Opus 4 / Opus 4.1 dalam dokumen awam 2025 dan pelbagai ringkasan harga. Anthropic juga menawarkan diskaun prompt caching dan batching (cache prompt boleh mengurangkan kos prompt berulang secara drastik; pemprosesan kelompok boleh memberikan pengurangan ~50% untuk kerja besar). Kadar Opus ini jauh lebih tinggi berbanding aras Sonnet/Haiku dan mencerminkan kedudukan premium Opus.

Anggaran harga untuk keluaran Opus 4.5

Jika Opus 4.5 dikeluarkan, senario harga yang paling konservatif (dan berkemungkinan) ialah:

Tiada perubahan harga (paling berkemungkinan): Anthropic mengekalkan Opus 4.5 pada slab harga Opus yang sama seperti 4.1 — iaitu, ~$15 / $75 setiap sejuta token — dan mengubah kos sebenar secara beransur-ansur melalui insentif caching/batching. Keluaran Opus 4.1 secara sejarah tidak menaikkan harga asas Opus, jadi peningkatan bertahap boleh mengikuti pola yang sama.

Bagaimana Opus 4.5 (khabar angin) dibandingkan dengan Gemini 3 dan GPT-5.1?

(Saya membandingkan tuntutan dan penanda aras awam semasa: Gemini 3 (Google), GPT-5.1 (OpenAI), dan keluarga Opus (Anthropic). Untuk Opus 4.5 saya bergantung pada ekstrapolasi berasas daripada Opus 4.1 dan Sonnet 4.5.)

Kedudukan semasa Gemini 3 dan GPT-5.1

Gemini 3 (Google): Google melancarkan Gemini 3 secara terbuka pada November 2025, memposisikannya sebagai model multimodal dan penaakulan paling berkuasa mereka setakat ini dengan ciri agen baharu, penaakulan multimodal (teks/imej/video/audio) yang kukuh, dan markah teratas pada pelbagai penanda aras (LMArena, GPQA, MathArena, siri MMMU). Google mengintegrasikan Gemini 3 merentas aplikasi Gemini, Google Cloud, dan alat pembangun.
GPT-5.1 (OpenAI): OpenAI meluncurkan GPT-5.1 pada pertengahan November 2025 sebagai naik taraf kepada GPT-5 dengan dua varian: GPT-5.1 Instant (lebih pantas, lebih perbualan) dan GPT-5.1 Thinking (ketekunan lebih kuat pada tugas kompleks). OpenAI menekankan peningkatan perbualan, output yang “lebih mesra”, dan lebih banyak pilihan pemperibadian pengguna; mereka memposisikan GPT-5.1 sebagai peningkatan iteratif kepada GPT-5.

Jangkaan perbandingan terus

Penaakulan mentah dan kepimpinan penanda aras: siaran penanda aras awam mencadangkan Gemini 3 menetapkan tanda aras baharu merentas beberapa metrik (Elo LMArena, penanda aras multimodal). GPT-5.1 diposisikan sebagai iterasi GPT-5 yang lebih lancar, lebih perbualan, dan berprestasi sangat kuat pada tugas kompleks; Sonnet 4.5 dan Opus 4.1 kekal kompetitif pada tugas pengkodan dan agen. Opus 4.5, jika direalisasikan, berkemungkinan ditala untuk mengatasi Opus 4.1 pada pengkodan dan kebolehpercayaan, tetapi tuntutan penanda aras awam Gemini 3 mencadangkan Google memegang kelebihan sementara pada banyak metrik multimodal dan penaakulan termaju.

Pengkodan dan “menggunakan komputer”: Anthropic menekankan kekuatan pengkodan Sonnet 4.5 dan Sonnet kini digambarkan oleh Anthropic sebagai model pengkodan terbaik dalam banyak ujian; Opus secara sejarah memberi tumpuan kepada kes penggunaan pengkodan dan agen paling sukar. Begitu pun, Google dan OpenAI melabur hebat dalam peralatan kod dan platform agen — Gemini 3 termasuk “vibe coding” dan integrasi agen, dan OpenAI terus meningkatkan keupayaan kod melalui keluarga GPT.

Aliran kerja multimodal dan berasaskan agen: Garis Gemini Google secara sejarah menekankan kefahaman multimodal yang luas (imej, video, audio, teks); Gemini 3 mengiterasi perkara itu dengan ketara. Keluarga Claude Anthropic memprioritikan penggunaan alat dan keselamatan agen; Sonnet 4.5 meningkatkan keupayaan agen tetapi Opus 4.1/4.5 dijangka ditala lebih kepada kedalaman dan kebolehpercayaan daripada keluasan media. GPT-5.1 cuba mengimbangi kedua-duanya dengan penekanan pada keperbualan dan penyesuaian.

Model yang “menang” bergantung pada matlamat produk: kreativiti multimodal dan automasi ekosistem besar → Gemini 3; kejuruteraan kritikal misi, pengkodan dan automasi sensitif keselamatan → Opus/Sonnet; penyesuaian perbualan yang meluas → GPT-5.1.

Keputusan akhir: apa yang dijangka dan bagaimana merancang

Anthropic bergerak pantas: Sonnet 4.5 menyusun semula imbangan kos dan keupayaan untuk tugas pengkodan dan agen, dan Opus 4.1 berdiri sebagai model premium semasa untuk orkestrasi kejuruteraan dan agen kritikal misi. Khabar Claude Opus 4.5 adalah munasabah dan konsisten dengan rentak keluaran Anthropic — tetapi belum rasmi. Jika/Apabila Opus 4.5 dilancarkan, jangkakan peningkatan tambahan tetapi bermakna berbanding Opus 4.1 dalam penaakulan, kebolehpercayaan pengkodan, dan kestabilan agen; jangkakan harga kekal dalam slab premium Opus (dengan harga input/output serupa dan tier perusahaan), dan jangkakan model itu kekal sebagai pilihan pelaburan tinggi untuk beban kerja output berat.

Pembangun boleh mengakses Gemini 3 Pro Preview API dan Claude Sonnet 4.5 API melalui CometAPI. Untuk bermula, teroka keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda mengintegrasi.

Sedia untuk bermula?→ Daftar untuk CometAPI hari ini !

Jika anda ingin mengetahui lebih banyak tip, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!