Apa itu Claude Opus 4.5
Claude Opus 4.5 adalah model bahasa besar (LLM) kelas “Opus” terbaru dari Anthropic dalam keluarga Claude 4.5, dibuat untuk penalaran kompleks, rekayasa perangkat lunak profesional, dan alur kerja berbasis agen yang berjalan lama. Anthropic memposisikan Opus 4.5 sebagai opsi kelas atas yang menyeimbangkan kapabilitas maksimum dengan kinerja praktis serta titik harga yang lebih mudah diakses dibanding rilis Opus sebelumnya. Rilis ini melengkapi keluarga Claude 4.5 bersama Sonnet 4.5 dan Haiku 4.5.
Model family / identifier: Claude Opus 4.5 (API name noted by Anthropic as claude-opus-4-5-20251101).
Fitur inti Claude Opus 4.5
- Tujuan / keunggulan utama: Rekayasa perangkat lunak profesional, agen tingkat lanjut, pemodelan spreadsheet/keuangan, alur kerja multi-giliran yang diperluas, dan “penggunaan komputer” (berinteraksi dengan GUI, spreadsheet, peramban).
- Parameter Effort: Parameter permintaan baru (low / medium / high) yang menukar komputasi/token dengan kedalaman penalaran. Berguna untuk menyetel latensi/biaya vs kelengkapan jawaban.
- Penggunaan komputer & visi yang ditingkatkan: Aksi zoom baru dan pemeriksaan layar/UI yang lebih baik agar model dapat membaca elemen UI halus dan visual detail sebelum mengambil tindakan.
- Keterusan pemikiran: “Thinking block preservation” — Opus 4.5 mempertahankan blok penalaran sebelumnya untuk menjaga kesinambungan sepanjang sesi panjang.
Rincian teknis Claude Opus 4.5
Model identifier: claude-opus-4-5-20251101 (umum digunakan untuk pemanggilan API).
Context window & token limits: input 200,000 tokens / output 64,000 tokens
Modalities: teks, kode, gambar dan masukan dokumen didukung; keluaran berupa teks (terstruktur dan tidak terstruktur). Integrasi mitra menambahkan fitur (prediksi batch, pemanggilan fungsi, caching prompt).
Kinerja benchmark & hasil empiris
Anthropic dan berbagai pihak independen telah menerbitkan/melaporkan hasil benchmark dan perilaku uji untuk Opus 4.5. Berikut klaim dan angka paling menonjol:
- SWE-bench (benchmark rekayasa perangkat lunak) — SWE-bench ≈ 80.9% dalam evaluasi yang dilaporkan Anthropic. Opus 4.5 memimpin di 7/8 bahasa pemrograman pada pengujian SWE-bench Multilingual Anthropic.
- Ketahanan agen di dunia nyata — operasi agen kontinu yang ditingkatkan dan penanganan yang lebih baik pada alur kerja multi-langkah serta orkestrasi alat.
- Aider Polyglot: +10.6% peningkatan vs Sonnet 4.5 pada tugas pengodean kompleks. Anthropic
- Terminal Bench: +15% peningkatan dibanding Sonnet 4.5 dalam alur kerja terminal/kode multi-langkah.
- Vending-Bench (perencanaan horizon panjang): 29% peningkatan dibanding Sonnet 4.5 pada tugas agen horizon panjang.
- Pengodean otonom: Anthropic melaporkan kinerja yang konsisten selama sesi pengodean otonom 30 menit (dibanding model sebelumnya yang menurun lebih awal).
Kasus penggunaan khas dan prioritas
- Rekayasa perangkat lunak kompleks & skrip panjang — generasi kode, debug, refaktor multi-berkas, dan agen pengodean otonom.
- Agen otonom dan orkestrasi alat — merangkai panggilan API, penjelajahan, automasi spreadsheet, dan alur kerja multi-langkah panjang di mana status harus dipertahankan di banyak giliran.
- Sintesis dokumen besar & riset — ringkasan hukum, laporan panjang, penulisan multi-bab, dan perangkuman atas korpus yang sangat besar berkat konteks yang diperluas dan pemadatan.
- Automasi perusahaan — perkakas internal, ekstraksi data dari berkas/spreadsheet, dan agen yang mengoperasikan proses bisnis secara kontinu.
Claude Opus 4.5 vs Gemini 3.0 Pro vs GPT 5.1
| Dimensi | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| Nama model | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| Keunggulan utama | Keandalan agen horizon panjang, efisiensi token, pengodean & orkestrasi multi-agen, fokus pada keamanan. | Penalaran frontier, kinerja multimodal, skor papan peringkat teratas (LMArena, GPQA, MathArena); integrasi Google luas. | Penalaran adaptif, ergonomi pengembang, caching prompt diperluas (24h), interaktivitas cepat dan perkakas pengodean. |
| Harga representatif (input/output per 1M tokens) | $5 / $25 (Anthropic menyatakan Opus 4.5). — harga pratinjau enterprise. | Tingkat pratinjau yang dilaporkan ≈ $2 / $12 atau tingkat lebih tinggi (bervariasi menurut wilayah/rencana). | $1.25 / $10 (harga API GPT-5.1 yang dipublikasikan oleh OpenAI). |
| Konteks / jendela & memori | Fokus pada pemadatan konteks, fitur memori, dan sesi panjang yang efisien; disetel untuk menjalankan multi-agen. | Jendela konteks sangat besar dilaporkan (1M tokens dalam pratinjau) dan masukan multimodal (teks, gambar, audio, video). | Caching prompt diperluas dan penalaran adaptif yang efisien; caching untuk mengurangi biaya & latensi tindak lanjut. |
| Paling cocok untuk | Agen enterprise, alur kerja kode otonom panjang, eksekusi panjang sensitif biaya, lingkungan teregulasi dengan kontrol keamanan. | Riset/benchmark, penalaran multimodal, fitur ekosistem Google terintegrasi (Search/Ads/Apps). | Produk pengembang interaktif, bantuan pengodean berlatensi rendah, alur kerja iteratif yang diuntungkan caching prompt. |
Cara mengakses Claude opus 4.5 API
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim Permintaan ke Claude opus 4.5 API
Pilih endpoint “claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan uji Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah format Anthropic Messages dan format Chat.
Masukkan pertanyaan atau permintaan Anda ke field content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.
Lihat juga Gemini 3 Pro Preview API