Apa itu Claude Opus 4.5
Claude Opus 4.5 adalah model bahasa besar (LLM) kelas “Opus” terbaru dari Anthropic dalam keluarga Claude 4.5, dibuat untuk penalaran kompleks, rekayasa perangkat lunak profesional, dan alur kerja agen yang berjalan lama. Anthropic memposisikan Opus 4.5 sebagai opsi kelas atas yang menyeimbangkan kapabilitas maksimum dengan kinerja praktis dan harga yang lebih terjangkau dibanding rilis Opus sebelumnya. Rilis ini melengkapi keluarga Claude 4.5 bersama Sonnet 4.5 dan Haiku 4.5.
Keluarga model / pengenal: Claude Opus 4.5 (nama API yang dicatat oleh Anthropic sebagai claude-opus-4-5-20251101).
Fitur inti Claude Opus 4.5
- Tujuan / keunggulan utama: Rekayasa perangkat lunak profesional, agen canggih, pemodelan spreadsheet/keuangan, alur kerja multi-giliran yang diperluas, dan “penggunaan komputer” (berinteraksi dengan GUI, spreadsheet, peramban).
- Parameter effort: Parameter permintaan baru (rendah / sedang / tinggi) yang menukar komputasi/token dengan kedalaman penalaran. Berguna untuk menyetel latensi/biaya vs kelengkapan jawaban.
- Penggunaan komputer & visi yang ditingkatkan: Tindakan zoom baru dan inspeksi layar/UI yang ditingkatkan sehingga model dapat membaca elemen UI halus dan visual detail sebelum mengambil tindakan.
- Kontinuitas berpikir: “Pelestarian blok pemikiran” — Opus 4.5 mempertahankan blok penalaran sebelumnya untuk menjaga kesinambungan selama sesi yang panjang.
Rincian teknis Claude Opus 4.5
Pengenal model: claude-opus-4-5-20251101 (umumnya dirujuk untuk pemanggilan API).
Jendela konteks & batas token: input 200,000 token / output 64,000 token
Modalitas: mendukung input teks, kode, gambar, dan dokumen; output berupa teks (terstruktur dan tidak terstruktur). Integrasi mitra menambahkan fitur (prediksi batch, pemanggilan fungsi, cache prompt).
Kinerja benchmark & hasil empiris
Anthropic dan berbagai pihak independen telah memublikasikan/melaporkan hasil benchmark dan perilaku pengujian untuk Opus 4.5. Berikut klaim dan angka yang paling menonjol:
- SWE-bench (tolok ukur rekayasa perangkat lunak) — SWE-bench ≈ 80.9% dalam evaluasi yang dilaporkan oleh Anthropic. Opus 4.5 memimpin di 7/8 bahasa pemrograman pada pengujian SWE-bench Multilingual milik Anthropic.
- Ketahanan agen di dunia nyata — operasi agen berkelanjutan yang ditingkatkan dan penanganan yang lebih baik untuk alur kerja multi-langkah dan orkestrasi alat.
- Aider Polyglot: peningkatan +10.6% vs Sonnet 4.5 pada tugas pengodean kompleks. Anthropic
- Terminal Bench: peningkatan +15% dibanding Sonnet 4.5 dalam alur kerja terminal/kode multi-langkah.
- Vending-Bench (perencanaan horizon panjang): peningkatan 29% dibanding Sonnet 4.5 pada tugas agen horizon panjang.
- Pengodean otonom: Anthropic melaporkan kinerja yang konsisten selama sesi pengodean otonom 30 menit (dibandingkan model sebelumnya yang menurun lebih awal).
Kasus penggunaan tipikal & prioritas
- Rekayasa perangkat lunak kompleks & skrip panjang — pembuatan kode, debug, refaktor multi-berkas, dan agen pengodean otonom.
- Agen otonom dan orkestrasi alat — merangkai pemanggilan API, penjelajahan, otomatisasi spreadsheet, dan alur kerja multi-langkah yang panjang di mana keadaan harus dipertahankan lintas banyak giliran.
- Sintesis dokumen besar & riset — memo hukum, laporan panjang, penulisan multi-bab, dan peringkasan atas korpora yang sangat besar berkat konteks yang diperluas dan pemadatan.
- Automasi enterprise — alat internal, ekstraksi data dari berkas/spreadsheet, dan agen yang mengoperasikan proses bisnis secara kontinu.
Claude Opus 4.5 vs Gemini 3.0 Pro vs GPT 5.1
| Dimensi | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| Nama model | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| Keunggulan utama | Keandalan agen horizon panjang, efisiensi token, pengodean & orkestrasi multi-agen, fokus pada keamanan. | Penalaran terdepan, kinerja multimodal, skor papan peringkat teratas (LMArena, GPQA, MathArena); integrasi Google yang luas. | Penalaran adaptif, ergonomi pengembang, cache prompt diperpanjang (24h), interaktivitas cepat dan alat pengodean. |
| Harga perwakilan (input/output per 1M token) | $5 / $25 (menurut Anthropic untuk Opus 4.5). — harga pratinjau enterprise. | Tingkatan pratinjau yang dilaporkan ≈ $2 / $12 atau tingkatan lebih tinggi (bervariasi menurut wilayah / plan). | $1.25 / $10 (OpenAI memublikasikan harga API GPT-5.1). |
| Konteks / jendela & memori | Berfokus pada pemadatan konteks, fitur memori, dan sesi panjang yang efisien; disetel untuk menjalankan multi-agen. | Jendela konteks yang sangat besar telah dilaporkan (1M token dalam pratinjau) dan input multimodal (teks, gambar, audio, video). | Cache prompt yang diperluas dan penalaran adaptif yang efisien; caching dimaksudkan untuk mengurangi biaya & latensi untuk tindak lanjut. |
| Paling cocok untuk | Agen enterprise, alur kerja kode otonom yang panjang, eksekusi panjang yang sensitif terhadap biaya, lingkungan teregulasi dengan kontrol keamanan. | Riset/benchmark, penalaran multimodal, fitur ekosistem Google yang terintegrasi (Search/Ads/Apps). | Produk pengembang interaktif, bantuan pengodean berlatensi rendah, alur kerja iteratif yang diuntungkan oleh cache prompt. |
Cara mengakses API Claude opus 4.5
Langkah 1: Daftar untuk kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx lalu kirimkan.
Langkah 2: Kirim permintaan ke API Claude opus 4.5
Pilih endpoint “claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101” untuk mengirim permintaan API dan setel body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumentasi API situs web kami. Situs kami juga menyediakan pengujian Apifox demi kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah format Anthropic Messages dan format Chat.
Masukkan pertanyaan atau permintaan Anda ke kolom content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan verifikasi hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah pemrosesan, API merespons dengan status tugas dan data output.
Lihat juga Gemini 3 Pro Preview API