Cara Menggunakan Claude Opus 4.5 API

CometAPI
AnnaNov 24, 2025
Cara Menggunakan Claude Opus 4.5 API

Anthropic merilis Claude Opus 4.5 pada akhir November 2025 sebagai model kelas Opus yang lebih mumpuni dan efisien, ditujukan untuk rekayasa perangkat lunak profesional, alur kerja agensi, dan tugas-tugas berhorizon panjang. Versi ini tersedia melalui platform pengembang Anthropic dan CometAPI, serta memperkenalkan kontrol API baru (terutama parameter upaya), perkakas penggunaan komputer yang lebih baik, pemikiran yang diperluas, dan peningkatan efisiensi token yang penting dalam produksi.

Di bawah ini adalah panduan praktis dan profesional: apa yang berubah, cara mendapatkan akses, cara menggunakan kontrol baru (usaha, pemikiran yang diperluas, penggunaan alat, penggunaan berkas/komputer), panduan biaya & pengoptimalan, pertimbangan keselamatan/tata kelola, dan pola integrasi dunia nyata.

Apa sebenarnya Claude Opus 4.5 dan mengapa itu penting?

Claude Opus 4.5 adalah anggota keluarga model kelas Opus terbaru dari Anthropic (dirilis 24-25 November 2025) yang berfokus pada kemampuan penalaran dan pengodean yang maksimal sekaligus meningkatkan efisiensi token dan menawarkan kontrol API baru untuk menyeimbangkan biaya vs. ketelitian. Anthropic memposisikan Opus 4.5 sebagai "model paling cerdas" yang pernah dirilisnya, yang ditujukan untuk tugas-tugas rekayasa perangkat lunak yang kompleks, agen yang berjalan lama, otomatisasi spreadsheet/Excel, dan tugas-tugas yang membutuhkan penalaran multi-langkah yang berkelanjutan.

Apa saja pembaruan utama dalam Opus 4.5?

Anthropic merancang Opus 4.5 untuk meningkatkan kedalaman penalaran dan agen perilaku sekaligus memberi pengembang kontrol yang lebih baik atas tradeoff biaya/latensi. Sorotan rilis ini meliputi:

  • Parameter upaya (beta): tombol API kelas satu yang mengontrol berapa banyak “anggaran berpikir” yang dihabiskan Claude untuk sebuah permintaan (umumnya low, medium, high). Ini memengaruhi penalaran, pemanggilan alat, dan token "berpikir" internal sehingga Anda dapat menyesuaikan kecepatan vs. ketelitian per pemanggilan, alih-alih beralih model. Ini adalah kemampuan khas Opus 4.5.
  • Orkestrasi agen dan alat yang lebih baik: Akurasi yang lebih baik dalam memilih alat, pemanggilan alat yang lebih terstruktur, dan alur kerja hasil alat yang lebih andal untuk agen pembangun dan alur kerja multi-langkah. Anthropic mengirimkan dokumen dan panduan SDK untuk alur "penggunaan alat".
  • Token / efisiensi biaya — Anthropic melaporkan pengurangan hingga ~50% dalam penggunaan token untuk beberapa alur kerja vs Sonnet 4.5, ditambah lebih sedikit kesalahan panggilan alat dan lebih sedikit iterasi untuk tugas-tugas rekayasa yang rumit.
  • Kemampuan multimoda yang ditingkatkan: Peningkatan menyeluruh dalam kinerja visual, penalaran, dan matematika.
  • Jendela konteks diperluas hingga 200 ribu token, mendukung percakapan yang mendalam dan panjang serta analisis dokumen yang kompleks.

Kemampuan praktis apa yang meningkat?

Peningkatan kinerja

  • Orkestrasi agen dan alat yang lebih baik: akurasi yang lebih baik dalam memilih alat, pemanggilan alat yang lebih terstruktur, dan alur kerja hasil alat yang lebih andal untuk membangun agen dan alur kerja multi-langkah. Anthropic menyediakan dokumen dan panduan SDK untuk alur "penggunaan alat". Penanganan konteks yang lebih baik, bantuan pemadatan untuk pengoperasian agen yang lama, dan SDK alat terbaik untuk mendaftarkan dan memvalidasi alat menjadikan Opus 4.5 lebih baik untuk membangun agen yang berjalan tanpa pengawasan selama beberapa langkah.
  • Kemampuan multimoda yang ditingkatkan: Peningkatan komprehensif dalam kinerja visual, penalaran, dan matematika.
  • Jendela konteks diperluas hingga 200 ribu token, mendukung percakapan yang mendalam dan panjang serta analisis dokumen yang kompleks.

Pengkodean dan pekerjaan jangka panjang

Opus 4.5 terus didorong oleh tolok ukur untuk tugas-tugas pengkodean; ia mengurangi jumlah iterasi dan kesalahan pemanggilan alat selama pekerjaan yang panjang (migrasi kode, refaktor, penelusuran kesalahan multi-langkah). Laporan awal dan kartu sistem Anthropic mencatat peningkatan kinerja berkelanjutan pada tolok ukur rekayasa dan peningkatan efisiensi yang dramatis dalam alur kerja yang digerakkan oleh alat.

In bangku SWE, Opus 4.5 melaporkan skor terdepan pada tolok ukur rekayasa perangkat lunak (Anthropic mencantumkan 80.9% pada SWE-bench Verified dalam materi peluncuran), dan pelanggan melaporkan peningkatan pada debugging, suntingan multi-file, dan tugas kode cakrawala panjang.

Claude Opus 4.5-SWE-1

Biaya dan Efisiensi

Anthropic merancang Opus 4.5 untuk meningkatkan kedalaman penalaran dan agen perilaku sekaligus memberi pengembang kontrol yang lebih baik atas pertimbangan biaya/latensi:

  • Pengurangan Harga Bandingkan dengan opus 4.1: $5 (input) / $25 (output) per juta token.
  • Peningkatan Penggunaan Token: Rata-rata pengurangan konsumsi sebesar 50–75% dengan tetap mempertahankan kinerja.
  • tombol API kelas satu yang mengontrol berapa banyak “anggaran berpikir” yang dihabiskan Claude untuk sebuah permintaan (umumnya low, medium, high). Ini memengaruhi penalaran, pemanggilan alat, dan token "berpikir" internal sehingga Anda dapat menyesuaikan kecepatan vs. ketelitian per pemanggilan alih-alih beralih model. Ini adalah kemampuan khas Opus 4.5 (Dibandingkan dengan Sonnet 4.5: Upaya Sedang → 76% lebih sedikit token, kinerja yang sebanding; Upaya Tinggi → peningkatan kinerja 4.3%, pengurangan penggunaan token sebesar 48%).

Bagaimana cara mengakses dan menggunakan API Claude Opus 4.5?

Bagaimana saya bisa memperoleh akses dan kunci?

  1. Buat akun Pengembang Antropik/Claude. Daftar di portal pengembang Claude/Anthropic dan buat kunci API melalui Konsol (alur organisasi/admin tersedia untuk tim). API Pesan adalah titik akhir utama untuk interaksi bergaya obrolan/asisten.
  2. Mitra cloud: Opus 4.5 juga tersedia melalui pasar cloud utama Google Vertex AI, API Komet(Platform agregasi API AI, perlu menggunakan autentikasinya)), Di CometAPI, Anda dapat mengakses API Claude opus 4.5 melalui format Pesan Antropik dan format Obrolan.

Bagaimana saya harus mengautentikasi permintaan saya?

Gunakan token pembawa standar: sertakan Authorization: Bearer $_API_KEY header dengan setiap panggilan API. Permintaan berupa JSON melalui HTTPS; API Pesan menerima daftar pesan terstruktur (sistem + pengguna + asisten).

Mulai Cepat — Python (SDK resmi)

Instal SDK:

pip install anthropic

Contoh minimal (sinkron):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Panggilan ini menggunakan pengidentifikasi model Opus 4.5 yang kanonik. Untuk titik akhir yang dikelola penyedia (Vertex, CometAPI, Foundry), ikuti dokumen penyedia untuk membangun klien dan memberikan URL serta kunci penyedia (misalnya, https://api.cometapi.com/v1/messages untuk CometAPI).

Mulai Cepat — Python (CometAPI)

Anda perlu masuk ke CometAPI dan memperoleh kunci.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Bagaimana cara menggunakan yang baru? usaha parameter dan pemikiran yang diperluas?

Apa usaha parameter dan bagaimana cara mengaturnya?

The usaha Parameter adalah kontrol API kelas satu yang diperkenalkan dengan Opus 4.5 yang menyesuaikan jumlah komputasi internal dan anggaran token yang dihabiskan model untuk menghasilkan outputnya. Nilai tipikal adalah low, medium, dan highGunakan untuk menyeimbangkan latensi dan biaya token dengan ketelitian:

  • low — jawaban yang cepat dan hemat token untuk otomatisasi volume tinggi dan tugas rutin.
  • medium —kualitas/biaya yang seimbang untuk penggunaan produksi.
  • high —analisis mendalam, penalaran multi-langkah, atau ketika akurasi paling penting.

Antropik diperkenalkan effort untuk Opus 4.5 (beta). Anda harus menyertakan header beta (misalnya, effort-2025-11-24) dan tentukan output_config: { "effort": "low|medium|high" } (contoh ditunjukkan di bawah). high adalah perilaku default. Menurunkan upaya mengurangi penggunaan token dan latensi, tetapi dapat sedikit mengurangi ketelitian. Gunakan ini untuk tugas-tugas dengan throughput tinggi atau sensitif terhadap latensi.

Contoh:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Kapan harus menggunakan yang mana: menggunakan low untuk jalur otomatis (misalnya, kategorisasi email), medium untuk asisten standar, dan high untuk pembuatan kode, riset mendalam, atau tugas-tugas yang sensitif terhadap risiko. Anthropic menyoroti parameter ini sebagai kontrol utama untuk Opus 4.5.

Dalam uji SWE-bench:

  • Dalam mode Upaya Sedang: kinerja sebanding dengan Sonnet 4.5, tetapi token keluaran berkurang hingga 76%;
  • Dalam mode Upaya Tinggi: kinerja melampaui Soneta 4.5 sekitar 4.3 poin persentase, dan token berkurang hingga 48%.

Claude Opus 4.5-SWE-2

Apa itu Pemikiran Lanjutan dan bagaimana cara menggunakannya?

Pemikiran Lanjutan (juga disebut "pemikiran lanjutan" atau "blok berpikir") memungkinkan model menjalankan rantai pemikiran menengah atau penalaran bertahap sambil secara opsional mempertahankan atau meringkas blok pemikiran internal. API Pesan mendukung perilaku ini dan Antropik menambahkan kontrol untuk mempertahankan blok pemikiran sebelumnya sehingga agen multi-giliran dapat menggunakan kembali penalaran sebelumnya tanpa mengulangi perhitungan ulang yang mahal. Gunakan pemikiran lanjutan ketika tugas memerlukan perencanaan multi-langkah, pemecahan masalah jangka panjang, atau orkestrasi alat.

Bagaimana cara mengintegrasikan alat dan membangun agen dengan Opus 4.5?

Salah satu kekuatan utama Opus 4.5 adalah peningkatan penggunaan alat: tentukan alat di klien Anda, biarkan Claude memutuskan kapan akan memanggil mereka, menjalankan alat, dan mengembalikan tool_result — Claude akan menggunakan hasil tersebut dalam balasan akhirnya. Anthropic menyediakan SDK Agen yang memungkinkan Anda mendaftarkan fungsi alat yang diketik (misalnya, run_shell, call_api, search_docs) yang dapat ditemukan dan dipanggil Claude selama proses berpikir lanjutan. Platform ini mengonversi definisi alat menjadi fungsi yang dapat dipanggil yang dapat dipanggil dan menerima hasil dari model. Beginilah cara Anda membangun alur kerja agen dengan aman (dengan input/output yang terkontrol).

Di bawah ini adalah pola praktis dan contoh Python menyeluruh.

Pola penggunaan alat (konseptual)

  1. Persediaan klien tools metadata dengan nama, deskripsi, dan skema JSON (input_schema).
  2. Model mengembalikan tool_use blok (instruksi terstruktur model untuk memanggil alat tertentu dengan masukan tertentu). Respons API stop_reason mungkin tool_use.
  3. Klien mengeksekusi alat tersebut (kode Anda memanggil API eksternal atau fungsi lokal).
  4. Klien mengirimkan pesan tindak lanjut dengan role:"user" dan tool_result blok konten yang berisi keluaran alat.
  5. Model mengkonsumsi hasil alat dan mengembalikan jawaban akhir atau panggilan alat lebih lanjut.

Alur ini memungkinkan kontrol sisi klien yang aman atas apa yang dieksekusi model (model mengusulkan panggilan alat; Anda mengendalikan eksekusi).

Contoh ujung ke ujung — Python (alat cuaca sederhana)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Bagaimana Anda seharusnya menyusun agen agar dapat diandalkan?

  • Sanitasi masukan alat (hindari penyuntikan lewat perintah).
  • Validasi keluaran alat sebelum mengirimkannya kembali ke model (pemeriksaan skema).
  • Batasi cakupan alat (prinsip hak istimewa paling sedikit).
  • Gunakan alat bantu pemadatan (dari SDK Antropik) untuk menjaga konteks tetap dapat dikelola dalam jangka panjang.

Bagaimana saya harus mendesain perintah dan menyusun pesan untuk Opus 4.5?

Peran pesan dan strategi prapengisian apa yang paling berhasil?

Gunakan pola tiga bagian:

  • System (peran: sistem): instruksi global — nada, pagar pembatas, peran.
  • Asisten (opsional): contoh siap pakai atau konten pengantar.
  • Pengguna (peran: pengguna): permintaan langsung.

Isi pesan sistem terlebih dahulu dengan batasan (format, panjang, kebijakan keamanan, skema JSON jika Anda menginginkan keluaran terstruktur). Untuk agen, sertakan spesifikasi alat dan contoh penggunaan agar Opus 4.5 dapat memanggil alat tersebut dengan benar.

Bagaimana cara menggunakan pemadatan konteks dan penyimpanan sementara prompt untuk menyimpan token?

  • Pemadatan konteks: Memadatkan bagian-bagian percakapan yang lama menjadi ringkasan ringkas yang masih dapat digunakan oleh model. Opus 4.5 mendukung otomatisasi untuk memadatkan konteks tanpa kehilangan blok penalaran kritis.
  • Cache cepat: respons model cache untuk perintah yang berulang (Anthropic menyediakan pola cache perintah untuk mengurangi latensi/biaya).

Kedua fitur ini mengurangi jejak token dari interaksi yang panjang dan direkomendasikan untuk alur kerja agen dan asisten produksi yang berjalan lama.

Penanganan kesalahan dan praktik terbaik

Berikut adalah rekomendasi keandalan dan keselamatan pragmatis untuk integrasi produksi dengan Opus 4.5.

Keandalan & percobaan ulang

  • Menangani batas kecepatan (HTTP 429) dengan kemunduran eksponensial dan jitter (mulai pada 500–1000ms).
  • Idempotensi:untuk panggilan LLM yang tidak bermutasi, Anda dapat mencoba lagi dengan aman, tetapi berhati-hatilah dalam alur kerja di mana model memicu efek samping eksternal (panggilan alat) — hapus duplikat dengan pelacakan tool_use_id atau ID permintaan Anda sendiri.
  • Stabilitas streaming: menangani aliran parsial dan menyambungkan kembali dengan baik; jika terjadi gangguan, lebih baik mencoba ulang seluruh permintaan atau melanjutkan menggunakan status tingkat aplikasi untuk menghindari interaksi alat yang tidak konsisten.

Keamanan & keselamatan

  • Injeksi cepat & keamanan alat: tak pernah Izinkan model untuk langsung mengeksekusi perintah shell atau kode arbitrer tanpa validasi. Selalu validasi masukan alat dan bersihkan keluarannya. Model mengusulkan pemanggilan alat; kode Anda memutuskan apakah akan menjalankannya. Kartu sistem dan dokumen Anthropic menjelaskan batasan penyelarasan dan tingkat keamanan—ikuti untuk domain berisiko tinggi.
  • Penanganan & kepatuhan data: Perlakukan prompt dan input/output alat yang berisi PII atau data yang diatur sesuai dengan kebijakan hukum/kepatuhan Anda. Gunakan kontrol VPC/perusahaan penyedia jika Anda memiliki persyaratan residensi atau audit data yang ketat (Bedrock/Vertex/Founder menyediakan opsi perusahaan).

Observabilitas & pengendalian biaya

  • Metadata permintaan/respons log (bukan konten sensitif mentah kecuali diizinkan) — jumlah token, effort level, latensi, ID model, dan penyedia. Metrik ini penting untuk atribusi biaya dan debugging.
  • Gunakan upaya untuk mengendalikan biaya per panggilan: lebih menyukai low upaya untuk ringkasan rutin atau titik akhir QPS tinggi; gunakan high Upaya untuk debugging atau investigasi mendalam. Pantau kualitas vs. konsumsi token untuk memilih default untuk berbagai titik akhir.

Kesimpulan — Kapan (dan bagaimana) Anda harus memilih Opus 4.5?

Claude Opus 4.5 adalah pilihan alami ketika produk Anda membutuhkan:

  • penalaran multi-langkah yang mendalam (rantai logika, penelitian, atau debugging yang panjang),
  • orkestrasi agen/alat yang kuat (alur kerja kompleks yang memanggil API eksternal), atau
  • bantuan kode tingkat produksi di seluruh basis kode besar.

Secara operasional, gunakan usaha untuk menyesuaikan anggaran per panggilan; andalkan pola penggunaan alat untuk menjaga keamanan eksekusi dan pilih mitra cloud (atau API Anthropic langsung) berdasarkan kebutuhan kepatuhan Anda. Lakukan benchmark dengan korpus Anda sendiri: angka vendor (SWE-bench, dll.) merupakan sinyal yang berguna, tetapi tugas dan data Anda yang sebenarnya menentukan ROI. Demi keamanan, ikuti kartu sistem Opus 4.5 dan berikan batasan pada eksekusi alat dan penanganan PII.

Pengembang dapat mengakses Claude Opus 4.5 API melalui CometAPI. Untuk memulai, jelajahi kemampuan modelAPI Komet dalam tempat bermain dan lihat panduan API untuk instruksi detail. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan mendapatkan kunci API. cometAPI menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.

Siap untuk berangkat?→ Daftar ke CometAPI hari ini !

Jika Anda ingin mengetahui lebih banyak tips, panduan, dan berita tentang AI, ikuti kami di VKX dan Discord!

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%