Cara menggunakan API Claude Opus 4.5

Anthropic melancarkan Claude Opus 4.5 pada akhir November 2025 sebagai model kelas Opus yang lebih berkeupayaan dan cekap, disasarkan kepada kejuruteraan perisian profesional, aliran kerja agen, dan tugasan jangka panjang. Ia tersedia melalui platform pembangun Anthropic dan CometAPI serta memperkenalkan kawalan API baharu (khususnya parameter effort), alat penggunaan komputer yang dipertingkat, Extended Thinking, dan penambahbaikan kecekapan token yang penting untuk persekitaran produksi.

Di bawah ialah panduan profesional yang praktikal: apakah yang berubah, cara mendapatkan akses, cara menggunakan kawalan baharu (effort, Extended Thinking, penggunaan alat, fail/penggunaan komputer), panduan kos & pengoptimuman, pertimbangan keselamatan/tadbir urus, dan corak integrasi dunia sebenar.

Apakah sebenarnya Claude Opus 4.5 dan mengapa ia penting?

Claude Opus 4.5 ialah ahli keluarga model kelas Opus terkini daripada Anthropic (dilancarkan pada 24–25 November 2025) yang memberi tumpuan kepada keupayaan penaakulan dan pengekodan maksimum sambil meningkatkan kecekapan token dan menawarkan kawalan API baharu untuk mengimbangi kos vs. ketelitian. Anthropic memposisikan Opus 4.5 sebagai “model paling pintar” yang pernah dikeluarkannya, menyasarkan tugasan kejuruteraan perisian yang kompleks, agen berjalan lama, automasi hamparan/Excel, dan tugasan yang memerlukan penaakulan berbilang langkah yang berterusan.

Apakah kemas kini utama dalam Opus 4.5?

Anthropic mereka Opus 4.5 untuk meningkatkan kedalaman penaakulan dan tingkah laku agen sambil memberikan pembangun kawalan yang lebih baik ke atas pertukaran kos/kelewatan. Sorotan keluaran:

Parameter effort (beta): tombol API kelas pertama yang mengawal berapa banyak “belanjawan berfikir” yang dibelanjakan Claude untuk sesuatu permintaan (kebiasaannya low, medium, high). Ia mempengaruhi penaakulan, panggilan alat, dan token “pemikiran” dalaman agar anda boleh melaras kelajuan vs. ketelitian per panggilan tanpa menukar model. Ini ialah keupayaan khas Opus 4.5.
Orkestrasi agen dan alat yang lebih baik: ketepatan dipertingkat dalam memilih alat, panggilan alat berstruktur lebih baik dan aliran hasil alat yang lebih mantap untuk membina agen dan saluran paip berbilang langkah. Anthropic menyediakan dokumentasi dan panduan SDK untuk aliran “tool use”.
Kecekapan token/kos — Anthropic melaporkan pengurangan penggunaan token sehingga ~50% untuk sesetengah aliran kerja berbanding Sonnet 4.5, di samping lebih sedikit ralat panggilan alat dan lebih sedikit iterasi untuk tugasan kejuruteraan yang kompleks.
Keupayaan multimodal dipertingkat: peningkatan menyeluruh dalam prestasi visual, penaakulan, dan matematik.
Tingkap konteks diperluas kepada 200K token, menyokong perbualan yang mendalam dan panjang serta analisis dokumen yang kompleks.

Apakah keupayaan praktikal yang dipertingkat?

Naik taraf prestasi

Orkestrasi agen dan alat yang lebih baik: ketepatan dipertingkat dalam memilih alat, panggilan alat berstruktur lebih baik dan aliran hasil alat yang lebih mantap untuk membina agen dan saluran paip berbilang langkah. Anthropic menyediakan dokumentasi dan panduan SDK untuk aliran “tool use”. Pengendalian konteks yang dipertingkat, pembantu pemadatan untuk larian agen panjang, dan SDK alat kelas pertama untuk mendaftar serta mengesahkan alat menjadikan Opus 4.5 lebih sesuai untuk membina agen yang berjalan tanpa pengawasan untuk banyak langkah.
Keupayaan multimodal dipertingkat: peningkatan menyeluruh dalam prestasi visual, penaakulan, dan matematik.
Tingkap konteks diperluas kepada 200K token, menyokong perbualan yang mendalam dan panjang serta analisis dokumen yang kompleks.

Pengekodan dan kerja jangka panjang

Opus 4.5 terus dipacu tanda aras untuk tugasan pengekodan; ia mengurangkan bilangan iterasi dan ralat panggilan alat semasa kerja panjang (pemindahan kod, pengubahsuaian, penyahpepijatan berbilang langkah). Laporan awal dan kad sistem Anthropic menyatakan prestasi berkekalan yang dipertingkat pada tanda aras kejuruteraan dan peningkatan kecekapan yang ketara dalam saluran paip berasaskan alat.

Dalam SWE-bench, Opus 4.5 melaporkan skor teratas pada tanda aras kejuruteraan perisian (Anthropic menyenaraikan 80.9% pada SWE-bench Verified dalam bahan pelancaran), dan pelanggan melaporkan penambahbaikan pada penyahpepijatan, suntingan berbilang fail, dan tugasan kod jangka panjang.

Claude Opus 4.5-SWE-1

Kos dan Kecekapan

Anthropic mereka Opus 4.5 untuk meningkatkan kedalaman penaakulan dan tingkah laku agen sambil memberikan pembangun kawalan yang lebih baik ke atas pertukaran kos/kelewatan:

Pengurangan Harga Berbanding opus 4.1: $5 (input) / $25 (output) setiap sejuta token.
Penambahbaikan Penggunaan Token: Pengurangan purata 50–75% dalam penggunaan sambil mengekalkan prestasi.
tombol API kelas pertama yang mengawal berapa banyak “belanjawan berfikir” yang dibelanjakan Claude untuk sesuatu permintaan (kebiasaannya low, medium, high). Ia mempengaruhi penaakulan, panggilan alat, dan token “pemikiran” dalaman agar anda boleh melaras kelajuan vs. ketelitian per panggilan tanpa menukar model. Ini ialah keupayaan khas Opus 4.5 (Berbanding Sonnet 4.5: Medium Effort → 76% kurang token, prestasi setanding; High Effort → peningkatan prestasi ~4.3 mata peratusan, pengurangan penggunaan token 48%).

Bagaimanakah saya mengakses dan menggunakan API Claude Opus 4.5?

Bagaimanakah saya mendapatkan akses dan kunci?

Cipta akaun Pembangun Anthropic / Claude. Daftar di portal pembangun Claude/Anthropic dan cipta kunci API melalui Konsol (aliran organisasi/pentadbir wujud untuk pasukan). Messages API ialah titik akhir utama untuk interaksi gaya sembang/pembantu.
Rakan kongsi awan: Opus 4.5 juga tersedia melalui pasar awan utama Google Vertex AI, CometAPI (platform agregasi API AI, perlu menggunakan pengesahannya). Dalam CometAPI, anda boleh mengakses API Claude opus 4.5 melalui format Anthropic Messages dan format Chat.

Bagaimanakah saya harus mengesahkan permintaan saya?

Gunakan token bearer piawai: sertakan pengepala Authorization: Bearer $_API_KEY dengan setiap panggilan API. Permintaan ialah JSON melalui HTTPS; Messages API menerima senarai mesej berstruktur (system + user + assistant).

Permulaan Pantas — Python (SDK rasmi)

Pasang SDK:

pip install anthropic

Contoh minimum (segerak):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Panggilan ini menggunakan pengecam model Opus 4.5 kanonik. Untuk titik akhir yang diurus penyedia (Vertex, CometAPI, Foundry) ikut dokumentasi penyedia untuk membina klien dan membekalkan url dan kunci penyedia (cth., https://api.cometapi.com/v1/messages untuk CometAPI).

Permulaan Pantas — Python (CometAPI)

Anda perlu log masuk ke CometAPI dan mendapatkan kunci.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Bagaimanakah saya menggunakan parameter effort baharu dan Extended Thinking?

Apakah parameter effort dan bagaimana saya menetapkannya?

Parameter effort ialah kawalan API kelas pertama yang diperkenalkan dengan Opus 4.5 yang melaras berapa banyak pengiraan dalaman dan belanjawan token yang dibelanjakan model untuk menghasilkan keluarannya. Nilai lazim ialah low, medium, dan high. Gunakannya untuk mengimbangi kelewatan dan kos token berbanding ketelitian:

low — jawapan pantas, cekap token untuk automasi volum tinggi dan tugasan rutin.
medium — kualiti/kos seimbang untuk kegunaan produksi.
high — analisis mendalam, penaakulan berbilang langkah, atau apabila ketepatan paling penting.

Anthropic memperkenalkan effort untuk Opus 4.5 (beta). Anda mesti menyertakan pengepala beta (cth., effort-2025-11-24) dan menentukan output_config: { "effort": "low|medium|high" } (contoh di bawah). high ialah lalai. Menurunkan effort mengurangkan penggunaan token dan kelewatan tetapi boleh sedikit mengurangkan ketelitian. Gunakannya untuk tugasan ber-throughput tinggi atau sensitif kelewatan.

Contoh:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Bila hendak guna yang mana: guna low untuk saluran paip automatik (cth., pengkategorian e-mel), medium untuk pembantu standard, dan high untuk penjanaan kod, penyelidikan mendalam, atau tugasan berisiko tinggi. Anthropic menyerlahkan parameter ini sebagai kawalan utama untuk Opus 4.5.

Dalam ujian SWE-bench:

Dalam mod Medium Effort: prestasi setanding dengan Sonnet 4.5, tetapi token output dikurangkan 76%;

Dalam mod High Effort: prestasi melebihi Sonnet 4.5 kira-kira 4.3 mata peratusan, dan token dikurangkan 48%.

Claude Opus 4.5-SWE-2

Apakah Extended Thinking dan bagaimana saya memanggilnya?

Extended Thinking (juga dipanggil “extended thinking” atau “thinking blocks”) membolehkan model melakukan rantaian pemikiran perantaraan atau penaakulan berperingkat sambil secara pilihan mengekalkan atau meringkaskan blok pemikiran dalaman. Messages API menyokong tingkah laku ini dan Anthropic menambah kawalan untuk mengekalkan blok pemikiran sebelumnya supaya agen berbilang pusingan boleh menggunakan semula penaakulan terdahulu tanpa mengulangi pengiraan yang mahal. Gunakan Extended Thinking apabila tugasan memerlukan perancangan berbilang langkah, penyelesaian masalah jangka panjang, atau orkestrasi alat.

Bagaimanakah saya mengintegrasi alat dan membina agen dengan Opus 4.5?

Salah satu kekuatan utama Opus 4.5 ialah penggunaan alat yang dipertingkat: takrifkan alat dalam klien anda, biarkan Claude memutuskan bila untuk memanggilnya, jalankan alat tersebut, dan kembalikan tool_result — Claude akan menggunakan keputusan itu dalam jawapan akhirnya. Anthropic menyediakan SDK Agen yang membolehkan anda mendaftarkan fungsi alat bertip (cth., run_shell, call_api, search_docs) yang boleh ditemui dan dipanggil oleh Claude semasa Extended Thinking. Platform menukar definisi alat kepada fungsi boleh panggil yang boleh dipanggil model dan menerima hasilnya. Inilah cara anda membina aliran kerja agen dengan selamat (dengan input/keluaran terkawal).

Di bawah ialah corak praktikal dan contoh Python hujung ke hujung.

Corak penggunaan alat (konseptual)

Klien membekalkan metadata tools dengan nama, keterangan, dan skema JSON (input_schema).
Model memulangkan blok tool_use (arahan berstruktur model untuk memanggil alat tertentu dengan input khusus). Medan stop_reason dalam respons API mungkin tool_use.
Klien melaksanakan alat (kod anda memanggil API luaran atau fungsi setempat).
Klien menghantar mesej susulan dengan role:"user" dan blok kandungan tool_result yang mengandungi output alat.
Model menggunakan hasil alat dan mengembalikan jawapan akhir atau panggilan alat lanjut.

Aliran ini membolehkan kawalan sisi klien yang selamat terhadap apa yang dilaksanakan oleh model (model mencadangkan panggilan alat; anda mengawal pelaksanaannya).

Contoh hujung ke hujung — Python (alat cuaca ringkas)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Bagaimanakah anda harus menyusun agen untuk kebolehpercayaan?

Sanitiskan input alat (elakkan suntikan melalui prompt).
Sahkan output alat sebelum memberikannya kembali kepada model (semakan skema).
Hadkan skop alat (prinsip keistimewaan minimum).
Guna pembantu pemadatan (daripada SDK Anthropic) untuk memastikan konteks terkawal sepanjang larian panjang.

Bagaimanakah saya harus mereka bentuk prompt & menyusun mesej untuk Opus 4.5?

Peranan mesej dan strategi praisi yang manakah berfungsi dengan baik?

Gunakan corak tiga bahagian:

System (role: system): arahan global — nada, pengawal selia, peranan.
Assistant (pilihan): contoh siap sedia atau kandungan pemplastik.
User (role: user): permintaan serta-merta.

Praisi mesej sistem dengan kekangan (format, panjang, dasar keselamatan, skema JSON jika anda mahukan keluaran berstruktur). Untuk agen, sertakan spesifikasi alat dan contoh penggunaan supaya Opus 4.5 boleh memanggil alat tersebut dengan betul.

Bagaimanakah saya menggunakan pemadatan konteks dan cache prompt untuk menjimatkan token?

Pemadatan konteks: mampatkan bahagian perbualan yang lebih lama ke dalam ringkasan padat yang masih boleh digunakan model. Opus 4.5 menyokong automasi untuk memadatkan konteks tanpa kehilangan blok penaakulan kritikal.
Cache prompt: cache respons model untuk prompt berulang (Anthropic menyediakan corak cache prompt untuk mengurangkan kelewatan/kos).

Kedua-dua ciri mengurangkan jejak token interaksi panjang dan disyorkan untuk aliran kerja agen berjalan lama dan pembantu produksi.

Pengendalian ralat dan amalan terbaik

Di bawah ialah cadangan kebolehpercayaan dan keselamatan yang pragmatik untuk integrasi produksi dengan Opus 4.5.

Kebolehpercayaan & percubaan semula

Tangani had kadar (HTTP 429) dengan sandaran eksponen dan jitter (mulakan pada 500–1000ms).
Idempotensi: untuk panggilan LLM tidak memutasi anda boleh cuba semula dengan selamat, tetapi berhati-hati dalam aliran kerja di mana model mencetuskan kesan sampingan luaran (panggilan alat) — nyahgandakan dengan menjejak tool_use_id atau ID permintaan anda sendiri.
Kestabilan penstriman: tangani aliran separa dan sambung semula dengan baik; jika gangguan berlaku, lebih baik cuba semula keseluruhan permintaan atau sambung menggunakan keadaan peringkat aplikasi untuk mengelakkan interaksi alat yang tidak konsisten.

Sekuriti & keselamatan

Suntikan prompt & keselamatan alat: jangan sekali-kali membenarkan model melaksanakan arahan shell atau kod sewenang-wenangnya tanpa pengesahan. Sentiasa sahkan input alat dan sanitiskan output. Model mencadangkan panggilan alat; kod anda memutuskan untuk menjalankannya. Kad sistem dan dokumentasi Anthropic menerangkan kekangan penjajaran dan tahap keselamatan — ikutinya untuk domain berisiko tinggi.
Pengendalian data & pematuhan: kendalikan prompt dan input/keluaran alat yang mengandungi PII atau data dikawal menurut dasar perundangan/pematuhan anda. Gunakan kawalan VPC/enterprise penyedia jika anda mempunyai keperluan kediaman data atau audit yang ketat (Bedrock / Vertex / Foundry menyediakan pilihan enterprise).

Pemerhatian & kawalan kos

Log metadata permintaan/respons (bukan kandungan sensitif mentah kecuali dibenarkan) — kiraan token, aras effort, kelewatan, ID model, dan penyedia. Metrik ini penting untuk pengenaan kos dan nyahpepijat.
Guna effort untuk mengawal kos per panggilan: utamakan low untuk ringkasan rutin atau titik akhir QPS tinggi; gunakan high untuk penyahpepijatan mendalam atau siasatan. Pantau kualiti vs. penggunaan token untuk memilih lalai bagi titik akhir berbeza.

Kesimpulan — Bila (dan bagaimana) anda harus memilih Opus 4.5?

Claude Opus 4.5 ialah pilihan semula jadi apabila produk anda memerlukan:

penaakulan berbilang langkah yang mendalam (rantai logik panjang, penyelidikan, atau penyahpepijatan),
orkestrasi agen/alat yang mantap (aliran kerja kompleks yang memanggil API luaran), atau
bantuan kod gred produksi merentas pangkalan kod besar.

Secara operasi, gunakan effort untuk melaras belanjawan per panggilan; gunakan corak penggunaan alat untuk mengekalkan keselamatan pelaksanaan dan pilih rakan awan (atau API Anthropic terus) berdasarkan keperluan pematuhan anda. Uji tanda aras dengan korpus anda sendiri: angka vendor (SWE-bench dll.) ialah isyarat berguna tetapi tugasan dan data sebenar anda menentukan ROI. Untuk keselamatan, ikut kad sistem Opus 4.5 dan letakkan pengawal selia di sekitar pelaksanaan alat dan pengendalian PII.

Pembangun boleh mengakses Claude Opus 4.5 API melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.

Sedia untuk bermula? → Daftar CometAPI hari ini!

Jika anda mahu mengetahui lebih banyak tip, panduan dan berita AI, ikuti kami di VK, X dan Discord!