Berikut cara menggunakan Thinking Mode dalam Claude (termasuk jika tersedia pada Claude 4.5): - Apa itu Thinking Mode - Mengalokasikan “reasoning tokens” tambahan agar model berfikir lebih mendalam untuk tugas sukar. - Hasil biasanya lebih tepat pada masalah kompleks, tetapi respons sedikit lebih perlahan dan penggunaan kuota lebih tinggi. - Di aplikasi web Claude 1. Buka chat baharu dan pilih model Claude 4.5 (jika tersedia). 2. Cari suis “Thinking” (ikon otak) berhampiran kotak mesej, kemudian hidupkan. 3. Tulis arahan yang jelas dan berstruktur; minta langkah demi langkah jika perlu (contoh: “Terangkan langkah penyelesaian.”). 4. Hantar dan semak hasil. Matikan Thinking apabila tugas mudah untuk jimat kuota. - Melalui API (garis panduan umum) - Gunakan parameter yang mengaktifkan “thinking” dan tetapkan bajet reasoning tokens yang sesuai. - Pastikan memilih model yang menyokong Thinking, serta menetapkan max_tokens dan tetapan lain seperti biasa. - Rujuk dokumentasi API Claude terkini untuk nama parameter dan nilai tepat. - Bila sesuai guna Thinking Mode - Penyelesaian masalah berbilang langkah (matematik/algoritma). - Perancangan, analisis mendalam, atau penulisan teknikal kompleks. - Pengaturcaraan dan nyahpepijat (debugging) yang memerlukan penalaran sistematik. - Petua ringkas - Berikan konteks, kekangan, dan kriteria kejayaan yang jelas. - Minta struktur output (contoh: “Ringkaskan kepada poin bernombor.”). - Jika respons terlalu panjang atau lambat, kurangkan skop arahan atau matikan Thinking. - Penyelesaian masalah biasa - Tiada suis Thinking: ciri mungkin memerlukan pelan Pro/Team atau belum tersedia dalam wilayah/akaun anda. - Had kadar/kuota cepat habis: kurangkan bajet reasoning atau gunakan mod biasa untuk tugas ringkas.

CometAPI
AnnaJan 3, 2026
Berikut cara menggunakan Thinking Mode dalam Claude (termasuk jika tersedia pada Claude 4.5):

- Apa itu Thinking Mode
  - Mengalokasikan “reasoning tokens” tambahan agar model berfikir lebih mendalam untuk tugas sukar.
  - Hasil biasanya lebih tepat pada masalah kompleks, tetapi respons sedikit lebih perlahan dan penggunaan kuota lebih tinggi.

- Di aplikasi web Claude
  1. Buka chat baharu dan pilih model Claude 4.5 (jika tersedia).
  2. Cari suis “Thinking” (ikon otak) berhampiran kotak mesej, kemudian hidupkan.
  3. Tulis arahan yang jelas dan berstruktur; minta langkah demi langkah jika perlu (contoh: “Terangkan langkah penyelesaian.”).
  4. Hantar dan semak hasil. Matikan Thinking apabila tugas mudah untuk jimat kuota.

- Melalui API (garis panduan umum)
  - Gunakan parameter yang mengaktifkan “thinking” dan tetapkan bajet reasoning tokens yang sesuai.
  - Pastikan memilih model yang menyokong Thinking, serta menetapkan max_tokens dan tetapan lain seperti biasa.
  - Rujuk dokumentasi API Claude terkini untuk nama parameter dan nilai tepat.

- Bila sesuai guna Thinking Mode
  - Penyelesaian masalah berbilang langkah (matematik/algoritma).
  - Perancangan, analisis mendalam, atau penulisan teknikal kompleks.
  - Pengaturcaraan dan nyahpepijat (debugging) yang memerlukan penalaran sistematik.

- Petua ringkas
  - Berikan konteks, kekangan, dan kriteria kejayaan yang jelas.
  - Minta struktur output (contoh: “Ringkaskan kepada poin bernombor.”).
  - Jika respons terlalu panjang atau lambat, kurangkan skop arahan atau matikan Thinking.

- Penyelesaian masalah biasa
  - Tiada suis Thinking: ciri mungkin memerlukan pelan Pro/Team atau belum tersedia dalam wilayah/akaun anda.
  - Had kadar/kuota cepat habis: kurangkan bajet reasoning atau gunakan mod biasa untuk tugas ringkas.

“Thinking mode” (juga disebut extended thinking, thinking, atau thinking blocks) dalam Claude 4.5 ialah mod operasi yang jelas dan boleh dikonfigurasi yang mengarahkan model untuk meluangkan sejumlah token yang dibajetkan secara berasingan bagi menghasilkan penaakulan dalaman langkah demi langkah (“chain-of-thought”) sebelum mengeluarkan jawapan akhir. Ia direka untuk meningkatkan prestasi pada penaakulan berbilang langkah, pengekodan kompleks dan aliran kerja beragen, serta tugasan penyelidikan dengan menukar kependaman dan kos token kepada pertimbangan dalaman yang lebih mendalam. Claude 4.5 mendedahkan keupayaan ini pada tahap Messages API dengan parameter eksplisit (cth., thinking / budget_tokens atau pengepala effort/“interleaved-thinking”), mengekalkan dan secara pilihan menyulitkan blok pemikiran untuk pengesahan atau kegunaan alat kemudian, serta memperkenalkan tingkah laku cache dan perakaunan token yang mesti anda urus semasa membina beban kerja produksi.

Apakah Claude 4.5? (Dan model mana yang patut saya ambil peduli?)

Claude 4.5 ialah set model Claude terkini daripada Anthropic yang dikeluarkan sebagai kemas kini “4.5” berperingkat (contohnya, Sonnet 4.5 dan Opus 4.5). Sonnet 4.5 diposisikan sebagai keseimbangan terbaik kecerdasan, prestasi pengekodan dan kebolehan beragen untuk kebanyakan pembangun; Opus 4.5 memfokuskan pada penaakulan usaha tinggi dan mengekalkan blok pemikiran untuk meningkatkan kesinambungan berbilang pusingan. Kedua-dua model menyokong keupayaan pemikiran lanjutan Claude, walaupun sebahagian tingkah laku (cth., pemikiran yang diringkaskan vs penuh) berbeza mengikut model.

Kelebihan prestasi dalam Claude 4.5, khususnya dalam Sonnet 4.5, paling ketara dalam penanda aras SWE-bench Verified, yang mengukur kemampuan AI menyelesaikan isu GitHub dunia nyata.

ModelSkor SWE-bench VerifiedOSWorld (Penggunaan Komputer)
Claude 3.5 Sonnet49.0%42.2%
Claude 4.1 Opus67.6%55.0%
Claude 4.5 Sonnet (Thinking On)77.2%61.4%
GPT-5 (Medium Reasoning)65.0%52.0%

Angka ini menunjukkan bahawa Claude 4.5 bukan sekadar lebih baik menulis snippet; ia jauh lebih berkeupayaan menavigasi keseluruhan sistem fail dan melaksanakan tugasan autonomi tanpa campur tangan manusia.

Mengapa ini penting

  • Pengekodan & agen: Sonnet 4.5 menunjukkan peningkatan kukuh pada tugasan perisian dunia nyata dan kerja pengekodan jangka panjang—menjadikannya pilihan semula jadi untuk penjanaan kod, penyuntingan kod, dan aliran agen autonomi.
  • Pemikiran lanjutan & konteks: Model keluarga Claude 4.5 dibina untuk berfikir dengan “scratchpad” dalaman yang sangat besar (puluhan ribu token atau lebih), membolehkan penaakulan berbilang langkah yang lebih mendalam. Ini mengubah cara anda mereka bentuk prompt, bajet token, dan interaksi alat.

Apakah Thinking Mode dalam Claude 4.5?

Thinking Mode (secara rasmi disebut "Extended Thinking") ialah keupayaan yang membolehkan model “menunjukkan kerjanya” kepada dirinya sendiri sebelum menghasilkan output akhir. Tidak seperti model standard yang segera komited kepada jawapan, Claude 4.5 menggunakan ruang penaakulan khusus untuk meneroka pelbagai hipotesis, mengenal pasti kemungkinan ralat dalam logiknya, dan menambah baik strateginya.

Anatomi Sesuatu Respons

Dalam interaksi standard, model menerima prompt dan mula menghasilkan jawapan. Dalam Thinking Mode, respons dipecahkan kepada dua blok berbeza:

Jenis BlokKeterlihatanTujuan
Blok PemikiranTersembunyi (melalui API) atau Dilipat (UI)Monolog dalaman model, perancangan, dan kritikan kendiri.
Blok TeksKelihatanJawapan akhir yang diperkemas diberikan kepada pengguna.

Sifat utama mod pemikiran

  • Didayakan atas permintaan: Anda menghantar objek thinking dalam panggilan API seperti {"type":"enabled","budget_tokens":10000} untuk menghidupkannya dan memberikan bajet token dalaman bagi penaakulan.
  • Pembajaan: budget_tokens mengehadkan token penaakulan dalaman model. Lebih banyak bajet => potensi penaakulan lebih mendalam tetapi kos dan kependaman lebih tinggi. Dalam model Claude 4, token pemikiran dibil walaupun anda hanya menerima pandangan yang diringkaskan.
  • Ringkasan & redaksi: Bagi banyak model Claude 4, pengguna melihat versi yang diringkaskan bagi kandungan pemikiran; sebahagian penaakulan dalaman mungkin dirahsiakan (disulitkan) oleh sistem keselamatan dan dikembalikan sebagai redacted_thinking.
  • Tandatangan & pengesahan: Blok pemikiran merangkumi signature legap yang digunakan untuk pengesahan apabila mengembalikan blok pemikiran kepada API (terutamanya diperlukan apabila menggunakan alat). Anda harus melayan tandatangan ini sebagai legap — jangan cuba menghuraikannya.
  • Pemikiran berjalin dengan alat: Claude 4 menyokong pengjalinan blok pemikiran dengan pelaksanaan alat (beta dan berasaskan bendera dalam sesetengah kes). Ini berkuasa untuk kerja beragen (jalankan alat, berfikir, jalankan alat lain, dsb.).

Untuk contoh praktikal dan parameter yang paling terkini, dokumentasi Anthropic untuk Messages/Extended Thinking ialah rujukan kanonik.

Bagaimana Messages API mengembalikan kandungan pemikiran

Pemikiran diringkaskan vs penuh; penyulitan & tandatangan

Versi model Claude yang berbeza mengendalikan pemikiran secara berbeza: model Claude 4 yang lebih baharu (seperti Sonnet/Opus 4.5) sering mengembalikan pandangan awam yang telah diringkaskan bagi penaakulan dalaman sementara “scratchpad” penuh mungkin disulitkan dan hanya tersedia melalui medan signature (atau blok yang dirahsiakan). Apabila alat digunakan (atau anda perlu mengekalkan keadaan dalaman merentas panggilan alat), anda mesti menghantar semula blok pemikiran kepada API atau menggunakan mekanisme tandatangan seperti yang diterangkan dalam dokumen. Mekanisme ini membantu melindungi penaakulan dalaman sensitif sambil membolehkan kesinambungan proses berfikir apabila diperlukan dengan selamat.

Corak pengendalian praktikal

Penggunaan alat / kesinambungan: jika permintaan seterusnya anda perlu meneruskan keadaan dalaman yang sama (cth., alat dijalankan berasaskan pemikiran), sertakan blok pemikiran yang dikembalikan atau tandatangan apabila anda memanggil API sekali lagi supaya model boleh menyahsulit dan meneruskan dari titik terakhir.

Permintaan: hantar thinking: {type: "enabled", budget_tokens: N}.

Respons: anda mungkin menerima (a) output awam yang diringkaskan, (b) signature atau redacted_thinking yang disulitkan, atau (c) kedua-duanya.

CometAPI menawarkan API Claude 4.5 pada 20% daripada harga API rasmi, dan ia juga boleh dipanggil menggunakan Anthropic Messages. Anda perlu mendapatkan kunci API sebelum memulakan.

Contoh 1 — curl ringkas (bukan penstriman) mengaktifkan pemikiran

curl https://api.cometapi.com/v1/messages \
  -H "x-api-key: $CometAPI_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {
      "type": "enabled",
      "budget_tokens": 10000
    },
    "messages": [
      {"role": "user", "content": "Design a robust data validation strategy for CSV imports, show tests + code."}
    ]
  }'

Respons akan mengandungi blok content. Periksa setiap blok dan utamakan blok text untuk output akhir; blok thinking mengandungi ringkasan analisis dalaman model.

Contoh 2 — Python: permintaan, huraikan blok pemikiran dan teks

import os, requests

API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
    "x-api-key": API_KEY,
    "anthropic-version": "2023-06-01",
    "content-type": "application/json"
}

payload = {
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "thinking": {"type": "enabled", "budget_tokens": 8000},
    "messages": [{"role": "user", "content": "Explain how to do property-based testing in Python; include example code."}]
}

r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()

# Parse blocks
for block in resp.get("content", []):
    if block.get("type") == "thinking":
        thinking_summary = block.get("thinking")
        print("=== THINKING (summary) ===")
        print(thinking_summary[:1000])  # truncate for logs
        print("signature:", block.get("signature")[:64], "...")
    elif block.get("type") == "text":
        print("=== FINAL TEXT ===")
        print(block.get("text"))

Kod ini mengekstrak dan mencetak pemikiran yang diringkaskan serta jawapan akhir. Jika anda perlu mengekalkan kesinambungan dalam aliran agen berbilang pusingan, sertakan blok pemikiran yang tidak diubah suai dalam permintaan seterusnya dalam tatasusunan messages (lihat contoh berikut).

Contoh 3 — menggunakan semula blok pemikiran dalam aliran berbilang pusingan (pseudo Python)

# After initial response (resp above):
# Add the assistant message including the thinking block back into the conversation
assistant_message = {
  "role": "assistant",
  "content": resp["content"]  # include raw content array (contains thinking + text blocks)
}

# Next user turn: ask follow-up and include previous assistant message
payload2 = {
  "model": "claude-opus-4-5",  # Opus preserves thinking blocks better across turns
  "max_tokens": 20000,
  "thinking": {"type": "enabled", "budget_tokens": 12000},
  "messages": [
    {"role": "user", "content": "Now adapt the validation logic for an avro pipeline."},
    assistant_message
  ]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)

Mengekalkan blok pemikiran yang tepat dan tidak diubah suai adalah kritikal apabila melakukan integrasi alat atau aliran agen panjang. Opus 4.5 mempunyai tetapan lalai yang dipertingkat untuk pemeliharaan blok pemikiran dan caching.

Bagaimana saya menstrim output pemikiran dan menunjukkan kemajuan dalam UI?

Amalan terbaik penstriman

  • Gunakan titik akhir penstriman SDK (SDK Python/TypeScript mempunyai pembantu stream). Untuk kerja penaakulan yang berjalan lama atau bajet tinggi, penstriman mengelakkan masa tamat HTTP dan memberikan teks separa semasa model mengira. Kod lazim menggunakan iterator ke atas text_stream (Python) atau penghuraian acara (JS).
  • Jangka aliran dua fasa kadangkala: model mungkin mula menghasilkan cebisan penaakulan yang kelihatan, kemudian memuktamadkan dengan jawapan. Bina UI untuk mengendalikan kandungan berketul dan untuk menunjukkan keadaan “sedang berfikir…” vs jawapan akhir.
  • Jika API mengembalikan signature_delta atau content_block_delta semasa penstriman, tangkap dan lampirkan kepada panggilan berikutnya seperti yang dikehendaki oleh spesifikasi.

Jika anda perlu menunjukkan kemajuan penaakulan perantaraan dalam UI, strim respons. Pelayan akan memancarkan acara thinking_delta diikuti acara text_delta.

curl https://api.cometapi.com/v1/messages \
  --header "x-api-key: $CometAPI_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 16000,
    "stream": true,
    "thinking": { "type": "enabled", "budget_tokens": 8000 },
    "messages": [ { "role": "user", "content": "Walk me through debugging this failing unit test and propose fixes." } ]
  }'

Semasa penstriman, kendalikan acara content_block_start, content_block_delta (yang merangkumi thinking_delta dan text_delta), dan content_block_stop mengikut tertib. Begitulah cara anda boleh memaparkan penaakulan berperingkat model ketika ia berlaku.

Bagaimana Claude Code berinteraksi dengan mod pemikiran? (terminal + VS Code)

Claude Code ialah terminal pengekodan interaktif beragen yang mengintegrasikan Messages API dan pelaksana alat. Pengalaman CLI/IDE mendedahkan pemikiran dalam dua cara:

  • Tetapan global / setiap sesi: Claude Code mendedahkan panel tetapan /config untuk melaraskan tingkah laku (cara agen meminta kebenaran, sama ada mengekalkan blok pemikiran, dsb.). Gunakan UI tersebut dan bukannya menaip JSON mentah jika anda mahukan perubahan tingkah laku yang berterusan.
  • Pemilihan model & arahan CLI: Anda boleh memilih claude-sonnet-4-5 atau claude-opus-4-5 sebagai model aktif dalam REPL; alat dan tingkah laku pemikiran kemudian mengikuti semantik Messages API. CHANGELOG dan nota keluaran menunjukkan pemikiran kini didayakan secara lalai untuk beberapa penyebaran Opus 4.5 dan konfigurasi pemikiran ditampilkan melalui /config.

Aliran praktikal dalam Claude Code:

  1. Mulakan projek dalam REPL.
  2. Gunakan /config untuk menyemak bendera berkaitan pemikiran (pemeliharaan, keperincian, dsb.).
  3. Minta agen menjalankan tugasan panjang — ia akan menghasilkan kandungan pemikiran dan, jika perlu, meminta kebenaran untuk menjalankan langkah bash tertentu. Kekalkan blok pemikiran apabila anda perlu mengesahkan atau menjalankan semula keputusan kemudian.

Pemasangan dan Persediaan

Claude Code memerlukan Node.js dan boleh dipasang secara global.

# Install Claude Code CLI
npm install -g @anthropic/claude-code

# Authenticate
claude-code --init

Mengaktifkan Pemikiran dalam Terminal

Claude Code menyokong pelbagai bendera dan pencetus bahasa semula jadi untuk mengawal kedalaman penaakulan.

Arahan/PencetusPenerangan
claude-code --thinkMemulakan sesi dengan pemikiran lanjutan didayakan secara lalai.
claude-code --model sonnet-4.5Menentukan model frontier terkini.
/think <task>Arahan slash dalam CLI untuk memanggil tugasan khusus yang berat pemikiran.
"ultrathink"Kata kunci bahasa semula jadi yang mengarahkan Claude menggunakan bajet penaakulan maksimum.

Petua:

  • Gunakan think/think harder apabila anda mahu agen meneroka pelaksanaan alternatif.
  • Apabila Claude Code melakukan panggilan alat (jalankan ujian, operasi git), kekalkan sebarang blok thinking jika CLI/agen mengembalikannya; jika tidak, agen mungkin kehilangan konteks antara langkah.

Faedah Pemikiran Berjalin dan Pemeliharaan Blok

Untuk aliran kerja beragen lanjutan, Claude 4.5 memperkenalkan dua ciri beta yang meningkatkan interaksi berbilang pusingan dan penggunaan alat: Pemikiran Berjalin dan Pemeliharaan Blok Pemikiran.

Pemikiran Berjalin (Beta)

Penaakulan standard berlaku sekali sebelum output. Pemikiran Berjalin (didayakan melalui pengepala interleaved-thinking-2025-05-14) membolehkan Claude “berfikir” di antara panggilan alat.

Bayangkan Claude sedang menyahpepijat pelayan:

  1. Berfikir: "Saya patut semak log dahulu."
  2. Panggilan Alat: read_file(logs.txt)
  3. Berfikir: "Log menunjukkan had masa pangkalan data. Kini saya perlu semak tetapan kolam sambungan."
  4. Panggilan Alat: read_file(db_config.yml)

“Renungan berterusan” ini memastikan model menyesuaikan strateginya berdasarkan data yang diterima daripada alat, bukannya mengikuti rancangan tegar yang telah ditakrif.

Pemeliharaan Blok Pemikiran

Dalam perbualan berbilang pusingan, terutamanya yang melibatkan penggunaan alat, adalah penting untuk menghantar semula blok thinking sebelumnya kepada API.

  • Kesinambungan penaakulan: Dengan menerima pemikiran sebelumnya, Claude mengekalkan konteks logikal perjalanannya.
  • Pengoptimuman Opus 4.5: Dalam Claude Opus 4.5, kelakuan ini diautomasi. Model mengekalkan semua blok pemikiran sebelumnya dalam konteksnya secara lalai, memastikan bahawa walaupun dalam sesi melebihi 30+ jam, model tidak “lupa” mengapa ia membuat keputusan seni bina tertentu sepuluh pusingan lalu.

Amalan terbaik menggunakan mod THINKING dengan Claude 4.5

Pilih model dan bajet yang tepat untuk tugasan:

Gunakan Sonnet 4.5 untuk pengekodan dan aliran beragen di mana anda memerlukan pertukaran terbaik antara kelajuan, kos, dan kebolehan pengekodan yang kukuh; gunakan Opus 4.5 untuk penaakulan paling mendalam dan tetingkap konteks terbesar atau apabila anda merancang menjalankan sesi autonomi yang panjang. Kedua-duanya menyokong pemikiran lanjutan. Pilih budget_tokens sebanding dengan kerumitan tugasan (mulakan kecil semasa eksperimen; tingkatkan bajet hanya jika anda melihat peningkatan kualiti yang ketara).

Pantau dan kawal kos & kependaman

Anda akan dikenakan caj untuk keseluruhan token pemikiran yang dihasilkan oleh Claude, bukan ringkasan output yang anda terima. Ini bermakna pertimbangan dalaman yang panjang meningkatkan kos walaupun anda hanya melihat ringkasan pendek. Jejaki penggunaan token dan pertimbangkan penalaan beransur-ansur (contohnya: 2k → 8k → 32k) apabila bergerak dari penerokaan ke produksi.

Kekalkan blok pemikiran hanya apabila perlu

Blok pemikiran boleh ditandatangani secara kriptografi dan dipelihara untuk pengesahan kemudian dan penggunaan alat berjalin. Elakkan mengulang blok pemikiran dalam setiap permintaan berikutnya melainkan aliran kerja anda memerlukan model mengekalkan pertimbangan dalaman sebelumnya (contohnya, apabila agen akan menjalankan semula langkah dan memerlukan rasional yang dipelihara). Pemeliharaan pemikiran sepanjang masa meningkatkan volum konteks dan boleh merumitkan perakaunan token.

Bila hendak menstrim pemikiran kepada pengguna

Pemikiran yang distrim sangat baik untuk peralatan pembangun dan UI pendidikan (menunjukkan “kerja dalam proses” sementara model membuat pertimbangan). Jangan menstrim pemikiran mentah kepada pengguna akhir aplikasi pengguna pengeluaran tanpa mempertimbangkan keselamatan dan redaksi: pemikiran yang diringkaskan wujud khusus untuk tujuan ini. Jika anda menstrim, sediakan elemen UI yang melabel penaakulan dalaman (cth., “Penaakulan pembantu — dalaman”), dan kawal sama ada pengguna akhir melihat pemikiran diringkaskan atau penuh.

Penggunaan alat dan pengjalinan

Apabila menggabungkan pemikiran dengan alat (pelaksanaan kod, pengambilan web, proses setempat), gunakan reka bentuk pemikiran berjalin apabila anda perlu model memilih alat, menjalankannya, dan berfikir tentang hasil dalam pusingan yang sama. Pengjalinan meningkatkan kerumitan (dan mungkin memerlukan bendera ciri) tetapi berkuasa untuk automasi beragen. Nyatakan dengan jelas pemikiran yang anda pelihara, dan uji bagaimana model memilih alat di bawah sesi pemikiran yang didayakan.

Nota penyelesaian masalah praktikal dan operasi

Ralat biasa dan maksudnya

  • Pemikiran tidak sah + pilihan alat terpaksa: Jika anda meminta pemikiran tetapi juga memaksa mod penggunaan alat tertentu yang tidak serasi dengan pemikiran, API akan mengembalikan ralat — jangan gabungkan tool_choice: {"type":"tool","name":"..."} dengan pemikiran.
  • Bajet > max_tokens: Untuk senario pemikiran berjalin, peraturan token berkesan berbeza — dokumentasi platform menerangkan bila budget_tokens boleh melebihi max_tokens. Baca bahagian “interleaved thinking” dengan teliti sebelum menguji bajet besar.
  • Pengesahan tandatangan: Jika anda memelihara blok pemikiran untuk panggilan kemudian, sertakan signature yang dikembalikan supaya API boleh mengesahkan ia datang daripada Claude; ini mencegah pengubahsuaian dan mengekalkan rantaian boleh disahkan.

Kebolehcerapan & instrumentasi

Log: (1) pemilihan model, (2) thinking.budget_tokens, (3) penggunaan token pemikiran sebenar (anda dibil untuknya), (4) kependaman penstriman (masa ke thinking_delta pertama), dan (5) token teks akhir. Gunakan metrik ini untuk membina bajet dan SLO bagi aliran menghadap pengguna.

Pengeluaran progresif & manusia dalam gelung

Keluarkan model berdaya pemikiran di belakang bendera ciri. Mulakan dengan peratusan trafik pembangun atau dalaman, kumpulkan kegagalan atau redaksi, dan ulang kaji prompt serta bajet. Untuk domain sensitif, wajibkan semakan manusia pada output yang mengandungi penaakulan dalaman yang besar sebelum dilepaskan.

Petua penyahpepijatan

  • Mulakan kecil: dayakan budget_tokens rendah dan skala untuk memahami peningkatan beransur-ansur.
  • Hidupkan penstriman dan log acara content_block_delta / tandatangan untuk memahami bila model menghasilkan blok pemikiran.
  • Jika menggunakan Claude Code: semak /config dan tetapan peringkat projek; rujuk changelog Claude Code jika tingkah laku tidak sepadan dengan lalai yang dijangka.

Kesimpulan:

Claude 4.5, digabungkan dengan kuasa Extended Thinking dan CLI Claude Code, mewakili lonjakan paling signifikan dalam produktiviti pembangun sejak penciptaan IDE. Dengan membolehkan model “menunjukkan kerjanya” dan mempertimbangkan masalah kompleks, Anthropic telah melangkaui era “chatbot” kepada era “beragen”.

Sama ada anda mengintegrasikan Messages API ke dalam peralatan pembangun buatan khusus atau menggunakan Claude Code untuk mengurus PR harian anda, menguasai Thinking Mode adalah penting. Ia menyediakan ketelusan yang diperlukan untuk kepercayaan dan kedalaman penaakulan yang diperlukan untuk kecemerlangan.

Pembangun boleh mengakses model Claude 4.5 (Claude Sonnet 4.5 , Claude Haiku 4.5, Claude Opus 4.5) melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda melakukan integrasi.

Ready to Go?→ Percubaan percuma Claude 4.5!

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun