“Thinking mode” (juga disebut pemikiran lanjutan, pemikiran, atau blok pemikiran) dalam Claude 4.5 ialah mod operasi yang eksplisit dan boleh dikonfigur yang mengarahkan model meluangkan sejumlah token yang diperuntukkan secara berasingan untuk menghasilkan penaakulan dalaman langkah demi langkah (“rantaian pemikiran”) sebelum mengeluarkan jawapan akhir. Ia direka untuk meningkatkan prestasi pada penaakulan berbilang langkah, pengkodan kompleks dan aliran kerja berasaskan agen, serta tugasan penyelidikan dengan menukar kelewatan dan kos token untuk pertimbangan dalaman yang lebih mendalam. Claude 4.5 mendedahkan keupayaan ini pada peringkat Messages API dengan parameter yang jelas (contohnya, thinking / budget_tokens atau pengepala usaha/“interleaved-thinking”), mengekalkan dan secara pilihan menyulitkan blok pemikiran untuk pengesahan kemudian atau penggunaan alat, serta memperkenalkan cache dan gelagat perakaunan token yang perlu anda urus semasa membina beban kerja produksi.
Apakah Claude 4.5? (Dan model mana yang perlu saya ambil peduli?)
Claude 4.5 ialah set model Claude terkini daripada Anthropic yang dikeluarkan sebagai kemas kini “4.5” berperingkat (contohnya, Sonnet 4.5 dan Opus 4.5). Sonnet 4.5 diposisikan sebagai keseimbangan terbaik antara kecerdasan, pengkodan dan prestasi agen untuk kebanyakan pembangun; Opus 4.5 memberi tumpuan kepada penaakulan berintensiti tinggi dan mengekalkan blok pemikiran untuk meningkatkan kesinambungan berbilang giliran. Kedua-dua model menyokong keupayaan pemikiran lanjutan, walaupun beberapa tingkah laku (contohnya, pemikiran diringkaskan berbanding penuh) berbeza mengikut model.
Kenaikan prestasi dalam Claude 4.5, khususnya dalam Sonnet 4.5, paling ketara dalam penanda aras SWE-bench Verified, yang mengukur keupayaan AI menyelesaikan isu GitHub dunia sebenar.
| Model | Skor SWE-bench Verified | OSWorld (Penggunaan Komputer) |
|---|---|---|
| Claude 3.5 Sonnet | 49.0% | 42.2% |
| Claude 4.1 Opus | 67.6% | 55.0% |
| Claude 4.5 Sonnet (Thinking On) | 77.2% | 61.4% |
| GPT-5 (Medium Reasoning) | 65.0% | 52.0% |
Angka-angka ini menunjukkan bahawa Claude 4.5 bukan sahaja lebih baik dalam menulis potongan kod; ia jauh lebih berupaya menavigasi keseluruhan sistem fail dan melaksanakan tugas autonomi tanpa campur tangan manusia.
Mengapa ini penting
- Pengkodan & agen: Sonnet 4.5 menunjukkan peningkatan ketara pada tugas perisian dunia sebenar dan kerja pengkodan jangka panjang—menjadikannya pilihan semula jadi untuk penjanaan kod, pengeditan kod, dan aliran agen autonomi.
- Pemikiran lanjutan & konteks: Model keluarga Claude 4.5 dibina untuk berfikir dengan scratchpad dalaman yang sangat besar (puluhan ribu token atau lebih), membolehkan penaakulan berbilang langkah yang lebih mendalam. Ini mengubah cara anda mereka bentuk prompt, bajet token, dan interaksi alat.
Apakah Thinking Mode dalam Claude 4.5?
Thinking Mode (secara rasmi disebut "Extended Thinking") ialah keupayaan yang membolehkan model “menunjukkan kerjanya” kepada dirinya sendiri sebelum menghasilkan output akhir. Berbeza dengan model standard yang terus berkomitmen kepada jawapan, Claude 4.5 menggunakan ruang penaakulan khusus untuk meneroka pelbagai hipotesis, mengenal pasti kemungkinan kesilapan dalam logiknya, dan memperhalus strateginya.
Anatomi Respons
Sebagai interaksi standard, model menerima prompt dan mula menghasilkan jawapan. Dalam Thinking Mode, respons dibahagikan kepada dua blok yang berbeza:
| Jenis Blok | Keterlihatan | Tujuan |
|---|---|---|
| Blok Pemikiran | Tersembunyi (melalui API) atau Dilipat (UI) | Monolog dalaman model, perancangan, dan kritikan kendiri. |
| Blok Teks | Kelihatan | Jawapan akhir yang telah diperhalus untuk pengguna. |
Sifat utama Thinking Mode
- Aktifkan atas permintaan: Anda melepasi objek
thinkingdalam panggilan API seperti{"type":"enabled","budget_tokens":10000}untuk menghidupkannya dan memberikan bajet token dalaman kepada model bagi penaakulan. - Peruntukan bajet:
budget_tokensmengehadkan token penaakulan dalaman model. Lebih banyak bajet => berpotensi untuk penaakulan lebih mendalam tetapi kos dan kelewatan lebih tinggi. Dalam model Claude 4, token pemikiran akan dibilkan walaupun anda hanya menerima paparan yang diringkaskan. - Ringkasan & redaksi: Bagi banyak model Claude 4, pengguna melihat versi ringkasan kandungan pemikiran; sebahagian penaakulan dalaman mungkin dirahsiakan (disulitkan) oleh sistem keselamatan dan dikembalikan sebagai
redacted_thinking. - Tandatangan & pengesahan: Blok pemikiran merangkumi
signaturelegap yang digunakan untuk pengesahan apabila memulangkan blok pemikiran kepada API (amat diperlukan apabila menggunakan alat). Anda harus menganggap tandatangan sebagai legap — jangan cuba menghuraikannya. - Pemikiran berjalin dengan alat: Claude 4 menyokong pemikiran berselang-seli dengan pelaksanaan alat (beta dan berasaskan flag dalam sesetengah kes). Ini berkuasa untuk kerja beragensi (jalankan alat, fikir, jalankan alat lain, dsb.).
Untuk contoh praktikal dan parameter paling terkini, dokumentasi Messages/Extended Thinking Anthropic ialah rujukan kanonik.
Bagaimana Messages API memulangkan kandungan pemikiran
Pemikiran diringkaskan vs penuh; penyulitan & tandatangan
Versi model Claude yang berbeza mengendalikan pemikiran dengan cara berbeza: model Claude 4 yang lebih baharu (seperti Sonnet/Opus 4.5) sering memulangkan paparan awam yang diringkaskan bagi penaakulan dalaman sementara scratchpad penuh mungkin disulitkan dan tersedia hanya melalui medan signature (atau blok yang disunting). Apabila alat digunakan (atau anda perlu mengekalkan keadaan dalaman merentas panggilan alat), anda mesti memulangkan blok pemikiran kembali kepada API atau menggunakan mekanisme tandatangan seperti yang diterangkan dalam dokumentasi. Mekanisme ini membantu melindungi penaakulan dalaman sensitif sambil membolehkan kesinambungan proses pemikiran dengan selamat apabila diperlukan.
Corak pengendalian praktikal
Penggunaan alat / kesinambungan: jika permintaan seterusnya mesti meneruskan keadaan dalaman yang sama (contohnya, alat dijalankan berdasarkan pemikiran), sertakan blok pemikiran yang dipulangkan atau tandatangan apabila anda memanggil API sekali lagi supaya model boleh menyahsulit dan meneruskan dari tempat ia berhenti.
Permintaan: hantar thinking: {type: "enabled", budget_tokens: N}.
Respons: anda mungkin menerima (a) output awam yang diringkaskan, (b) signature atau blok redacted_thinking yang disulitkan, atau (c) kedua-duanya.
CometAPI menawarkan API Claude 4.5 pada 20% daripada harga API rasmi, dan ia juga boleh dipanggil menggunakan Anthropic Messages. Anda perlu mendapatkan kunci API sebelum bermula.
Contoh 1 — curl ringkas (bukan penstriman) mengaktifkan pemikiran
curl https://api.cometapi.com/v1/messages \
-H "x-api-key: $CometAPI_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"messages": [
{"role": "user", "content": "Design a robust data validation strategy for CSV imports, show tests + code."}
]
}'
Respons akan mengandungi blok content. Periksa setiap blok dan utamakan blok text untuk output akhir; blok thinking mengandungi ringkasan analisis dalaman model.
Contoh 2 — Python: permintaan, huraikan blok pemikiran dan teks
import os, requests
API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
"x-api-key": API_KEY,
"anthropic-version": "2023-06-01",
"content-type": "application/json"
}
payload = {
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {"type": "enabled", "budget_tokens": 8000},
"messages": [{"role": "user", "content": "Explain how to do property-based testing in Python; include example code."}]
}
r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()
# Parse blocks
for block in resp.get("content", []):
if block.get("type") == "thinking":
thinking_summary = block.get("thinking")
print("=== THINKING (summary) ===")
print(thinking_summary[:1000]) # truncate for logs
print("signature:", block.get("signature")[:64], "...")
elif block.get("type") == "text":
print("=== FINAL TEXT ===")
print(block.get("text"))
Kod ini mengekstrak dan mencetak pemikiran yang diringkaskan serta jawapan akhir. Jika anda perlu mengekalkan kesinambungan dalam aliran agen berbilang giliran, sertakan blok pemikiran yang tidak diubah dalam permintaan seterusnya dalam tatasusunan messages (lihat contoh berikut).
Contoh 3 — menggunakan semula blok pemikiran dalam aliran berbilang giliran (pseudo Python)
# After initial response (resp above):
# Add the assistant message including the thinking block back into the conversation
assistant_message = {
"role": "assistant",
"content": resp["content"] # include raw content array (contains thinking + text blocks)
}
# Next user turn: ask follow-up and include previous assistant message
payload2 = {
"model": "claude-opus-4-5", # Opus preserves thinking blocks better across turns
"max_tokens": 20000,
"thinking": {"type": "enabled", "budget_tokens": 12000},
"messages": [
{"role": "user", "content": "Now adapt the validation logic for an avro pipeline."},
assistant_message
]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)
Mengekalkan blok pemikiran yang tepat dan tidak diubah adalah penting apabila melakukan integrasi alat atau aliran agen yang panjang. Opus 4.5 mempunyai lalai yang dipertingkat untuk pemeliharaan blok pemikiran dan caching.
Bagaimana saya menstrim keluaran pemikiran dan menunjukkan kemajuan dalam UI?
Amalan terbaik penstriman
- Gunakan titik akhir penstriman SDK (SDK Python/TypeScript mempunyai pembantu strim). Untuk kerja penaakulan yang berjalan lama atau ber-bajet tinggi, penstriman mencegah tamat masa HTTP dan memberikan teks separa ketika model mengira. Kod lazim menggunakan iterator ke atas
text_stream(Python) atau penghuraian acara (JS). - Jangka strim dua fasa kadangkala: model mungkin terlebih dahulu menghasilkan cebisan penaakulan yang kelihatan, kemudian memuktamadkan dengan jawapan. Bina UI anda untuk mengendalikan kandungan berketul dan menunjukkan keadaan “sedang berfikir…” berbanding keadaan jawapan akhir.
- Jika API memulangkan
signature_deltaataucontent_block_deltasemasa penstriman, tangkap dan lampirkan pada panggilan seterusnya seperti yang diperlukan oleh spesifikasi.
Jika anda perlu menunjukkan kemajuan penaakulan perantaraan dalam UI, strim respons. Pelayan akan menghantar acara thinking_delta diikuti oleh acara text_delta.
curl https://api.cometapi.com/v1/messages \
--header "x-api-key: $CometAPI_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"stream": true,
"thinking": { "type": "enabled", "budget_tokens": 8000 },
"messages": [ { "role": "user", "content": "Walk me through debugging this failing unit test and propose fixes." } ]
}'
Semasa penstriman, kendalikan acara content_block_start, content_block_delta (yang merangkumi thinking_delta dan text_delta), dan content_block_stop mengikut tertib. Inilah cara anda boleh memaparkan penaakulan langkah demi langkah model semasa ia berlaku.
Bagaimana Claude Code berinteraksi dengan thinking mode? (terminal + VS Code)
Claude Code ialah terminal pengkodan interaktif beragensi yang mengintegrasikan Messages API dan pelancar alat. Pengalaman CLI/IDE memperlihatkan pemikiran dengan dua cara:
- Tetapan global / per sesi: Claude Code mendedahkan panel tetapan
/configuntuk melaraskan tingkah laku (bagaimana agen meminta kebenaran, sama ada untuk mengekalkan blok pemikiran, dsb.). Gunakan UI tersebut dan bukannya menaip semula JSON mentah jika anda mahukan perubahan tingkah laku yang berterusan. - Pemilihan model & arahan CLI: Anda boleh memilih
claude-sonnet-4-5atauclaude-opus-4-5sebagai model aktif dalam REPL; alat dan tingkah laku pemikiran kemudian mengikuti semantik Messages API. CHANGELOG dan nota keluaran menunjukkan pemikiran kini diaktifkan secara lalai untuk beberapa penyebaran Opus 4.5 dan konfigurasi pemikiran dipaparkan melalui/config.
Aliran praktikal dalam Claude Code:
- Mulakan projek dalam REPL.
- Gunakan
/configuntuk meneliti flag berkaitan pemikiran (pemeliharaan, kebergantungan, dsb.). - Minta agen menjalankan tugas panjang — ia akan menghasilkan kandungan pemikiran dan, jika perlu, meminta kebenaran untuk menjalankan langkah bash tertentu. Kekalkan blok pemikiran apabila anda perlu mengesahkan atau menjalankan semula keputusan kemudian.
Pemasangan dan Persediaan
Claude Code memerlukan Node.js dan boleh dipasang secara global.
# Install Claude Code CLI
npm install -g @anthropic/claude-code
# Authenticate
claude-code --init
Mengaktifkan Thinking dalam Terminal
Claude Code menyokong pelbagai flag dan pencetus bahasa semula jadi untuk mengawal kedalaman penaakulannya.
| Command/Trigger | Penerangan |
|---|---|
| claude-code --think | Memulakan sesi dengan pemikiran lanjutan diaktifkan secara lalai. |
| claude-code --model sonnet-4.5 | Menentukan model frontier terkini. |
| /think | Arahan slash dalam CLI untuk memanggil tugas yang memerlukan pemikiran mendalam. |
| "ultrathink" | Kata kunci bahasa semula jadi yang mengarahkan Claude menggunakan bajet penaakulan maksimum. |
Petua:
- Gunakan “think”/“think harder” apabila anda mahu agen meneroka pelaksanaan alternatif.
- Apabila Claude Code melakukan panggilan alat (jalankan ujian, operasi git), kekalkan sebarang blok
thinkingjika CLI/agen memulangkannya; jika tidak, agen mungkin kehilangan konteks antara langkah.
Manfaat Pemikiran Berjalin dan Pemeliharaan Blok
Untuk aliran kerja beragensi lanjutan, Claude 4.5 memperkenalkan dua ciri beta yang ketara meningkatkan interaksi berbilang giliran dan penggunaan alat: Interleaved Thinking dan Pemeliharaan Blok Pemikiran.
Interleaved Thinking (Beta)
Penaakulan standard berlaku sekali sebelum output. Interleaved Thinking (diaktifkan melalui pengepala interleaved-thinking-2025-05-14) membolehkan Claude “berfikir” di antara panggilan alat.
Bayangkan Claude sedang menyahpepijat pelayan:
- Berfikir: “Saya patut periksa log dahulu.”
- Panggilan Alat:
read_file(logs.txt) - Berfikir: “Log menunjukkan masa tamat pangkalan data. Sekarang saya perlu periksa tetapan kolam sambungan.”
- Panggilan Alat:
read_file(db_config.yml)
“Renungan berterusan” ini memastikan model menyesuaikan strateginya berdasarkan data yang diterima daripada alat, bukannya mengikut rancangan yang kaku dan pratakrif.
Pemeliharaan Blok Pemikiran
Dalam perbualan berbilang giliran, terutamanya yang melibatkan penggunaan alat, adalah kritikal untuk menghantar kembali blok thinking sebelumnya kepada API.
- Kesinambungan penaakulan: Dengan menerima pemikiran sebelumnya, Claude mengekalkan konteks logik perjalanannya.
- Pengoptimuman Opus 4.5: Dalam Claude Opus 4.5, tingkah laku ini diautomatikkan. Model mengekalkan semua blok pemikiran sebelumnya dalam konteksnya secara lalai, memastikan bahawa walaupun dalam sesi yang berlangsung lebih 30 jam, model tidak “lupa” mengapa ia membuat keputusan seni bina tertentu sepuluh giliran lalu.
Amalan terbaik menggunakan THINKING mode dengan Claude 4.5
Pilih model dan bajet yang sesuai untuk tugas:
Gunakan Sonnet 4.5 untuk pengkodan dan aliran kerja beragensi di mana anda memerlukan perdagangan terbaik antara kelajuan, kos, dan keupayaan pengkodan yang kukuh; gunakan Opus 4.5 untuk penaakulan paling mendalam dan tetingkap konteks terbesar atau apabila anda bercadang menjalankan sesi autonomi yang panjang. Kedua-duanya menyokong pemikiran lanjutan. Pilih budget_tokens mengikut kerumitan tugas (mulakan kecil untuk eksperimen; naikkan bajet hanya jika anda melihat peningkatan kualiti yang ketara).
Pantau dan kawal kos & kelewatan
Anda dibilkan untuk keseluruhan token pemikiran yang dihasilkan Claude, bukan output yang diringkaskan yang anda terima. Ini bermakna renungan dalaman yang panjang meningkatkan kos walaupun anda hanya melihat ringkasan pendek. Jejaki penggunaan token dan pertimbangkan penalaan beransur-ansur (contohnya: 2k → 8k → 32k) apabila beralih daripada penerokaan kepada produksi.
Kekalkan blok pemikiran hanya apabila perlu
Blok pemikiran boleh ditandatangani secara kriptografi dan dikekalkan untuk pengesahan kemudian dan penggunaan alat berjalin. Elakkan memantulkan blok pemikiran dalam setiap permintaan susulan kecuali aliran kerja anda memerlukan model mengekalkan renungan dalaman sebelumnya (contohnya, apabila agen akan menjalankan semula langkah dan memerlukan rasional yang dipelihara). Menyimpan pemikiran sepanjang masa meningkatkan volum konteks dan boleh merumitkan perakaunan token.
Bila untuk menstrim pemikiran kepada pengguna
Pemikiran yang distrim sangat baik untuk perkakas pembangun dan UI pendidikan (menunjukkan “kerja sedang berjalan” ketika model berfikir). Jangan menstrim pemikiran mentah kepada pengguna aplikasi pengguna produksi tanpa mempertimbangkan keselamatan dan redaksi: pemikiran yang diringkaskan wujud untuk tujuan ini. Jika anda menstrim, sediakan keupayaan UI yang melabel penaakulan dalaman (contohnya, “Penaakulan Pembantu — dalaman”), dan kawal sama ada pengguna akhir melihat ringkasan atau keseluruhan penaakulan.
Penggunaan alat dan pemikiran berjalin
Apabila menggabungkan pemikiran dengan alat (pelaksanaan kod, pengambilan web, proses tempatan), gunakan reka bentuk “interleaved thinking” apabila anda perlu model memilih alat, menjalankannya, dan berfikir tentang hasil dalam giliran yang sama. Pemikiran berjalin meningkatkan kerumitan (dan mungkin memerlukan flag ciri) tetapi berkuasa untuk automasi beragensi. Nyatakan dengan jelas pemikiran yang anda pelihara, dan uji cara model memilih alat di bawah sesi pemikiran diaktifkan.
Penyelesaian masalah praktikal dan nota operasi
Ralat biasa dan maksudnya
- Pemikiran tidak sah + pemilihan alat dipaksa: Jika anda meminta pemikiran tetapi turut memaksa mod penggunaan alat tertentu yang tidak serasi dengan pemikiran, API akan memulangkan ralat — jangan campurkan pemaksaan
tool_choice: {"type":"tool","name":"..."}dengan pemikiran. - Budget > max_tokens: Untuk senario pemikiran berjalin, peraturan token berkesan berbeza — dokumentasi platform menerangkan bila
budget_tokensboleh melebihimax_tokens. Baca seksyen “interleaved thinking” dengan teliti sebelum menguji bajet besar. - Pengesahan tandatangan: Jika anda mengekalkan blok pemikiran untuk panggilan kemudian, sertakan
signatureyang dipulangkan supaya API boleh mengesahkan asal usulnya; ini mencegah pengubahsuaian dan mengekalkan rantaian boleh disahkan.
Kebolehcerapan & instrumentasi
Log: (1) pemilihan model, (2) thinking.budget_tokens, (3) penggunaan sebenar token pemikiran (anda dibilkan untuknya), (4) latensi penstriman (masa ke thinking_delta pertama), dan (5) token teks akhir. Gunakan metrik ini untuk membina bajet dan SLO bagi aliran menghadap pengguna.
Pengeluaran progresif & manusia dalam gelung
Keluarkan model berpemikiran diaktifkan di sebalik flag ciri. Mulakan dengan peratusan trafik pembangun atau dalaman, kumpulkan kegagalan atau redaksi, dan iterasi prompt serta bajet. Untuk domain sensitif, memerlukan semakan manusia pada output yang merangkumi penaakulan dalaman yang besar sebelum dilepaskan.
Petua nyahpepijat
- Mulakan kecil: aktifkan
budget_tokensrendah dan skala untuk memahami peningkatan beransur-ansur. - Aktifkan penstriman dan log acara
content_block_delta/ tandatangan untuk memahami bila model menghasilkan blok pemikiran. - Jika menggunakan Claude Code: semak
/configdan tetapan peringkat projek; rujuk changelog Claude Code jika tingkah laku tidak sepadan dengan lalai yang dijangka.
Kesimpulan:
Claude 4.5, digabungkan dengan kuasa Extended Thinking dan CLI Claude Code, mewakili lonjakan paling signifikan dalam produktiviti pembangun sejak penciptaan IDE. Dengan membenarkan model “menunjukkan kerjanya” dan bermuhasabah secara mendalam tentang masalah kompleks, Anthropic telah melangkah melepasi era “chatbot” dan memasuki era “agen”.
Sama ada anda mengintegrasikan Messages API ke dalam perkakas pembangunan tersuai atau menggunakan Claude Code untuk mengurus PR harian anda, menguasai Thinking Mode adalah penting. Ia menyediakan ketelusan yang diperlukan untuk kepercayaan dan kedalaman penaakulan yang diperlukan untuk kecemerlangan.
Pembangun boleh mengakses model Claude 4.5 (Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5) melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.
Sedia untuk bermula?→ Percubaan percuma Claude 4.5!
