“Thinking mode” (juga disebut extended thinking, thinking, atau thinking blocks) dalam Claude 4.5 ialah mod operasi yang jelas dan boleh dikonfigurasi yang mengarahkan model untuk meluangkan sejumlah token yang dibajetkan secara berasingan bagi menghasilkan penaakulan dalaman langkah demi langkah (“chain-of-thought”) sebelum mengeluarkan jawapan akhir. Ia direka untuk meningkatkan prestasi pada penaakulan berbilang langkah, pengekodan kompleks dan aliran kerja beragen, serta tugasan penyelidikan dengan menukar kependaman dan kos token kepada pertimbangan dalaman yang lebih mendalam. Claude 4.5 mendedahkan keupayaan ini pada tahap Messages API dengan parameter eksplisit (cth., thinking / budget_tokens atau pengepala effort/“interleaved-thinking”), mengekalkan dan secara pilihan menyulitkan blok pemikiran untuk pengesahan atau kegunaan alat kemudian, serta memperkenalkan tingkah laku cache dan perakaunan token yang mesti anda urus semasa membina beban kerja produksi.
Apakah Claude 4.5? (Dan model mana yang patut saya ambil peduli?)
Claude 4.5 ialah set model Claude terkini daripada Anthropic yang dikeluarkan sebagai kemas kini “4.5” berperingkat (contohnya, Sonnet 4.5 dan Opus 4.5). Sonnet 4.5 diposisikan sebagai keseimbangan terbaik kecerdasan, prestasi pengekodan dan kebolehan beragen untuk kebanyakan pembangun; Opus 4.5 memfokuskan pada penaakulan usaha tinggi dan mengekalkan blok pemikiran untuk meningkatkan kesinambungan berbilang pusingan. Kedua-dua model menyokong keupayaan pemikiran lanjutan Claude, walaupun sebahagian tingkah laku (cth., pemikiran yang diringkaskan vs penuh) berbeza mengikut model.
Kelebihan prestasi dalam Claude 4.5, khususnya dalam Sonnet 4.5, paling ketara dalam penanda aras SWE-bench Verified, yang mengukur kemampuan AI menyelesaikan isu GitHub dunia nyata.
| Model | Skor SWE-bench Verified | OSWorld (Penggunaan Komputer) |
|---|---|---|
| Claude 3.5 Sonnet | 49.0% | 42.2% |
| Claude 4.1 Opus | 67.6% | 55.0% |
| Claude 4.5 Sonnet (Thinking On) | 77.2% | 61.4% |
| GPT-5 (Medium Reasoning) | 65.0% | 52.0% |
Angka ini menunjukkan bahawa Claude 4.5 bukan sekadar lebih baik menulis snippet; ia jauh lebih berkeupayaan menavigasi keseluruhan sistem fail dan melaksanakan tugasan autonomi tanpa campur tangan manusia.
Mengapa ini penting
- Pengekodan & agen: Sonnet 4.5 menunjukkan peningkatan kukuh pada tugasan perisian dunia nyata dan kerja pengekodan jangka panjang—menjadikannya pilihan semula jadi untuk penjanaan kod, penyuntingan kod, dan aliran agen autonomi.
- Pemikiran lanjutan & konteks: Model keluarga Claude 4.5 dibina untuk berfikir dengan “scratchpad” dalaman yang sangat besar (puluhan ribu token atau lebih), membolehkan penaakulan berbilang langkah yang lebih mendalam. Ini mengubah cara anda mereka bentuk prompt, bajet token, dan interaksi alat.
Apakah Thinking Mode dalam Claude 4.5?
Thinking Mode (secara rasmi disebut "Extended Thinking") ialah keupayaan yang membolehkan model “menunjukkan kerjanya” kepada dirinya sendiri sebelum menghasilkan output akhir. Tidak seperti model standard yang segera komited kepada jawapan, Claude 4.5 menggunakan ruang penaakulan khusus untuk meneroka pelbagai hipotesis, mengenal pasti kemungkinan ralat dalam logiknya, dan menambah baik strateginya.
Anatomi Sesuatu Respons
Dalam interaksi standard, model menerima prompt dan mula menghasilkan jawapan. Dalam Thinking Mode, respons dipecahkan kepada dua blok berbeza:
| Jenis Blok | Keterlihatan | Tujuan |
|---|---|---|
| Blok Pemikiran | Tersembunyi (melalui API) atau Dilipat (UI) | Monolog dalaman model, perancangan, dan kritikan kendiri. |
| Blok Teks | Kelihatan | Jawapan akhir yang diperkemas diberikan kepada pengguna. |
Sifat utama mod pemikiran
- Didayakan atas permintaan: Anda menghantar objek
thinkingdalam panggilan API seperti{"type":"enabled","budget_tokens":10000}untuk menghidupkannya dan memberikan bajet token dalaman bagi penaakulan. - Pembajaan:
budget_tokensmengehadkan token penaakulan dalaman model. Lebih banyak bajet => potensi penaakulan lebih mendalam tetapi kos dan kependaman lebih tinggi. Dalam model Claude 4, token pemikiran dibil walaupun anda hanya menerima pandangan yang diringkaskan. - Ringkasan & redaksi: Bagi banyak model Claude 4, pengguna melihat versi yang diringkaskan bagi kandungan pemikiran; sebahagian penaakulan dalaman mungkin dirahsiakan (disulitkan) oleh sistem keselamatan dan dikembalikan sebagai
redacted_thinking. - Tandatangan & pengesahan: Blok pemikiran merangkumi
signaturelegap yang digunakan untuk pengesahan apabila mengembalikan blok pemikiran kepada API (terutamanya diperlukan apabila menggunakan alat). Anda harus melayan tandatangan ini sebagai legap — jangan cuba menghuraikannya. - Pemikiran berjalin dengan alat: Claude 4 menyokong pengjalinan blok pemikiran dengan pelaksanaan alat (beta dan berasaskan bendera dalam sesetengah kes). Ini berkuasa untuk kerja beragen (jalankan alat, berfikir, jalankan alat lain, dsb.).
Untuk contoh praktikal dan parameter yang paling terkini, dokumentasi Anthropic untuk Messages/Extended Thinking ialah rujukan kanonik.
Bagaimana Messages API mengembalikan kandungan pemikiran
Pemikiran diringkaskan vs penuh; penyulitan & tandatangan
Versi model Claude yang berbeza mengendalikan pemikiran secara berbeza: model Claude 4 yang lebih baharu (seperti Sonnet/Opus 4.5) sering mengembalikan pandangan awam yang telah diringkaskan bagi penaakulan dalaman sementara “scratchpad” penuh mungkin disulitkan dan hanya tersedia melalui medan signature (atau blok yang dirahsiakan). Apabila alat digunakan (atau anda perlu mengekalkan keadaan dalaman merentas panggilan alat), anda mesti menghantar semula blok pemikiran kepada API atau menggunakan mekanisme tandatangan seperti yang diterangkan dalam dokumen. Mekanisme ini membantu melindungi penaakulan dalaman sensitif sambil membolehkan kesinambungan proses berfikir apabila diperlukan dengan selamat.
Corak pengendalian praktikal
Penggunaan alat / kesinambungan: jika permintaan seterusnya anda perlu meneruskan keadaan dalaman yang sama (cth., alat dijalankan berasaskan pemikiran), sertakan blok pemikiran yang dikembalikan atau tandatangan apabila anda memanggil API sekali lagi supaya model boleh menyahsulit dan meneruskan dari titik terakhir.
Permintaan: hantar thinking: {type: "enabled", budget_tokens: N}.
Respons: anda mungkin menerima (a) output awam yang diringkaskan, (b) signature atau redacted_thinking yang disulitkan, atau (c) kedua-duanya.
CometAPI menawarkan API Claude 4.5 pada 20% daripada harga API rasmi, dan ia juga boleh dipanggil menggunakan Anthropic Messages. Anda perlu mendapatkan kunci API sebelum memulakan.
Contoh 1 — curl ringkas (bukan penstriman) mengaktifkan pemikiran
curl https://api.cometapi.com/v1/messages \
-H "x-api-key: $CometAPI_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"messages": [
{"role": "user", "content": "Design a robust data validation strategy for CSV imports, show tests + code."}
]
}'
Respons akan mengandungi blok content. Periksa setiap blok dan utamakan blok text untuk output akhir; blok thinking mengandungi ringkasan analisis dalaman model.
Contoh 2 — Python: permintaan, huraikan blok pemikiran dan teks
import os, requests
API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
"x-api-key": API_KEY,
"anthropic-version": "2023-06-01",
"content-type": "application/json"
}
payload = {
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {"type": "enabled", "budget_tokens": 8000},
"messages": [{"role": "user", "content": "Explain how to do property-based testing in Python; include example code."}]
}
r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()
# Parse blocks
for block in resp.get("content", []):
if block.get("type") == "thinking":
thinking_summary = block.get("thinking")
print("=== THINKING (summary) ===")
print(thinking_summary[:1000]) # truncate for logs
print("signature:", block.get("signature")[:64], "...")
elif block.get("type") == "text":
print("=== FINAL TEXT ===")
print(block.get("text"))
Kod ini mengekstrak dan mencetak pemikiran yang diringkaskan serta jawapan akhir. Jika anda perlu mengekalkan kesinambungan dalam aliran agen berbilang pusingan, sertakan blok pemikiran yang tidak diubah suai dalam permintaan seterusnya dalam tatasusunan messages (lihat contoh berikut).
Contoh 3 — menggunakan semula blok pemikiran dalam aliran berbilang pusingan (pseudo Python)
# After initial response (resp above):
# Add the assistant message including the thinking block back into the conversation
assistant_message = {
"role": "assistant",
"content": resp["content"] # include raw content array (contains thinking + text blocks)
}
# Next user turn: ask follow-up and include previous assistant message
payload2 = {
"model": "claude-opus-4-5", # Opus preserves thinking blocks better across turns
"max_tokens": 20000,
"thinking": {"type": "enabled", "budget_tokens": 12000},
"messages": [
{"role": "user", "content": "Now adapt the validation logic for an avro pipeline."},
assistant_message
]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)
Mengekalkan blok pemikiran yang tepat dan tidak diubah suai adalah kritikal apabila melakukan integrasi alat atau aliran agen panjang. Opus 4.5 mempunyai tetapan lalai yang dipertingkat untuk pemeliharaan blok pemikiran dan caching.
Bagaimana saya menstrim output pemikiran dan menunjukkan kemajuan dalam UI?
Amalan terbaik penstriman
- Gunakan titik akhir penstriman SDK (SDK Python/TypeScript mempunyai pembantu stream). Untuk kerja penaakulan yang berjalan lama atau bajet tinggi, penstriman mengelakkan masa tamat HTTP dan memberikan teks separa semasa model mengira. Kod lazim menggunakan iterator ke atas
text_stream(Python) atau penghuraian acara (JS). - Jangka aliran dua fasa kadangkala: model mungkin mula menghasilkan cebisan penaakulan yang kelihatan, kemudian memuktamadkan dengan jawapan. Bina UI untuk mengendalikan kandungan berketul dan untuk menunjukkan keadaan “sedang berfikir…” vs jawapan akhir.
- Jika API mengembalikan
signature_deltaataucontent_block_deltasemasa penstriman, tangkap dan lampirkan kepada panggilan berikutnya seperti yang dikehendaki oleh spesifikasi.
Jika anda perlu menunjukkan kemajuan penaakulan perantaraan dalam UI, strim respons. Pelayan akan memancarkan acara thinking_delta diikuti acara text_delta.
curl https://api.cometapi.com/v1/messages \
--header "x-api-key: $CometAPI_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"stream": true,
"thinking": { "type": "enabled", "budget_tokens": 8000 },
"messages": [ { "role": "user", "content": "Walk me through debugging this failing unit test and propose fixes." } ]
}'
Semasa penstriman, kendalikan acara content_block_start, content_block_delta (yang merangkumi thinking_delta dan text_delta), dan content_block_stop mengikut tertib. Begitulah cara anda boleh memaparkan penaakulan berperingkat model ketika ia berlaku.
Bagaimana Claude Code berinteraksi dengan mod pemikiran? (terminal + VS Code)
Claude Code ialah terminal pengekodan interaktif beragen yang mengintegrasikan Messages API dan pelaksana alat. Pengalaman CLI/IDE mendedahkan pemikiran dalam dua cara:
- Tetapan global / setiap sesi: Claude Code mendedahkan panel tetapan
/configuntuk melaraskan tingkah laku (cara agen meminta kebenaran, sama ada mengekalkan blok pemikiran, dsb.). Gunakan UI tersebut dan bukannya menaip JSON mentah jika anda mahukan perubahan tingkah laku yang berterusan. - Pemilihan model & arahan CLI: Anda boleh memilih
claude-sonnet-4-5atauclaude-opus-4-5sebagai model aktif dalam REPL; alat dan tingkah laku pemikiran kemudian mengikuti semantik Messages API. CHANGELOG dan nota keluaran menunjukkan pemikiran kini didayakan secara lalai untuk beberapa penyebaran Opus 4.5 dan konfigurasi pemikiran ditampilkan melalui/config.
Aliran praktikal dalam Claude Code:
- Mulakan projek dalam REPL.
- Gunakan
/configuntuk menyemak bendera berkaitan pemikiran (pemeliharaan, keperincian, dsb.). - Minta agen menjalankan tugasan panjang — ia akan menghasilkan kandungan pemikiran dan, jika perlu, meminta kebenaran untuk menjalankan langkah bash tertentu. Kekalkan blok pemikiran apabila anda perlu mengesahkan atau menjalankan semula keputusan kemudian.
Pemasangan dan Persediaan
Claude Code memerlukan Node.js dan boleh dipasang secara global.
# Install Claude Code CLI
npm install -g @anthropic/claude-code
# Authenticate
claude-code --init
Mengaktifkan Pemikiran dalam Terminal
Claude Code menyokong pelbagai bendera dan pencetus bahasa semula jadi untuk mengawal kedalaman penaakulan.
| Arahan/Pencetus | Penerangan |
|---|---|
| claude-code --think | Memulakan sesi dengan pemikiran lanjutan didayakan secara lalai. |
| claude-code --model sonnet-4.5 | Menentukan model frontier terkini. |
| /think <task> | Arahan slash dalam CLI untuk memanggil tugasan khusus yang berat pemikiran. |
| "ultrathink" | Kata kunci bahasa semula jadi yang mengarahkan Claude menggunakan bajet penaakulan maksimum. |
Petua:
- Gunakan
think/think harderapabila anda mahu agen meneroka pelaksanaan alternatif. - Apabila Claude Code melakukan panggilan alat (jalankan ujian, operasi git), kekalkan sebarang blok
thinkingjika CLI/agen mengembalikannya; jika tidak, agen mungkin kehilangan konteks antara langkah.
Faedah Pemikiran Berjalin dan Pemeliharaan Blok
Untuk aliran kerja beragen lanjutan, Claude 4.5 memperkenalkan dua ciri beta yang meningkatkan interaksi berbilang pusingan dan penggunaan alat: Pemikiran Berjalin dan Pemeliharaan Blok Pemikiran.
Pemikiran Berjalin (Beta)
Penaakulan standard berlaku sekali sebelum output. Pemikiran Berjalin (didayakan melalui pengepala interleaved-thinking-2025-05-14) membolehkan Claude “berfikir” di antara panggilan alat.
Bayangkan Claude sedang menyahpepijat pelayan:
- Berfikir: "Saya patut semak log dahulu."
- Panggilan Alat:
read_file(logs.txt) - Berfikir: "Log menunjukkan had masa pangkalan data. Kini saya perlu semak tetapan kolam sambungan."
- Panggilan Alat:
read_file(db_config.yml)
“Renungan berterusan” ini memastikan model menyesuaikan strateginya berdasarkan data yang diterima daripada alat, bukannya mengikuti rancangan tegar yang telah ditakrif.
Pemeliharaan Blok Pemikiran
Dalam perbualan berbilang pusingan, terutamanya yang melibatkan penggunaan alat, adalah penting untuk menghantar semula blok thinking sebelumnya kepada API.
- Kesinambungan penaakulan: Dengan menerima pemikiran sebelumnya, Claude mengekalkan konteks logikal perjalanannya.
- Pengoptimuman Opus 4.5: Dalam Claude Opus 4.5, kelakuan ini diautomasi. Model mengekalkan semua blok pemikiran sebelumnya dalam konteksnya secara lalai, memastikan bahawa walaupun dalam sesi melebihi 30+ jam, model tidak “lupa” mengapa ia membuat keputusan seni bina tertentu sepuluh pusingan lalu.
Amalan terbaik menggunakan mod THINKING dengan Claude 4.5
Pilih model dan bajet yang tepat untuk tugasan:
Gunakan Sonnet 4.5 untuk pengekodan dan aliran beragen di mana anda memerlukan pertukaran terbaik antara kelajuan, kos, dan kebolehan pengekodan yang kukuh; gunakan Opus 4.5 untuk penaakulan paling mendalam dan tetingkap konteks terbesar atau apabila anda merancang menjalankan sesi autonomi yang panjang. Kedua-duanya menyokong pemikiran lanjutan. Pilih budget_tokens sebanding dengan kerumitan tugasan (mulakan kecil semasa eksperimen; tingkatkan bajet hanya jika anda melihat peningkatan kualiti yang ketara).
Pantau dan kawal kos & kependaman
Anda akan dikenakan caj untuk keseluruhan token pemikiran yang dihasilkan oleh Claude, bukan ringkasan output yang anda terima. Ini bermakna pertimbangan dalaman yang panjang meningkatkan kos walaupun anda hanya melihat ringkasan pendek. Jejaki penggunaan token dan pertimbangkan penalaan beransur-ansur (contohnya: 2k → 8k → 32k) apabila bergerak dari penerokaan ke produksi.
Kekalkan blok pemikiran hanya apabila perlu
Blok pemikiran boleh ditandatangani secara kriptografi dan dipelihara untuk pengesahan kemudian dan penggunaan alat berjalin. Elakkan mengulang blok pemikiran dalam setiap permintaan berikutnya melainkan aliran kerja anda memerlukan model mengekalkan pertimbangan dalaman sebelumnya (contohnya, apabila agen akan menjalankan semula langkah dan memerlukan rasional yang dipelihara). Pemeliharaan pemikiran sepanjang masa meningkatkan volum konteks dan boleh merumitkan perakaunan token.
Bila hendak menstrim pemikiran kepada pengguna
Pemikiran yang distrim sangat baik untuk peralatan pembangun dan UI pendidikan (menunjukkan “kerja dalam proses” sementara model membuat pertimbangan). Jangan menstrim pemikiran mentah kepada pengguna akhir aplikasi pengguna pengeluaran tanpa mempertimbangkan keselamatan dan redaksi: pemikiran yang diringkaskan wujud khusus untuk tujuan ini. Jika anda menstrim, sediakan elemen UI yang melabel penaakulan dalaman (cth., “Penaakulan pembantu — dalaman”), dan kawal sama ada pengguna akhir melihat pemikiran diringkaskan atau penuh.
Penggunaan alat dan pengjalinan
Apabila menggabungkan pemikiran dengan alat (pelaksanaan kod, pengambilan web, proses setempat), gunakan reka bentuk pemikiran berjalin apabila anda perlu model memilih alat, menjalankannya, dan berfikir tentang hasil dalam pusingan yang sama. Pengjalinan meningkatkan kerumitan (dan mungkin memerlukan bendera ciri) tetapi berkuasa untuk automasi beragen. Nyatakan dengan jelas pemikiran yang anda pelihara, dan uji bagaimana model memilih alat di bawah sesi pemikiran yang didayakan.
Nota penyelesaian masalah praktikal dan operasi
Ralat biasa dan maksudnya
- Pemikiran tidak sah + pilihan alat terpaksa: Jika anda meminta pemikiran tetapi juga memaksa mod penggunaan alat tertentu yang tidak serasi dengan pemikiran, API akan mengembalikan ralat — jangan gabungkan
tool_choice: {"type":"tool","name":"..."}dengan pemikiran. - Bajet > max_tokens: Untuk senario pemikiran berjalin, peraturan token berkesan berbeza — dokumentasi platform menerangkan bila
budget_tokensboleh melebihimax_tokens. Baca bahagian “interleaved thinking” dengan teliti sebelum menguji bajet besar. - Pengesahan tandatangan: Jika anda memelihara blok pemikiran untuk panggilan kemudian, sertakan
signatureyang dikembalikan supaya API boleh mengesahkan ia datang daripada Claude; ini mencegah pengubahsuaian dan mengekalkan rantaian boleh disahkan.
Kebolehcerapan & instrumentasi
Log: (1) pemilihan model, (2) thinking.budget_tokens, (3) penggunaan token pemikiran sebenar (anda dibil untuknya), (4) kependaman penstriman (masa ke thinking_delta pertama), dan (5) token teks akhir. Gunakan metrik ini untuk membina bajet dan SLO bagi aliran menghadap pengguna.
Pengeluaran progresif & manusia dalam gelung
Keluarkan model berdaya pemikiran di belakang bendera ciri. Mulakan dengan peratusan trafik pembangun atau dalaman, kumpulkan kegagalan atau redaksi, dan ulang kaji prompt serta bajet. Untuk domain sensitif, wajibkan semakan manusia pada output yang mengandungi penaakulan dalaman yang besar sebelum dilepaskan.
Petua penyahpepijatan
- Mulakan kecil: dayakan
budget_tokensrendah dan skala untuk memahami peningkatan beransur-ansur. - Hidupkan penstriman dan log acara
content_block_delta/ tandatangan untuk memahami bila model menghasilkan blok pemikiran. - Jika menggunakan Claude Code: semak
/configdan tetapan peringkat projek; rujuk changelog Claude Code jika tingkah laku tidak sepadan dengan lalai yang dijangka.
Kesimpulan:
Claude 4.5, digabungkan dengan kuasa Extended Thinking dan CLI Claude Code, mewakili lonjakan paling signifikan dalam produktiviti pembangun sejak penciptaan IDE. Dengan membolehkan model “menunjukkan kerjanya” dan mempertimbangkan masalah kompleks, Anthropic telah melangkaui era “chatbot” kepada era “beragen”.
Sama ada anda mengintegrasikan Messages API ke dalam peralatan pembangun buatan khusus atau menggunakan Claude Code untuk mengurus PR harian anda, menguasai Thinking Mode adalah penting. Ia menyediakan ketelusan yang diperlukan untuk kepercayaan dan kedalaman penaakulan yang diperlukan untuk kecemerlangan.
Pembangun boleh mengakses model Claude 4.5 (Claude Sonnet 4.5 , Claude Haiku 4.5, Claude Opus 4.5) melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda melakukan integrasi.
Ready to Go?→ Percubaan percuma Claude 4.5!
