Keluarga Claude 4.5 daripada Anthropic (terutamanya Sonnet 4.5 dan Opus 4.5) membawa “pemikiran” lanjutan / penaakulan dalaman gaya buku catatan ke dalam siri Claude 4 mereka. API Mesej mendedahkan keupayaan itu melalui objek thinking (aktif/nyahaktif + peruntukan budget_tokens), pilihan penstriman, dan pengendalian khas untuk blok kandungan “thinking” (termasuk tandatangan dan redaksi). Sonnet 4.5 menyasarkan tugas pengkodan dan agenik dan mendapat banyak manfaat daripada pemikiran lanjutan; Opus 4.5 menambah blok pemikiran yang dipelihara serta pengoptimuman lain.
Apakah Claude 4.5?
Claude 4.5 (diterbitkan dalam keluarga model Claude sebagai varian Sonnet 4.5 dan Opus 4.5) ialah generasi terbaharu model bahasa besar syarikat yang ditala untuk penaakulan lebih mendalam, konteks jangka panjang, serta pengkodan berkualiti produksi / aliran kerja agenik. Dalam pengumuman dan halaman produk Anthropic, Sonnet 4.5 digambarkan sebagai langkah besar ke hadapan untuk pengkodan, pembinaan agen, dan “menggunakan komputer” (iaitu aliran kerja dibantu alat dan automasi berbilang langkah), dengan peningkatan yang boleh diukur pada tugas penaakulan, matematik, dan konteks panjang.
Barisan Keluarga 4.5
- Claude Sonnet 4.5 (Released Sept 29, 2025): “Tulang belakang” keluarga. Ia kini dinilai sebagai model pengkodan terbaik di dunia, mampu mengekalkan fokus pada tugas autonomi lebih 30 jam. Ia mengimbangi kelajuan, kos, dan penaakulan peringkat tinggi, menjadikannya pilihan lalai bagi kebanyakan aplikasi perusahaan.
- Claude Haiku 4.5 (Released Oct 15, 2025): Model yang dioptimumkan untuk kelajuan. Mengejutkan, kini ia menyokong Pemikiran Lanjutan, menjadikannya model “kecil” pertama yang menawarkan keupayaan penaakulan mendalam yang sebelum ini terhad kepada model termaju. Ia sesuai untuk tugas berfrekuensi tinggi yang mementingkan kependaman namun ketepatan tidak boleh dikorbankan.
- Claude Opus 4.5 (Released Nov 24, 2025): Model kecerdasan termaju. Opus 4.5 direka untuk tugas paling kompleks dan samar—seperti penyelidikan saintifik, reka bentuk seni bina baharu, dan analisis kewangan berisiko tinggi. Ia mempunyai kapasiti “bajet pemikiran” tertinggi dan cemerlang dalam pembetulan kendiri.
Keupayaan utama sekilas pandang
- Tetingkap konteks yang boleh digunakan lebih besar dan tingkah laku yang dipertingkat dalam tugas jangka panjang (aliran kerja agen, nyahpepijat langkah demi langkah, pengeditan pangkalan kod).
- Prestasi lebih baik pada penanda aras pengkodan, pemfaktoran semula, dan tugas penggunaan alat berbilang langkah (keluarga Sonnet dan Opus).
- Ciri “pemikiran” lanjutan (apa yang Anthropic panggil pemikiran lanjutan / mod pemikiran) yang mendedahkan—secara pilihan—sebahagian penaakulan berperingkat dalaman model kepada pembangun atau membenarkan model membelanjakan “bajet” token yang boleh dikonfigurasi untuk berfikir sebelum menghasilkan jawapan akhir.
Di mana anda boleh menjalankan Claude 4.5
Claude 4.5 (Sonnet/Opus) tersedia melalui API Anthropic sendiri dan telah disepadukan ke dalam CometAPI(harga API kini sedang promosi, kira-kira 20% daripada harga Anthropic), jadi anda boleh menjalankan model ini melalui platform Anthropic atau melalui vendor awan pihak ketiga yang menjadi hos model.
Apakah mod THINKING baharu dalam Claude Code dan Claude 4.5?
“Pemikiran lanjutan” Anthropic (aka “mod pemikiran,” “blok pemikiran,” atau “token pemikiran”) ialah ciri yang membolehkan model melakukan langkah pensampelan dalaman tambahan untuk berfikir dengan lebih teliti sebelum menghasilkan jawapan akhir. Anda mengaktifkannya dengan menambah konfigurasi thinking pada permintaan API Mesej anda (contohnya: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) atau menggunakan pembantu SDK Anthropic. Apabila diaktifkan, API akan (bergantung pada model) sama ada mengembalikan versi ringkasan penaakulan dalaman atau mengembalikan penaakulan penuh (tertakluk kepada redaksi untuk keselamatan).
Untuk memahami mengapa “Thinking Mode” adalah revolusioner, kita mesti melihat bagaimana Model Bahasa Besar (LLM) beroperasi secara tradisional. Model standard ialah “penjana teks probabilistik”—mereka meramalkan token seterusnya serta-merta selepas menerima prompt. Mereka tidak “berhenti untuk berfikir”; mereka mula “bercakap” (menjana) serta-merta.
Peralihan kepada “Extended Thinking”
Thinking Mode mengubah paradigma ini. Apabila diaktifkan, Claude 4.5 menjana aliran tersembunyi “token pemikiran” sebelum ia mengeluarkan satu aksara yang kelihatan kepada pengguna.
Penaakulan Kelihatan (Pilihan): Dalam sesetengah antara muka seperti Claude.ai, anda boleh melihat menu lungsur “Thinking” yang memaparkan monolog dalaman model.
Penaakulan Tersembunyi (API): Dalam API, ini ialah blok thinking yang berbeza. Model menggunakan ruang ini untuk:
- Menguraikan prompt: Memecahkan kekangan kompleks.
- Merancang strategi: Menggariskan logik langkah demi langkah.
- Draf dan Mengkritik: Mencuba penyelesaian secara mental, menemui kelemahan, dan membetulkannya sebelum membentangkan jawapan.
Pemikiran Berselang-seli
Inovasi utama dalam Sonnet 4.5 ialah Interleaved Thinking. Dalam aliran kerja agenik (di mana AI menggunakan alat seperti kalkulator, penterjemah kod, atau pelayar web), model standard hanya akan memanggil alat, mendapat hasil, dan segera memanggil alat seterusnya.
Dengan Interleaved Thinking, Claude 4.5 boleh:
- Fikir tentang permintaan pengguna.
- Panggil Alat A (cth., Cari web).
- Fikir tentang hasil carian (“Keputusan ini sudah lapuk, saya patut cuba pertanyaan yang berbeza”).
- Panggil Alat B (cth., Cari lagi).
- Fikir cara menyintesiskan data.
- Respons Akhir.
Kitaran “Fikir-Bertindak-Fikir-Bertindak” ini mengurangkan halusinasi dan penyebaran ralat secara drastik dalam tugas pengkodan berbilang langkah yang panjang.
Cara Claude Code memaparkan pemikiran dalam alat pembangun
Dalam Claude Code (pengalaman CLI / editor), Anthropic telah menambah affordans UI untuk menogol mod pemikiran bagi sesi interaktif (UX biasa ialah menekan Tab untuk togol pemikiran hidup/mati) dan memaparkan penunjuk untuk bajet pemikiran semasa. Beberapa kata kunci pencetus lama (cth., think, think hard) digunakan secara sejarah untuk mengawal kedalaman pemikiran; versi moden bergantung pada togol eksplisit dan parameter bajet, dengan ultrathink kekal tersedia dalam sesetengah konteks. Konfigurasi boleh bersifat global dalam ~/.claude/settings.json atau ditulis ganti bagi setiap permintaan.
Bagaimana melaksanakan Mod Pemikiran Claude 4.5?
Bagi pembangun, peralihan kepada Claude 4.5 memerlukan perubahan pada cara permintaan API distrukturkan. Anda bukan lagi sekadar menghantar prompt; anda mengurus “Bajet Pemikiran.”
Menetapkan Bajet Pemikiran
Parameter thinking kini ialah entiti kelas pertama dalam API Anthropic. Anda mesti mengaktifkannya secara eksplisit dan menentukan nilai budget_tokens. Nilai ini mewakili jumlah maksimum compute yang boleh dibelanjakan model untuk penaakulan dalaman.
Contoh Pelaksanaan Python
Kod berikut menunjukkan cara memulakan sesi Claude 4.5 dengan Pemikiran Lanjutan diaktifkan.
import anthropic
# Memulakan perspektif Gemini Enterprise pada integrasi Claude 4.5
client = anthropic.Anthropic(api_key="your_api_key")
def get_reasoned_response(user_query):
# Kami menetapkan max_tokens yang tinggi untuk menampung kedua-dua pemikiran dan jawapan akhir
# budget_tokens mesti kurang daripada max_tokens
response = client.messages.create(
model="claude-4-5-sonnet-202512",
max_tokens=20000,
thinking={
"type": "enabled",
"budget_tokens": 12000 # Memperuntukkan 12k token untuk 'thinking'
},
messages=[
{"role": "user", "content": user_query}
]
)
# Mengekstrak dua bahagian berbeza dalam respons
thinking_content = ""
final_output = ""
for block in response.content:
if block.type == "thinking":
thinking_content = block.thinking
elif block.type == "text":
final_output = block.text
return thinking_content, final_output
# Contoh pertanyaan kompleks
query = "Reka bentuk sistem bukti pengetahuan sifar untuk aplikasi pengundian terdesentralisasi menggunakan Circom."
thoughts, answer = get_reasoned_response(query)
print("--- PEMIKIRAN DALAMAN CLAUDE ---")
print(thoughts)
print("\n--- SENIBINA TEKNIKAL AKHIR ---")
print(answer)
Pertimbangan Teknikal Utama
- Jumlah Penggunaan Token: Jumlah penggunaan anda ialah
thinking_tokens+output_tokens. Jika anda menetapkan bajet 10,000 token dan model menggunakan 8,000 untuk pemikiran serta 2,000 untuk jawapan, anda akan dicaj untuk 10,000 token output. - Pemikiran Paksa: Jika tugas terlalu mudah, model mungkin tetap menggunakan bilangan minimum token pemikiran untuk mengesahkan kesederhanaan permintaan.
Bagaimana Mod Pemikiran meningkatkan penjanaan kod?
Salah satu peningkatan paling ketara dalam Claude 4.5 ialah prestasinya dalam CLI Claude Code. Apabila Claude 4.5 “berfikir” tentang kod, ia melakukan beberapa tindakan tersembunyi yang diabaikan oleh model standard.
1. Pemetaan Kebergantungan
Sebelum menulis satu baris pembaikan, Claude 4.5 menelusuri repositori anda untuk memahami bagaimana perubahan dalam utils/auth.ts mungkin memecahkan komponen di views/Profile.tsx.
2. Pelaksanaan Mental
Model “menjalankan” kod dalam blok penaakulan. Ia mensimulasikan aliran logik dan mengenal pasti potensi keadaan perlumbaan atau ralat off-by-one.
3. Pengesahan Kekangan
Jika anda meminta penyelesaian yang “berprestasi dan tidak menggunakan perpustakaan luaran,” mod pemikiran bertindak sebagai penjaga pintu. Jika naluri pertama model ialah mencadangkan pakej NPM, proses pemikiran akan menangkap pelanggaran itu dan memaksa model memikirkan semula pelaksanaan JavaScript vanilla.
Bagaimana Mod Pemikiran dibandingkan dengan prompt tradisional?
| Ciri | Rantaian Pemikiran (Manual) | Pemikiran Lanjutan (Asli) |
|---|---|---|
| Mekanisme | Arahan dipacu pengguna. | Seni bina terbina dalam model. |
| Ruang Token | Mengambil ruang output yang kelihatan. | Mengambil blok dalaman khusus. |
| Pembetulan Kendiri | Terhad; model sering “teruskan” kesilapan awal. | Tinggi; model boleh membuang seluruh laluan penaakulan dan bermula semula. |
| Kebolehpercayaan | Berubah-ubah bergantung pada kualiti prompt. | Secara konsisten tinggi merentas domain kompleks. |
| Pengendalian API | Memerlukan penghuraian teks manual. | Blok JSON berstruktur untuk “thinking” dan “text”. |
Bagaimana mod pemikiran berfungsi dalam Claude 4.5?
Aliran kerja dalaman (konseptual)
- Permintaan pengguna: Aplikasi anda menghantar permintaan API Mesej yang menyatakan model, prompt,
max_tokens, dan pilihanthinking: { type: "enabled", budget_tokens: N }. - Penaakulan dalaman: Claude melakukan “pemikiran” dalaman sehingga bajet. Ia merekodkan output penaakulan sebagai blok
thinking(yang mungkin diringkaskan untuk pengguna). - Penggubahan output: API mengembalikan tatasusunan blok kandungan. Biasanya tertibnya ialah blok
thinkingdiikuti bloktext(jawapan akhir). Jika penstriman, anda menerima peristiwathinking_deltadiikuti olehtext_delta. - Memelihara konteks: Apabila menggunakan alat atau aliran berbilang pusingan, anda boleh menghantar semula blok pemikiran sebelumnya (tanpa diubah) supaya Claude boleh meneruskan rantaian pemikiran. Opus 4.5 memperkenalkan tingkah laku untuk memelihara blok pemikiran secara lalai demi cache/kecekapan.
Secara teknikal, Mod Pemikiran bergantung pada konfigurasi parameter API tertentu yang memperuntukkan “Bajet” token untuk penaakulan.
Konsep Bajet Token
Apabila anda membuat permintaan kepada Claude 4.5, anda mesti menyatakan parameter budget_tokens. Ini ialah jumlah maksimum token yang dibenarkan untuk monolog dalaman model.
- Bajet Rendah (<2,000 token): Sesuai untuk semakan pantas atau teka-teki logik mudah.
- Bajet Tinggi (10,000+ token): Diperlukan untuk seni bina perisian kompleks, bukti matematik, atau penulisan ringkas undang-undang komprehensif.
Model dilatih untuk “mengurus” bajet ini. Jika ia mengesan bajet semakin berkurang, ia akan cuba menamatkan penaakulannya dan memberikan jawapan terbaik yang mungkin.
Kitar hayat “Proses Pemikiran”
Apabila pengguna bertanya: “Tulis skrip Python untuk mengikis laman ini, tetapi pastikan ia menghormati robots.txt dan mengendalikan pemuatan dinamik.”
- Pemasukan: Claude membaca prompt.
- Fasa Pemikiran (Tersembunyi):
- Pembetulan Kendiri: “Saya perlu menggunakan Selenium atau Playwright untuk pemuatan dinamik.
requeststidak akan berfungsi.” - Semakan Keselamatan: “Saya mesti mengesahkan pengguna mempunyai kebenaran untuk mengikis. Saya akan menambah penafian.”
- Seni bina: “Saya akan menyusun kod dengan pendekatan berasaskan kelas untuk modulariti.”
- Pembetulan Kendiri: “Saya perlu menggunakan Selenium atau Playwright untuk pemuatan dinamik.
- Fasa Output (Kelihatan): Claude menjana kod Python.
Dalam model terdahulu, AI mungkin mula menulis kod requests serta-merta, menyedari separuh jalan bahawa ia tidak berfungsi untuk kandungan dinamik, lalu sama ada berhalusinasi penyelesaian atau menghasilkan kod rosak. Mod pemikiran mengelakkan senario “terperangkap di penjuru” ini.
Bila anda patut mengaktifkan mod pemikiran — kes guna dan heuristik?
Kes guna yang paling mendapat manfaat
- Pengkodan kompleks (perubahan seni bina, pemfaktoran semula berbilang fail, sesi nyahpepijat panjang). Sonnet 4.5 jelas diposisikan sebagai peneraju pengkodan dan agenik apabila pemikiran digunakan.
- Aliran kerja agenik yang menggunakan alat berulang kali dan mesti memelihara konteks dalaman merentas banyak langkah. Pemikiran berselang-seli + penggunaan alat ialah senario utama.
- Penyelidikan atau analisis mendalam (analisis statistik, pemstrukturan kewangan, penaakulan undang-undang) di mana langkah penaakulan perantaraan berguna untuk diperiksa atau disahkan.
Bila tidak patut diaktifkan
- Penjanaan jawapan pendek atau API berkapasiti tinggi berkependaman minimum (cth., UI sembang yang memerlukan respons pada aras milisaat).
- Tugas di mana kos token per permintaan mesti diminimumkan dan tugas adalah mudah atau ditentukan dengan baik.
Heuristik praktikal
Mulakan dengan bajet pemikiran minimum (≈1,024 token) dan tingkatkan secara progresif untuk tugas yang memerlukan lebih kedalaman; ukur ketepatan tugas hujung ke hujung berbanding kependaman dan token. Untuk tugas agen berbilang langkah, bereksperimen dengan pemikiran berselang-seli dan titik henti prompt yang dicache untuk mencari titik manis.
Kesimpulan
Mod Pemikiran Claude 4.5 lebih daripada sekadar ciri; ia ialah cara baharu berinteraksi dengan kecerdasan buatan. Dengan memisahkan proses pemikiran daripada produk pemikiran, Anthropic telah menyediakan alat yang lebih boleh dipercayai, lebih telus, dan lebih berupaya menangani kerumitan kerja perusahaan moden.
Sama ada anda menggunakan CLI Claude Code untuk mengurus migrasi besar atau menggunakan API untuk membina generasi seterusnya agen autonomi, menguasai “Bajet Pemikiran” ialah kunci kejayaan.
Pembangun boleh mengakses model Claude 4.5 melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda melakukan integrasi.
Sedia untuk bermula?→ Percubaan percuma Claude 4.5!
