Mod Pemikiran dalam Claude 4.5: Semua yang Perlu Anda Tahu

CometAPI
AnnaDec 30, 2025
Mod Pemikiran dalam Claude 4.5: Semua yang Perlu Anda Tahu

Keluarga Claude 4.5 milik Anthropic (terutamanya Sonnet 4.5 dan Opus 4.5) membawa “pemikiran” lanjutan / penaakulan dalaman gaya scratchpad ke barisan Claude 4 mereka. Messages API menzahirkan keupayaan itu melalui objek thinking (aktif/nyahaktif + peruntukan budget_tokens), pilihan penstriman, dan pengendalian khas untuk blok kandungan “thinking” (termasuk tandatangan dan redaksi). Sonnet 4.5 menyasarkan tugas pengkodan dan ejenik serta mendapat manfaat besar daripada pemikiran lanjutan; Opus 4.5 menambah blok pemikiran yang dipelihara dan pengoptimuman lain.

Apakah itu Claude 4.5?

Claude 4.5 (diterbitkan dalam keluarga model Claude Anthropic sebagai varian Sonnet 4.5 dan Opus 4.5) ialah generasi terkini model bahasa besar syarikat yang ditala untuk penaakulan lebih mendalam, konteks jangka panjang, dan pengkodan/ aliran kerja ejen berkualiti produksi. Dalam pengumuman dan halaman produk Anthropic, Sonnet 4.5 digambarkan sebagai satu lonjakan besar untuk pengkodan, pembinaan ejen, dan “menggunakan komputer” (iaitu aliran kerja dibantu alat dan automasi berbilang langkah), dengan peningkatan terukur dalam penaakulan, matematik, dan tugas berkonteks panjang.

Susunan Keluarga 4.5

  • Claude Sonnet 4.5 (Dikeluarkan 29 Sep 2025): “Workhorse” keluarga. Pada masa ini dinilai sebagai model pengkodan terbaik di dunia, mampu mengekalkan fokus pada tugas autonomi melebihi 30 jam. Ia mengimbangi kelajuan, kos, dan penaakulan peringkat tinggi, menjadikannya pilihan lalai bagi kebanyakan aplikasi perusahaan.
  • Claude Haiku 4.5 (Dikeluarkan 15 Okt 2025): Model dioptimumkan untuk kelajuan. Mengejutkan, kini menyokong Extended Thinking, menjadikannya model “kecil” pertama yang menawarkan keupayaan penaakulan mendalam yang sebelum ini khusus untuk model hadapan. Ia ideal untuk tugas berfrekuensi tinggi di mana latensi penting tetapi ketepatan tidak boleh dikompromi.
  • Claude Opus 4.5 (Dikeluarkan 24 Nov 2025): Model kecerdasan hadapan. Opus 4.5 direka untuk tugas paling kompleks dan samar—seperti penyelidikan saintifik, reka bentuk seni bina baharu, dan analisis kewangan berisiko tinggi. Ia mempunyai kapasiti “bajet pemikiran” tertinggi dan cemerlang dalam pembetulan kendiri.

Keupayaan utama secara sekilas

  • Tetingkap konteks boleh guna lebih besar dan tingkah laku lebih baik dalam tugas jangka panjang (aliran kerja ejen, nyahpepijat langkah demi langkah, suntingan pangkalan kod).
  • Prestasi lebih baik pada penanda aras pengkodan, pengubahan semula, dan tugas penggunaan alat berbilang langkah (keluarga Sonnet dan Opus).
  • Ciri “pemikiran” lanjutan (apa yang Anthropic panggil extended thinking / thinking mode) yang mendedahkan—secara pilihan—sebahagian penaakulan berperingkat dalaman model kepada pembangun atau membenarkan model membelanjakan “bajet” token yang boleh dikonfigurasi untuk berfikir sebelum menghasilkan jawapan akhir.

Di mana anda boleh menjalankan Claude 4.5

Claude 4.5 (Sonnet/Opus) tersedia melalui API Anthropic sendiri dan telah disepadukan ke CometAPI(harga API kini dalam jualan, kira-kira 20% daripada harga Anthropic. ), jadi anda boleh menjalankan model ini melalui platform Anthropic atau melalui vendor awan pihak ketiga yang mengehoskan model tersebut.

Apakah mod THINKING baharu dalam Claude Code dan Claude 4.5?

“Extended thinking” Anthropic (alias “thinking mode”, “thinking blocks”, atau “thinking tokens”) ialah ciri yang membolehkan model melakukan langkah pensampelan dalaman tambahan untuk menaakul dengan lebih teliti sebelum menghasilkan jawapan akhir. Anda mendayakannya dengan menambah konfigurasi thinking pada permintaan Messages API anda (contohnya: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) atau menggunakan pembantu SDK Anthropic. Apabila didayakan, API akan (bergantung pada model) sama ada memulangkan versi ringkas penaakulan dalaman atau memulangkan penaakulan penuh (tertakluk pada redaksi untuk keselamatan).

Untuk memahami mengapa “Thinking Mode” bersifat revolusioner, kita harus melihat bagaimana Model Bahasa Besar (LLM) beroperasi secara tradisional. Model standard ialah “penjana teks probabilistik”—mereka meramal token seterusnya sejurus selepas menerima gesaan. Mereka tidak “berhenti untuk berfikir”; mereka mula “bercakap” (menjana) serta-merta.

Peralihan kepada “Pemikiran Lanjutan”

Thinking Mode mengubah paradigma ini. Apabila didayakan, Claude 4.5 menjana aliran tersembunyi “thinking tokens” sebelum ia mengeluarkan satu aksara yang kelihatan kepada pengguna.

Penaakulan Kelihatan (Pilihan): Dalam sesetengah antara muka seperti Claude.ai, anda boleh melihat juntai bawah “Thinking” yang memaparkan monolog dalaman model.

Penaakulan Tersembunyi (API): Dalam API, ini ialah blok thinking yang berbeza. Model menggunakan ruang ini untuk:

  • Nyahbina gesaan: Menghuraikan kekangan kompleks.
  • Merancang strategi: Menggariskan logik langkah demi langkah.
  • Draf dan Mengkritik: Mencuba penyelesaian secara mental, menemui kecacatan, dan membetulkannya sebelum membentangkan jawapan.

Pemikiran Berselang-seli

Inovasi utama dalam Sonnet 4.5 ialah Interleaved Thinking. Dalam aliran kerja ejenik (di mana AI menggunakan alat seperti kalkulator, pentafsir kod, atau pelayar web), model standard hanya akan memanggil alat, mendapat hasil, dan serta-merta memanggil alat seterusnya.

Dengan Interleaved Thinking, Claude 4.5 boleh:

  1. Berfikir tentang permintaan pengguna.
  2. Memanggil Alat A (cth., Cari di web).
  3. Berfikir tentang hasil carian (“Keputusan ini sudah lapuk, saya patut cuba pertanyaan berbeza”).
  4. Memanggil Alat B (cth., Cari lagi).
  5. Berfikir tentang cara mensintesis data.
  6. Respons Akhir.

Gelung “Fikir-Bertindak-Fikir-Bertindak” ini mengurangkan secara drastik halusinasi dan perambatan ralat dalam tugas pengkodan berbilang langkah yang panjang.

Bagaimana Claude Code memaparkan pemikiran dalam alat pembangun

Dalam Claude Code (pengalaman CLI / penyunting), Anthropic telah menambah peruntukan UI untuk togol mod pemikiran bagi sesi interaktif (UX lazim ialah menekan Tab untuk menghidupkan/mematikan pemikiran) dan untuk menunjukkan penunjuk bagi bajet pemikiran semasa. Beberapa kata kunci pencetus yang lama (cth., think, think hard) pernah digunakan secara sejarah untuk mengawal kedalaman pemikiran; versi moden bergantung pada togol eksplisit dan parameter bajet, dengan ultrathink kekal tersedia dalam sesetengah konteks. Konfigurasi boleh menjadi global dalam ~/.claude/settings.json atau ditindih per permintaan.

Bagaimana melaksanakan Mod Pemikiran Claude 4.5?

Bagi pembangun, peralihan ke Claude 4.5 memerlukan perubahan dalam cara permintaan API distrukturkan. Anda tidak lagi hanya menghantar gesaan; anda mengurus “Bajet Pemikiran”.

Menetapkan Bajet Pemikiran

Parameter thinking kini merupakan entiti aras pertama dalam API Anthropic. Anda mesti mendayakannya secara eksplisit dan mentakrifkan nilai budget_tokens. Nilai ini mewakili jumlah maksimum komput yang boleh dibelanjakan model untuk penaakulan dalaman.

Contoh Pelaksanaan Python

import anthropic

# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # We set a high max_tokens to accommodate both thinking and the final answer
    # The budget_tokens must be less than max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allocating 12k tokens for 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Extracting the two distinct parts of the response
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)

Pertimbangan Teknikal Utama

  • Jumlah Penggunaan Token: Jumlah penggunaan anda ialah thinking_tokens + output_tokens. Jika anda menetapkan bajet 10,000 token dan model menggunakan 8,000 untuk pemikiran dan 2,000 untuk jawapan, anda akan dicaj untuk 10,000 token output.
  • Pemikiran Dipaksa: Jika tugas terlalu mudah, model mungkin masih menggunakan bilangan minimum thinking tokens untuk mengesahkan kesederhanaan permintaan.

Bagaimana Thinking Mode mempertingkat penjanaan kod?

Salah satu peningkatan paling ketara dalam Claude 4.5 ialah prestasinya dalam Claude Code CLI. Apabila Claude 4.5 “berfikir” tentang kod, ia melakukan beberapa tindakan tersembunyi yang tidak diendahkan model standard.

1. Pemetaan Kebergantungan

Sebelum menulis satu baris pembaikan, Claude 4.5 merentas repositori anda untuk memahami bagaimana perubahan dalam utils/auth.ts mungkin merosakkan komponen dalam views/Profile.tsx.

2. Pelaksanaan Mental

Model “menjalankan” kod dalam blok penaakulannya. Ia mensimulasikan aliran logik dan mengenal pasti kemungkinan keadaan perlumbaan atau ralat off-by-one.

3. Pengesahan Kekangan

Jika anda meminta penyelesaian yang “berprestasi dan tidak menggunakan perpustakaan luaran,” mod pemikiran bertindak sebagai penjaga pintu. Jika naluri pertama model ialah mencadangkan pakej NPM, proses pemikiran akan menangkap pelanggaran itu dan memaksa model memikirkan semula pelaksanaan JavaScript vanila.

Bagaimana Thinking Mode berbanding pemintaan tradisional?

Ramai pengguna biasa dengan pemintaan “Chain of Thought” (CoT), di mana anda memberitahu model: “Fikir langkah demi langkah.” Walaupun berkesan, ia tidak sama dengan Thinking Mode asli Claude 4.5.

CiriRantaian Pemikiran (Manual)Pemikiran Lanjutan (Asli)
MekanismeArahan digerakkan oleh pengguna.Seni bina model terbina dalam.
Ruang TokenMengambil ruang output yang kelihatan.Mengambil blok dalaman khusus.
Pembetulan KendiriTerhad; model sering “menggandakan” kesilapan awal.Tinggi; model boleh membuang seluruh laluan penaakulan dan bermula semula.
KebolehpercayaanBerubah-ubah bergantung pada kualiti gesaan.Konsisten tinggi merentasi domain kompleks.
Pengendalian APIMemerlukan penghuraian teks manual.Blok JSON berstruktur untuk “thinking” dan “text”.

Bagaimana mod pemikiran berfungsi dalam Claude 4.5?

Aliran kerja dalaman (konseptual)

  1. Permintaan pengguna: Aplikasi anda menghantar permintaan Messages API yang menyatakan model, gesaan, max_tokens, dan secara pilihan thinking: { type: "enabled", budget_tokens: N }.
  2. Penaakulan dalaman: Claude menjalankan “pemikiran” dalaman sehingga bajet. Ia merekod output penaakulan sebagai blok thinking (yang mungkin diringkaskan untuk pengguna).
  3. Penggubahan output: API memulangkan susunan blok kandungan. Lazimnya tertibnya ialah blok thinking kemudian blok text (jawapan akhir). Jika menstrim, anda menerima acara thinking_delta diikuti acara text_delta.
  4. Pemeliharaan konteks: Apabila menggunakan alat atau aliran berbilang giliran anda boleh hantarkan semula blok thinking sebelumnya (tanpa ubah suai) supaya Claude boleh meneruskan rantaian pemikiran. Opus 4.5 memperkenalkan tingkah laku untuk memelihara blok pemikiran secara lalai bagi cache/kecekapan.

Secara teknikal, Thinking Mode bergantung pada konfigurasi parameter API khusus yang memperuntukkan “Bajet” token untuk penaakulan.

Konsep Bajet Token

Apabila anda membuat permintaan kepada Claude 4.5, anda mesti menentukan parameter budget_tokens. Ini ialah jumlah maksimum token yang dibenarkan model untuk monolog dalaman.

  • Bajet Rendah (<2,000 token): Sesuai untuk semakan cepat atau teka-teki logik mudah.
  • Bajet Tinggi (10,000+ token): Diperlukan untuk seni bina perisian kompleks, bukti matematik, atau menulis ringkas undang-undang yang komprehensif.

Model dilatih untuk “mengurus” bajet ini. Jika ia mengesan bajet hampir habis, ia akan cuba menamatkan penaakulan dan memberikan jawapan terbaik yang mungkin.

Kitar Hayat “Proses Pemikiran”

Apabila pengguna bertanya: “Tulis skrip Python untuk mengikis laman web ini, tetapi pastikan ia menghormati robots.txt dan mengendalikan pemuatan dinamik.”

  1. Pengambilan: Claude membaca gesaan.
  2. Fasa Pemikiran (Tersembunyi):
    • Pembetulan Kendiri: “Saya perlu menggunakan Selenium atau Playwright untuk pemuatan dinamik. requests tidak akan berfungsi.”
    • Semakan Keselamatan: “Saya mesti mengesahkan pengguna mempunyai kebenaran untuk mengikis. Saya akan menambah penafian.”
    • Seni Bina: “Saya akan menyusun kod dengan pendekatan berasaskan kelas untuk modulariti.”
  3. Fasa Output (Kelihatan): Claude menjana kod Python.

Dalam model sebelumnya, AI mungkin mula menulis kod requests serta-merta, menyedari separuh jalan bahawa ia tidak berfungsi untuk kandungan dinamik, dan kemudian sama ada berhalusinasi penyelesaian atau memberikan kod yang rosak. Mod pemikiran mengelakkan senario “terperangkap di penjuru” ini.

Bila anda patut mendayakan mod pemikiran — kes penggunaan dan heuristik?

Kes penggunaan yang paling mendapat manfaat

  • Pengkodan kompleks (perubahan seni bina, pengubahan semula berbilang fail, sesi nyahpepijat panjang). Sonnet 4.5 secara eksplisit diposisikan sebagai peneraju pengkodan dan ejenik apabila pemikiran digunakan.
  • Aliran kerja ejenik yang menggunakan alat berulang kali dan mesti memelihara konteks dalaman merentas banyak langkah. Pemikiran berselang-seli + penggunaan alat ialah senario utama.
  • Penyelidikan atau analisis mendalam (analisis statistik, penstrukturan kewangan, penaakulan undang-undang) di mana langkah penaakulan perantaraan berguna untuk diperiksa atau disahkan.

Bila tidak perlu mendayakannya

  • Penjanaan jawapan pendek atau API berkelajuan tinggi berlatensi minimum (cth., UI sembang yang memerlukan respons pada tahap milisaat).
  • Tugas di mana kos token per permintaan mesti diminimumkan dan tugas adalah mudah atau ditentukan dengan baik.

Heuristik praktikal

Mulakan dengan bajet pemikiran minimum (≈1,024 token) dan tingkatkan secara progresif untuk tugas yang memerlukan lebih kedalaman; tanda aras ketepatan tugas hujung ke hujung berbanding latensi dan token. Untuk tugas ejen berbilang langkah, uji pemikiran berselang-seli dan titik henti prompt bercache untuk mencari titik manis.

Kesimpulan

Thinking Mode Claude 4.5 lebih daripada sekadar ciri; ia adalah cara baharu berinteraksi dengan kecerdasan buatan. Dengan memisahkan proses pemikiran daripada produk pemikiran, Anthropic menyediakan alat yang lebih boleh dipercayai, lebih telus, dan lebih berkeupayaan menangani kerumitan kerja perusahaan moden.

Sama ada anda menggunakan Claude Code CLI untuk mengurus migrasi besar-besaran atau menggunakan API untuk membina generasi seterusnya ejen autonomi, menguasai “Bajet Pemikiran” ialah kunci kejayaan.

Pembangun boleh mengakses model Claude 4.5 melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda membuat integrasi.

Sedia Bermula?→ Percubaan percuma Claude 4.5!

Akses Model Terbaik dengan Kos Rendah

Baca Lagi