Mode Berpikir di Claude 4.5: Semua yang Perlu Anda Ketahui

Keluarga Claude 4.5 dari Anthropic (terutama Sonnet 4.5 dan Opus 4.5) menghadirkan penalaran internal gaya “berpikir”/scratchpad yang diperluas ke lini Claude 4. Messages API mengekspos kemampuan tersebut melalui objek thinking (aktif/nonaktif + alokasi budget_tokens), opsi streaming, dan penanganan khusus untuk blok konten “thinking” (termasuk tanda tangan dan redaksi). Sonnet 4.5 menargetkan tugas pengodean dan berbasis agen serta sangat diuntungkan oleh pemikiran yang diperluas; Opus 4.5 menambahkan blok berpikir yang dipertahankan dan optimalisasi lainnya.

Apa itu Claude 4.5?

Claude 4.5 (diterbitkan dalam keluarga model Claude Anthropic sebagai varian Sonnet 4.5 dan Opus 4.5) adalah generasi terbaru model bahasa besar perusahaan yang disetel untuk penalaran lebih mendalam, konteks jangka panjang, dan alur kerja pengodean/agen berkualitas produksi. Dalam pengumuman dan laman produk Anthropic, Sonnet 4.5 digambarkan sebagai lompatan besar untuk pengodean, pembangunan agen, dan “menggunakan komputer” (yaitu alur kerja berbantuan alat dan otomasi multi-langkah), dengan peningkatan terukur pada penalaran, matematika, dan tugas konteks panjang.

Lini Keluarga 4.5

Claude Sonnet 4.5 (Dirilis 29 Sept 2025): “Kuda kerja” dari keluarga ini. Saat ini dinilai sebagai model pengodean terbaik di dunia, mampu mempertahankan fokus pada tugas otonom lebih dari 30 jam. Menyeimbangkan kecepatan, biaya, dan penalaran tingkat tinggi, menjadikannya pilihan default untuk sebagian besar aplikasi perusahaan.
Claude Haiku 4.5 (Dirilis 15 Okt 2025): Model yang dioptimalkan untuk kecepatan. Mengejutkan, kini mendukung Pemikiran Diperluas, menjadikannya model “kecil” pertama yang menawarkan kemampuan penalaran mendalam yang sebelumnya hanya tersedia pada model frontier. Ideal untuk tugas frekuensi tinggi di mana latensi penting tetapi akurasi tidak boleh dikorbankan.
Claude Opus 4.5 (Dirilis 24 Nov 2025): Model kecerdasan frontier. Opus 4.5 dirancang untuk tugas paling kompleks dan ambigu—seperti riset ilmiah, perancangan arsitektur baru, dan analisis keuangan berisiko tinggi. Memiliki kapasitas “anggaran berpikir” tertinggi dan unggul dalam koreksi diri.

Sekilas kemampuan utama

Jendela konteks yang dapat digunakan lebih besar dan perilaku yang lebih baik pada tugas jangka panjang (alur kerja agen, debug langkah demi langkah, pengeditan basis kode).
Performa lebih baik pada tolok ukur pengodean, refaktorisasi, dan tugas penggunaan alat multi-langkah (keluarga Sonnet dan Opus).
Fitur “berpikir” canggih (yang oleh Anthropic disebut extended thinking / thinking mode) yang—secara opsional—mengekspos sebagian penalaran bertahap internal model kepada pengembang atau memungkinkan model menghabiskan “anggaran” token yang dapat dikonfigurasi untuk bernalar sebelum menghasilkan jawaban akhir.

Di mana Anda dapat menjalankan Claude 4.5

Claude 4.5 (Sonnet/Opus) tersedia melalui API milik Anthropic dan telah diintegrasikan ke CometAPI(Harga API saat ini sedang promo, sekitar 20% dari harga Anthropic. ), sehingga Anda dapat menjalankan model ini melalui platform Anthropic atau melalui vendor cloud pihak ketiga yang meng-host model.

Apa itu mode BERPIKIR baru di Claude Code dan Claude 4.5?

Extended thinking dari Anthropic (alias “thinking mode”, “thinking blocks”, atau “thinking tokens”) adalah fitur yang memungkinkan model melakukan langkah sampling internal tambahan untuk bernalar lebih saksama sebelum menghasilkan jawaban akhir. Anda mengaktifkannya dengan menambahkan konfigurasi thinking ke permintaan Messages API Anda (misalnya: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) atau menggunakan helper SDK Anthropic. Saat diaktifkan, API akan (tergantung model) mengembalikan versi yang diringkas dari penalaran internal atau mengembalikan penalaran penuh (tergantung redaksi demi keamanan).

Untuk memahami mengapa “Thinking Mode” revolusioner, kita harus melihat bagaimana Large Language Models (LLMs) bekerja secara tradisional. Model standar adalah “generator teks probabilistik”—mereka memprediksi token berikutnya segera setelah menerima prompt. Mereka tidak “berhenti untuk berpikir”; mereka mulai “berbicara” (menghasilkan) seketika.

Peralihan ke “Pemikiran Diperluas”

Thinking Mode mengubah paradigma ini. Saat diaktifkan, Claude 4.5 menghasilkan aliran tersembunyi “token berpikir” sebelum menampilkan satu karakter pun yang terlihat oleh pengguna.

Penalaran yang Terlihat (Opsional): Di beberapa antarmuka seperti Claude.ai, Anda dapat melihat dropdown “Thinking” yang menampilkan monolog internal model.

Penalaran Tersembunyi (API): Di API, ini merupakan thinking blocks terpisah. Model menggunakan ruang ini untuk:

Mendekonstruksi prompt: Menguraikan batasan kompleks.
Merencanakan strategi: Menguraikan logika langkah demi langkah.
Mendraf dan Mengkritik: Mencoba solusi secara mental, menemukan cacat, lalu memperbaikinya sebelum menyajikan jawaban.

Pemikiran Berselang-seling

Inovasi utama pada Sonnet 4.5 adalah Interleaved Thinking. Dalam alur kerja agen (di mana AI menggunakan alat seperti kalkulator, interpreter kode, atau peramban web), model standar akan memanggil suatu alat, mendapatkan hasil, lalu segera memanggil alat berikutnya.

Dengan Pemikiran Berselang-seling, Claude 4.5 dapat:

Berpikir tentang permintaan pengguna.
Memanggil Alat A (misalnya, menelusuri web).
Berpikir tentang hasil penelusuran (“Hasil ini usang, saya harus mencoba kueri yang berbeda”).
Memanggil Alat B (misalnya, menelusuri lagi).
Berpikir tentang cara mensintesis data.
Respons Akhir.

Siklus “Berpikir-Bertindak-Berpikir-Bertindak” ini sangat mengurangi halusinasi dan propagasi kesalahan pada tugas pengodean yang panjang dan multi-langkah.

Bagaimana Claude Code menampilkan pemikiran di alat pengembang

Dalam Claude Code (pengalaman CLI/editor), Anthropic menambahkan affordance UI untuk menyalakan/mematikan thinking mode pada sesi interaktif (UX umum adalah menekan Tab untuk mengaktifkan/mematikan thinking) dan menampilkan indikator untuk anggaran berpikir saat ini. Beberapa kata pemicu lama (misalnya, think, think hard) dulu digunakan untuk mengendalikan kedalaman berpikir; versi modern mengandalkan toggle eksplisit dan parameter anggaran, dengan ultrathink yang masih tersedia dalam beberapa konteks. Konfigurasi dapat bersifat global di ~/.claude/settings.json atau ditimpa per permintaan.

Bagaimana Anda menerapkan Thinking Mode Claude 4.5?

Bagi pengembang, transisi ke Claude 4.5 memerlukan perubahan pada cara permintaan API disusun. Anda tidak lagi hanya mengirim prompt; Anda mengelola “Anggaran Berpikir”.

Menetapkan Anggaran Berpikir

Parameter thinking kini menjadi parameter tingkat pertama dalam API Anthropic. Anda harus mengaktifkannya secara eksplisit dan mendefinisikan nilai budget_tokens. Nilai ini mewakili jumlah maksimum token yang dapat digunakan model untuk penalaran internalnya.

Contoh Implementasi Python

import anthropic

# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # We set a high max_tokens to accommodate both thinking and the final answer
    # The budget_tokens must be less than max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allocating 12k tokens for 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Extracting the two distinct parts of the response
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)

Pertimbangan Teknis Kunci

Total Penggunaan Token: Total penggunaan Anda adalah thinking_tokens + output_tokens. Jika Anda menetapkan anggaran 10.000 token dan model menggunakan 8.000 untuk berpikir serta 2.000 untuk jawaban, Anda ditagih untuk 10.000 token keluaran.
Pemikiran yang Diwajibkan: Jika tugas terlalu sederhana, model mungkin tetap menggunakan sejumlah minimum token berpikir untuk memverifikasi kesederhanaan permintaan.

Bagaimana Mode Berpikir meningkatkan pembuatan kode?

Salah satu peningkatan paling signifikan di Claude 4.5 adalah performanya dalam CLI Claude Code. Ketika Claude 4.5 “berpikir” tentang kode, ia melakukan beberapa tindakan tersembunyi yang sering diabaikan model standar.

1. Pemetaan Dependensi

Sebelum menulis satu baris perbaikan pun, Claude 4.5 menelusuri repositori Anda untuk memahami bagaimana perubahan pada utils/auth.ts dapat merusak komponen di views/Profile.tsx.

2. Eksekusi Mental

Model “menjalankan” kode di blok penalarannya. Ia mensimulasikan alur logika dan mengidentifikasi potensi race condition atau error off-by-one.

3. Verifikasi Kendala

Jika Anda meminta solusi yang “berperforma tinggi dan tidak menggunakan library eksternal”, mode berpikir bertindak sebagai penjaga. Jika naluri pertama model adalah menyarankan paket NPM, proses berpikir akan menangkap pelanggaran itu dan memaksakan model untuk memikirkan ulang implementasi JavaScript murni.

Bagaimana Mode Berpikir dibandingkan dengan prompting tradisional?

Banyak pengguna familiar dengan prompting “Chain of Thought” (CoT), di mana Anda memberi tahu model: “Pikirkan langkah demi langkah.” Walau efektif, ini tidak sama dengan Mode Berpikir native Claude 4.5.

Fitur	Chain of Thought (Manual)	Extended Thinking (Native)
Mekanisme	Instruksi yang dipicu pengguna.	Arsitektur bawaan model.
Ruang Token	Memakan ruang keluaran yang terlihat.	Menempati blok internal khusus.
Koreksi Diri	Terbatas; model sering “menggandakan” kesalahan awal.	Tinggi; model dapat membuang seluruh jalur penalaran dan memulai ulang.
Keandalan	Variabel tergantung kualitas prompt.	Konsisten tinggi di domain kompleks.
Penanganan API	Memerlukan parsing teks manual.	Blok JSON terstruktur untuk “thinking” dan “text”.

Bagaimana mode berpikir bekerja di Claude 4.5?

Alur kerja internal (konseptual)

Permintaan pengguna: Aplikasi Anda mengirim permintaan Messages API yang menentukan model, prompt, max_tokens, dan opsional thinking: { type: "enabled", budget_tokens: N }.
Penalaran internal: Claude melakukan “berpikir” internal hingga anggaran. Ia merekam keluaran penalaran sebagai blok thinking (yang dapat diringkas untuk pengguna).
Komposisi keluaran: API mengembalikan sebuah array blok konten. Biasanya urutannya adalah blok thinking lalu blok text (jawaban akhir). Jika streaming, Anda menerima event thinking_delta diikuti event text_delta.
Mempertahankan konteks: Saat menggunakan alat atau alur multi-giliran, Anda dapat mengirim ulang blok berpikir sebelumnya (tanpa diubah) agar Claude dapat melanjutkan rantai pemikiran. Opus 4.5 memperkenalkan perilaku mempertahankan blok berpikir secara default demi cache/efisiensi.

Secara teknis, Mode Berpikir bergantung pada konfigurasi parameter API khusus yang mengalokasikan “Anggaran” token untuk penalaran.

Konsep Anggaran Token

Saat Anda membuat permintaan ke Claude 4.5, Anda harus menentukan parameter budget_tokens. Ini adalah jumlah maksimum token yang diizinkan model untuk digunakan pada monolog internalnya.

Anggaran Rendah (<2,000 token): Cocok untuk pemeriksaan cepat atau teka-teki logika sederhana.
Anggaran Tinggi (10,000+ token): Diperlukan untuk arsitektur perangkat lunak kompleks, pembuktian matematika, atau penulisan dokumen hukum komprehensif.

Model dilatih untuk “mengelola” anggaran ini. Jika mendapati anggaran hampir habis, ia akan berupaya menutup penalaran dan memberikan jawaban terbaik yang mungkin.

Siklus “Proses Berpikir”

Ketika pengguna bertanya: “Tulis skrip Python untuk melakukan scraping situs web ini, tetapi pastikan menghormati robots.txt dan menangani pemuatan dinamis.”

Ingestion: Claude membaca prompt.
Fase Berpikir (Tersembunyi):
- Koreksi Diri: “Saya perlu menggunakan Selenium atau Playwright untuk pemuatan dinamis. requests tidak akan berhasil.”
- Pemeriksaan Keamanan: “Saya harus memverifikasi bahwa pengguna memiliki izin untuk melakukan scraping. Saya akan menambahkan disclaimer.”
- Arsitektur: “Saya akan menstrukturkan kode dengan pendekatan berbasis kelas agar modular.”
Fase Keluaran (Terlihat): Claude menghasilkan kode Python.

Pada model sebelumnya, AI mungkin mulai menulis kode requests segera, lalu menyadari di tengah jalan bahwa itu tidak berfungsi untuk konten dinamis, kemudian berhalusinasi solusi atau menghasilkan kode yang rusak. Mode berpikir mencegah skenario “terpojok” ini.

Kapan sebaiknya Anda mengaktifkan mode berpikir — kasus penggunaan dan heuristik?

Kasus penggunaan yang paling diuntungkan

Pengodean kompleks (perubahan arsitektur, refaktor multi-berkas, sesi debug panjang). Sonnet 4.5 secara eksplisit diposisikan sebagai pemimpin pengodean dan agen saat berpikir diaktifkan.
Alur kerja berbasis agen yang menggunakan alat berulang kali dan harus mempertahankan konteks internal di banyak langkah. Pemikiran berselang-seling + penggunaan alat adalah skenario utama.
Riset atau analisis mendalam (analisis statistik, penyusunan keuangan, penalaran hukum) di mana langkah penalaran perantara berharga untuk diperiksa atau diverifikasi.

Kapan tidak perlu mengaktifkannya

Pembuatan jawaban singkat atau API throughput tinggi berlatensi rendah di mana latensi minimal sangat penting (misalnya, UI chat yang memerlukan respons level milidetik).
Tugas di mana biaya token per permintaan harus diminimalkan dan tugasnya sederhana atau terdefinisi dengan baik.

Heuristik praktis

Mulailah dengan anggaran berpikir minimum (≈1,024 token) dan tingkatkan secara progresif untuk tugas yang memerlukan kedalaman lebih; lakukan benchmark akurasi tugas end-to-end vs latensi dan token. Untuk tugas agen multi-langkah, bereksperimenlah dengan pemikiran berselang-seling dan breakpoint prompt yang di-cache untuk menemukan sweet spot.

Kesimpulan

Thinking Mode Claude 4.5 lebih dari sekadar fitur; ini adalah cara baru berinteraksi dengan kecerdasan buatan. Dengan memisahkan proses berpikir dari produk pemikiran, Anthropic menyediakan alat yang lebih andal, lebih transparan, dan lebih mampu menangani kompleksitas pekerjaan perusahaan modern.

Apakah Anda menggunakan CLI Claude Code untuk mengelola migrasi besar atau memanfaatkan API untuk membangun generasi berikutnya dari agen otonom, menguasai “Anggaran Berpikir” adalah kunci kesuksesan.

Pengembang dapat mengakses model Claude 4.5 melalui CometAPI. Untuk memulai, jelajahi kapabilitas model CometAPI di Playground dan lihat panduan API untuk instruksi terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan mendapatkan kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga resmi untuk membantu Anda melakukan integrasi.

Siap mulai?→ Uji coba gratis Claude 4.5!