Mode Berpikir di Claude 4.5: Semua yang Perlu Anda Ketahui

CometAPI
AnnaDec 30, 2025
Mode Berpikir di Claude 4.5: Semua yang Perlu Anda Ketahui

Keluarga Claude 4.5 dari Anthropic (terutama Sonnet 4.5 dan Opus 4.5) menghadirkan “pemikiran” diperluas / penalaran internal bergaya scratchpad ke lini Claude 4 mereka. Messages API mengekspos kemampuan tersebut melalui objek thinking (aktif/nonaktif + alokasi budget_tokens), opsi streaming, dan penanganan khusus untuk blok konten “thinking” (termasuk tanda tangan dan penyensoran). Sonnet 4.5 menargetkan tugas pengodean dan berbasis agen serta sangat diuntungkan oleh pemikiran diperluas; Opus 4.5 menambahkan blok pemikiran yang dipertahankan dan optimisasi lainnya.

Apa itu Claude 4.5?

Claude 4.5 (dipublikasikan dalam keluarga model Claude Anthropic sebagai varian Sonnet 4.5 dan Opus 4.5) adalah generasi terbaru model bahasa besar perusahaan yang diatur untuk penalaran lebih dalam, konteks jangka panjang, dan alur kerja pengodean/agen berkualitas produksi. Dalam pengumuman dan halaman produk Anthropic, Sonnet 4.5 digambarkan sebagai lompatan besar untuk pengodean, pembangunan agen, dan “menggunakan komputer” (yaitu, alur kerja berbantuan alat dan otomatisasi multi-langkah), dengan peningkatan terukur pada penalaran, matematika, dan tugas konteks panjang.

Susunan Keluarga 4.5

  • Claude Sonnet 4.5 (Dirilis 29 Sept 2025): Si “andalan” keluarga. Saat ini dinilai sebagai model pengodean terbaik di dunia, mampu mempertahankan fokus pada tugas otonom lebih dari 30 jam. Menyeimbangkan kecepatan, biaya, dan penalaran tingkat tinggi, menjadikannya pilihan default untuk sebagian besar aplikasi perusahaan.
  • Claude Haiku 4.5 (Dirilis 15 Okt 2025): Model yang dioptimalkan untuk kecepatan. Mengejutkan, kini mendukung Extended Thinking, menjadikannya model “kecil” pertama yang menawarkan kemampuan penalaran mendalam yang sebelumnya hanya tersedia pada model frontier. Ideal untuk tugas berfrekuensi tinggi di mana latensi penting namun akurasi tidak boleh dikorbankan.
  • Claude Opus 4.5 (Dirilis 24 Nov 2025): Model kecerdasan terdepan. Opus 4.5 dirancang untuk tugas paling kompleks dan ambigu—seperti riset ilmiah, desain arsitektur baru, dan analisis finansial berisiko tinggi. Memiliki kapasitas “anggaran berpikir” tertinggi dan unggul dalam koreksi diri.

Kapabilitas utama sekilas

  • Jendela konteks yang dapat digunakan lebih besar dan perilaku yang ditingkatkan dalam tugas yang berjalan lama (alur kerja agen, debugging langkah demi langkah, suntingan basis kode).
  • Performa lebih baik pada tolok ukur pengodean, refaktor, dan tugas penggunaan alat multi-langkah (keluarga Sonnet dan Opus).
  • Fitur “thinking” canggih (yang oleh Anthropic disebut pemikiran diperluas / mode berpikir) yang secara opsional mengekspos sebagian penalaran langkah demi langkah internal model kepada pengembang atau memungkinkan model menghabiskan “anggaran” token yang dapat dikonfigurasi untuk bernalar sebelum menghasilkan jawaban akhir.

Di mana Anda dapat menjalankan Claude 4.5

Claude 4.5 (Sonnet/Opus) tersedia melalui API Anthropic sendiri dan telah diintegrasikan ke CometAPI(Harga API saat ini sedang promo, sekitar 20% dari harga Anthropic.), sehingga Anda dapat menjalankan model ini melalui platform Anthropic atau melalui vendor cloud pihak ketiga yang meng-host model tersebut.

Apa itu mode THINKING baru di Claude Code dan Claude 4.5?

Pemikiran diperluas (alias “mode berpikir,” “blok berpikir,” atau “token berpikir”) dari Anthropic adalah fitur yang memungkinkan model melakukan langkah pengambilan sampel internal tambahan untuk bernalar lebih menyeluruh sebelum menghasilkan jawaban akhir. Anda mengaktifkannya dengan menambahkan konfigurasi thinking ke permintaan API Messages Anda (misalnya: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) atau dengan menggunakan helper SDK Anthropic. Saat diaktifkan, API akan (bergantung pada model) mengembalikan versi ringkas dari penalaran internal atau mengembalikan penalaran penuh (tergantung pada penyensoran demi keamanan).

Untuk memahami mengapa “Thinking Mode” bersifat revolusioner, kita harus melihat bagaimana Large Language Models (LLM) secara tradisional beroperasi. Model standar adalah “generator teks probabilistik”—mereka memprediksi token berikutnya segera setelah menerima prompt. Mereka tidak “berhenti untuk berpikir”; mereka langsung mulai “berbicara” (menghasilkan).

Pergeseran ke "Extended Thinking"

Thinking Mode mengubah paradigma ini. Saat diaktifkan, Claude 4.5 menghasilkan aliran tersembunyi “token berpikir” sebelum mengeluarkan satu karakter pun yang terlihat oleh pengguna.

Penalaran yang Terlihat (Opsional): Dalam beberapa antarmuka seperti Claude.ai, Anda dapat melihat dropdown “Thinking” yang menampilkan monolog internal model.

Penalaran Tersembunyi (API): Dalam API, ini adalah blok thinking yang berbeda. Model menggunakan ruang ini untuk:

  • Mendekonstruksi prompt: Mengurai kendala kompleks.
  • Menyusun strategi: Menguraikan logika langkah demi langkah.
  • Menyusun dan Mengkritik: Mencoba solusi secara mental, menemukan cacat, dan memperbaikinya sebelum menyajikan jawaban.

Interleaved Thinking

Inovasi besar dalam Sonnet 4.5 adalah Interleaved Thinking. Dalam alur kerja agen (di mana AI menggunakan alat seperti kalkulator, interpreter kode, atau peramban web), model standar akan memanggil alat, mendapat hasil, dan segera memanggil alat berikutnya.

Dengan Interleaved Thinking, Claude 4.5 dapat:

  1. Berpikir tentang permintaan pengguna.
  2. Memanggil Alat A (mis., menelusuri web).
  3. Berpikir tentang hasil penelusuran (“Hasil ini sudah usang, saya harus mencoba kueri yang berbeda”).
  4. Memanggil Alat B (mis., menelusuri lagi).
  5. Berpikir tentang cara mensintesis data.
  6. Respons Akhir.

Loop “Think-Act-Think-Act” ini secara drastis mengurangi halusinasi dan propagasi kesalahan dalam tugas pengodean panjang multi-langkah.

Bagaimana Claude Code menampilkan thinking di alat pengembang

Dalam Claude Code (pengalaman CLI/editor), Anthropic menambahkan affordance UI untuk mengaktifkan/nonaktifkan mode berpikir pada sesi interaktif (UX umum adalah menekan Tab untuk toggle thinking on/off) dan untuk menampilkan indikator anggaran berpikir saat ini. Beberapa kata pemicu lama (mis., think, think hard) secara historis digunakan untuk mengontrol kedalaman berpikir; versi modern bertumpu pada toggle eksplisit dan parameter anggaran, dengan ultrathink tetap tersedia dalam beberapa konteks. Konfigurasi dapat bersifat global di ~/.claude/settings.json atau ditimpa per permintaan.

Bagaimana cara mengimplementasikan Mode Berpikir Claude 4.5?

Bagi pengembang, transisi ke Claude 4.5 memerlukan perubahan cara penyusunan permintaan API. Anda tidak lagi hanya mengirim prompt; Anda mengelola “Anggaran Berpikir.”

Menetapkan Anggaran Pemikiran

Parameter thinking kini menjadi warga kelas utama di API Anthropic. Anda harus secara eksplisit mengaktifkannya dan menentukan nilai budget_tokens. Nilai ini mewakili jumlah maksimum komputasi yang dapat digunakan model untuk penalaran internalnya.

Contoh Implementasi Python

Kode berikut menunjukkan cara menginisialisasi sesi Claude 4.5 dengan Extended Thinking diaktifkan.

import anthropic

# Inisialisasi perspektif Gemini Enterprise pada integrasi Claude 4.5
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # Kami menetapkan max_tokens yang tinggi untuk mengakomodasi baik thinking maupun jawaban akhir
    # budget_tokens harus kurang dari max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Mengalokasikan 12k token untuk 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Mengekstrak dua bagian respons yang berbeda
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Contoh kueri kompleks
query = "Rancang sistem zero-knowledge proof untuk aplikasi voting terdesentralisasi menggunakan Circom."
thoughts, answer = get_reasoned_response(query)

print("--- PENALARAN INTERNAL CLAUDE ---")
print(thoughts)
print("\n--- ARSITEKTUR TEKNIS AKHIR ---")
print(answer)

Pertimbangan Teknis Utama

  • Total Penggunaan Token: Total penggunaan Anda adalah thinking_tokens + output_tokens. Jika Anda menetapkan anggaran 10.000 token dan model menggunakan 8.000 untuk berpikir dan 2.000 untuk jawaban, Anda akan ditagih untuk 10.000 token keluaran.
  • Pemikiran Paksa: Jika tugas terlalu sederhana, model mungkin tetap menggunakan jumlah minimum token berpikir untuk memverifikasi kesederhanaan permintaan.

Bagaimana Mode Berpikir meningkatkan pembuatan kode?

Salah satu peningkatan paling signifikan di Claude 4.5 adalah performanya di CLI Claude Code. Saat Claude 4.5 “berpikir” tentang kode, ia melakukan beberapa tindakan tersembunyi yang diabaikan oleh model standar.

1. Pemetaan Dependensi

Sebelum menulis satu baris perbaikan, Claude 4.5 menelusuri repositori Anda untuk memahami bagaimana perubahan di utils/auth.ts dapat merusak komponen di views/Profile.tsx.

2. Eksekusi Mental

Model “menjalankan” kode dalam blok penalarannya. Ia mensimulasikan alur logika dan mengidentifikasi potensi kondisi race atau kesalahan off-by-one.

3. Verifikasi Kendala

Jika Anda meminta solusi yang “performant dan tanpa pustaka eksternal,” mode berpikir bertindak sebagai penjaga gerbang. Jika naluri pertama model adalah menyarankan paket NPM, proses berpikir akan menangkap pelanggaran itu dan memaksakan model untuk meninjau ulang implementasi JavaScript murni.

Bagaimana Mode Berpikir dibandingkan dengan prompting tradisional?

Banyak pengguna akrab dengan "Chain of Thought" (CoT) prompting, di mana Anda memberi tahu model: "Pikirkan langkah demi langkah." Meskipun efektif, ini tidak sama dengan Mode Berpikir native Claude 4.5.

FiturChain of Thought (Manual)Pemikiran Diperluas (Bawaan)
MekanismeInstruksi yang dipicu pengguna.Arsitektur bawaan model.
Ruang TokenMemakan ruang keluaran yang terlihat.Menggunakan blok internal khusus.
Koreksi DiriTerbatas; model sering “menggandakan” kesalahan awal.Tinggi; model dapat membuang seluruh jalur penalaran dan mulai ulang.
KeandalanVariabel, bergantung pada kualitas prompt.Konsisten tinggi di domain kompleks.
Penanganan APIMemerlukan parsing teks manual.Blok JSON terstruktur untuk "thinking" dan "text".

Bagaimana mode berpikir bekerja di Claude 4.5?

Alur kerja internal (konseptual)

  1. Permintaan pengguna: Aplikasi Anda mengirim permintaan API Messages yang menentukan model, prompt, max_tokens, dan opsional thinking: { type: "enabled", budget_tokens: N }.
  2. Penalaran internal: Claude melakukan “thinking” internal hingga anggaran. Ia merekam keluaran penalaran sebagai blok thinking (yang dapat diringkas untuk pengguna).
  3. Komposisi keluaran: API mengembalikan array blok konten. Biasanya urutannya adalah blok thinking lalu blok text (jawaban akhir). Jika streaming, Anda menerima event thinking_delta diikuti oleh text_delta.
  4. Pelestarian konteks: Saat menggunakan alat atau alur multi-giliran, Anda dapat mengirim ulang blok thinking sebelumnya (tanpa modifikasi) agar Claude dapat melanjutkan chain-of-thought. Opus 4.5 memperkenalkan perilaku untuk mempertahankan blok thinking secara default demi cache/efisiensi.

Secara teknis, Mode Berpikir bergantung pada konfigurasi parameter API khusus yang mengalokasikan “Anggaran” token untuk penalaran.

Konsep Anggaran Token

Saat Anda membuat permintaan ke Claude 4.5, Anda harus menentukan parameter budget_tokens. Ini adalah jumlah maksimum token yang diizinkan model untuk monolog internalnya.

  • Anggaran Rendah (<2,000 tokens): Cocok untuk pemeriksaan cepat atau teka-teki logika sederhana.
  • Anggaran Tinggi (10,000+ tokens): Diperlukan untuk arsitektur perangkat lunak kompleks, bukti matematis, atau penulisan brief hukum komprehensif.

Model dilatih untuk “mengelola” anggaran ini. Jika ia merasa anggaran hampir habis, ia akan berusaha menuntaskan penalaran dan memberikan jawaban terbaik yang memungkinkan.

Siklus "Proses Berpikir"

Saat pengguna bertanya: "Tulis skrip Python untuk scrape situs web ini, tetapi pastikan menghormati robots.txt dan menangani pemuatan dinamis."

  1. Ingesti: Claude membaca prompt.
  2. Fase Berpikir (Tersembunyi):
    • Koreksi Diri: “Saya perlu menggunakan Selenium atau Playwright untuk pemuatan dinamis. requests tidak akan bekerja.”
    • Pemeriksaan Keamanan: “Saya harus memverifikasi pengguna memiliki izin untuk scrape. Saya akan menambahkan disclaimer.”
    • Arsitektur: “Saya akan menyusun kode dengan pendekatan berbasis kelas untuk modularitas.”
  3. Fase Keluaran (Terlihat): Claude menghasilkan kode Python.

Pada model sebelumnya, AI mungkin langsung mulai menulis kode requests, menyadari di tengah jalan itu tidak berfungsi untuk konten dinamis, lalu berhalusinasi solusi atau memberikan kode yang rusak. Mode berpikir mencegah skenario “tersudut” ini.

Kapan sebaiknya Anda mengaktifkan mode berpikir — use case dan heuristik?

Use case yang paling diuntungkan

  • Pengodean kompleks (perubahan arsitektural, refaktor multi-berkas, sesi debugging panjang). Sonnet 4.5 secara eksplisit diposisikan sebagai pemimpin pengodean dan agen saat thinking digunakan.
  • Alur kerja berbasis agen yang menggunakan alat berulang kali dan harus mempertahankan konteks internal di banyak langkah. Interleaved thinking + penggunaan alat adalah skenario utama.
  • Riset atau analisis mendalam (analisis statistik, penataan finansial, penalaran hukum) di mana langkah penalaran intermediates bernilai untuk inspeksi atau verifikasi.

Kapan tidak perlu mengaktifkannya

  • Pembuatan jawaban pendek atau API throughput tinggi berlatensi rendah di mana latensi minimal sangat kritis (mis., UI chat yang memerlukan respons level milidetik).
  • Tugas di mana biaya token per permintaan harus diminimalkan dan tugasnya sederhana atau terdefinisi dengan baik.

Heuristik praktis

Mulailah dengan anggaran berpikir minimum (≈1,024 tokens) dan tingkatkan secara progresif untuk tugas yang membutuhkan kedalaman lebih; benchmark akurasi tugas end-to-end vs latensi dan token. Untuk tugas agen multi-langkah, bereksperimenlah dengan interleaved thinking dan breakpoint prompt yang di-cache untuk menemukan titik optimal.

Kesimpulan

Mode Berpikir Claude 4.5 lebih dari sekadar fitur; ini adalah cara baru berinteraksi dengan kecerdasan buatan. Dengan memisahkan proses pemikiran dari produk pemikiran, Anthropic menyediakan alat yang lebih andal, lebih transparan, dan lebih mampu menangani kompleksitas pekerjaan perusahaan modern.

Baik Anda menggunakan Claude Code CLI untuk mengelola migrasi besar atau memanfaatkan API untuk membangun generasi berikutnya agen otonom, menguasai “Anggaran Berpikir” adalah kunci kesuksesan.

Pengembang dapat mengakses model Claude 4.5 melalui CometAPI. Untuk memulai, jelajahi kapabilitas model di CometAPI pada Playground dan konsultasikan panduan API untuk instruksi terperinci. Sebelum mengakses, pastikan Anda sudah login ke CometAPI dan memperoleh API key. CometAPI menawarkan harga jauh lebih rendah dibanding harga resmi untuk membantu integrasi Anda.

Siap mulai?→ Free trial of Claude 4.5!

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%