Bagaimana cara menggunakan pemikiran lanjutan Claude 4?

Claude 4, keluarga terbaru model bahasa besar Anthropic—termasuk Claude Opus 4 dan Claude Sonnet 4—memperkenalkan kemampuan "pemikiran luas" baru yang canggih yang membuka penalaran yang lebih mendalam dan bertahap untuk menangani tugas-tugas yang kompleks dan berlangsung lama serta alur kerja agen. Saat organisasi berlomba-lomba untuk mengintegrasikan AI ke dalam alur pengembangan, proyek penelitian, dan proses bisnis, menguasai pemikiran luas Claude 4 membuka potensi penuhnya untuk pemecahan masalah tingkat lanjut, pembuatan konten, dan orkestrasi otonom. Artikel ini merangkum pengumuman terbaru, dokumentasi API, dan panduan langsung untuk menjelaskan cara mengaktifkan, mengonfigurasi, dan memaksimalkan pemikiran luas Claude 4 dalam alur kerja Anda.

Apa pemikiran Claude 4 yang diperluas

Pemikiran yang diperluas merupakan fitur dari Claude Opus 4 dan Claude Sonnet 4 yang memungkinkan model untuk mengekspos proses penalaran internalnya dalam blok konten "berpikir". Transparansi ini memungkinkan pengembang dan pengguna akhir untuk melihat bagaimana Claude sampai pada kesimpulannya, meningkatkan kepercayaan dan kemampuan debug dalam tugas-tugas yang kompleks. Tidak seperti mode standar—yang mengoptimalkan untuk keringkasan dan kecepatan—pemikiran yang diperluas mengalokasikan lebih banyak komputasi dan konteks untuk menghasilkan alur kerja penalaran multi-langkah yang lebih dalam, yang penting untuk domain masalah berisiko tinggi atau rumit.

Konsep inti

Blok Pemikiran: Segmen terstruktur tempat Claude 4 mengartikulasikan rangkaian pemikirannya sebelum menyampaikan jawaban akhir.
Pemikiran yang Dirangkum: Versi ringkas dari aliran pemikiran lengkap, menyeimbangkan transparansi dengan keamanan dengan menghilangkan logika yang terlalu sensitif atau bersifat hak milik.
Penggunaan Alat yang Disisipkan (beta): Memungkinkan pencampuran yang lancar antara panggilan alat eksternal (misalnya, pencarian atau basis data) dengan penalaran, sehingga respons semakin diperkaya.

Apa Bedanya dengan Mode Standar

Pola Respons:Pemikiran yang diperluas dapat mengalir dalam segmen-segmen “berisi” dengan jeda yang disengaja, yang mencerminkan langkah-langkah inferensi model yang lebih mendalam.
Kompromi Latensi: Mengutamakan kualitas penalaran dibandingkan kecepatan mentah; harapkan sedikit peningkatan dalam waktu respons jika dibandingkan dengan balasan mode instan.

Siapa yang Memiliki Akses ke Pemikiran yang Luas?

Pengguna Gratis:Dapat mengakses Extended Thinking dengan Sonnet 4 melalui API dan aplikasi web;
Pro/Tim/Perusahaan:Dapatkan akses ke fungsionalitas Opus 4 secara penuh, termasuk anggaran token yang lebih besar;
Integrasi Awan: Amazon Bedrock dan Google Cloud Vertex AI juga sepenuhnya mendukung Claude 4 Extended Thinking, memastikan integrasi beban kerja tingkat perusahaan yang mulus.

Bagaimana Anda Dapat Mengaktifkan Pemikiran yang Diperluas dalam Claude 4?

Mengaktifkan pemikiran yang diperluas bergantung pada saluran akses Anda—Anthropic API, Amazon Bedrock, atau Google Cloud Vertex AI—dan tingkat langganan Anda.

Siapkan API

Header API Pesan: Sertakan parameternya extended_thinking: true dalam muatan JSON Anda saat memanggil titik akhir Claude Opus 4 atau Sonnet 4.
Mode Beta untuk Interleaving:Untuk mencampur penggunaan alat dan penalaran, tambahkan header beta interleaved-thinking-2025-05-14 di samping extended_thinking .

{
  "model": "claude-opus-4",
  "max_tokens": 200000,
  "extended_thinking": true,
  "stream": false,
  "headers": {
    "Anthropic-Client": "your_api_key",
    "interleaved-thinking-2025-05-14": "true"
  }
  "messages": [
    { "role": "user", "content": "Please analyze the properties of quadratic functions in detail." }
  ]
}

budget_tokens mendefinisikan token yang tersedia untuk pemikiran internal;
max_tokens adalah batas total untuk token pemikiran dan jawaban akhir;
Untuk menggunakan pemikiran streaming waktu nyata, atur stream untuk true....

Bagaimana Mengonfigurasi Anggaran Token dan Pengaturan Aliran?

Anggaran Token:Disarankan untuk mengatur budget_tokens hingga 40%-60% dari max_tokens untuk memastikan penalaran yang memadai sekaligus menyediakan ruang bagi jawaban akhir yang lengkap;
Modus Streaming:Setelah mengaktifkan SSE (Server-Sent Events), klien dapat menangkap thinking_delta dan text_delta peristiwa, memberikan penalaran dan jawaban akhir secara dinamis untuk pengalaman interaksi pengguna yang lebih lancar;
Pertimbangan Biaya: Extended Thinking menghasilkan biaya token pemikiran tambahan, dan beberapa platform (seperti Amazon Bedrock) mengenakan biaya berdasarkan jumlah total token pemikiran, jadi penting untuk menilai anggaran terlebih dahulu.

Akses Platform

Taman Bermain Antropik: Aktifkan tombol “Extended Thinking” di UI saat meluncurkan sesi Opus 4 atau Sonnet 4.
Batuan Dasar AWS: Di konsol Bedrock, pilih “Claude Opus 4” atau “Claude Sonnet 4” dan aktifkan opsi pemikiran lanjutan di bawah pengaturan model.
AI Google Cloud Vertex: Pilih model Claude 4 dan centang “Aktifkan Penalaran Lanjutan” dalam konfigurasi penerapan.

Manfaat Apa yang Ditawarkan Pemikiran Lanjut?

Pemikiran yang diperluas membuka dimensi baru kolaborasi AI, terutama untuk tugas yang menuntut logika multi-langkah, transparansi, dan integrasi dengan sumber data eksternal.

Peningkatan Kedalaman Penalaran

Dengan mengalokasikan komputasi tambahan dan jendela konteks—hingga ribuan token—pemikiran yang diperluas dapat menangani masalah seperti pemfaktoran ulang kode yang rumit, perencanaan strategis, dan analisis hukum dengan lebih andal.

Ringkasan Penalaran Transparan

Keluaran “ringkasan pemikiran” menyediakan jejak audit terkompresi atas pengambilan keputusan Claude kepada pengguna akhir dan pengembang, yang memudahkan penelusuran kesalahan, tinjauan kepatuhan, dan transfer pengetahuan.

Peningkatan Penggunaan Alat

Saat penggunaan alat yang disisipkan diaktifkan, Claude 4 dapat memanggil penelusuran web, basis data, atau API internal di tengah aliran, menyatukan data waktu nyata ke dalam proses berpikir dan respons akhirnya.

Bagaimana Menafsirkan dan Memproses Respons Berpikir yang Diperluas?

Apa yang dimaksud dengan Pemikiran yang Dirangkum dan Penelusuran Penuh?

Secara default, Claude 4 mengeluarkan Pemikiran yang Dirangkum bentuk ringkasan blok penalaran, sementara penalaran lengkap dienkripsi dan disertakan dalam bidang tanda tangan, menyeimbangkan interpretabilitas dengan risiko penyalahgunaan yang berkurang. Untuk mengakses log penalaran lengkap untuk keperluan debugging atau audit, hubungi Anthropic untuk mengajukan akses jejak penuh.

Bagaimana Menangani Acara Streaming (SSE)?

Dalam mode streaming, Anda akan menerima berbagai acara SSE:

thinking_delta: Konten penalaran inkremental;
text_delta: Fragmen jawaban tambahan;
content_block_start/end: Tandai awal dan akhir blok penalaran dan jawaban.
Klien dapat beralih di antara status visual: pertama menyajikan penalaran dalam waktu nyata, lalu beralih ke jawaban akhir setelah penalaran selesai.

Bagaimana Pemikiran yang Luas Mempengaruhi Kinerja?

Sementara kualitas penalaran meningkat, waktu respons dan penggunaan token akan meningkat. Memahami trade-off ini membantu Anda menyeimbangkan biaya, latensi, dan kedalaman.

Peningkatan Latensi: Pemikiran yang diperluas dapat menambahkan 500 ms hingga beberapa detik per permintaan, tergantung pada kompleksitas kueri.
Konsumsi Token: Harapkan 20–50% lebih banyak token untuk blok “pemikiran”; rencanakan anggaran Anda sesuai dengan itu, karena Opus 4 menghabiskan biaya $75 per juta token keluaran dan $15 per juta token masukan.
Analisis Biaya-Manfaat:Gunakan pemikiran yang diperluas secara selektif—simpan untuk pertanyaan berisiko tinggi atau sesi debugging, dan kembali ke mode instan untuk tugas rutin.

Apa Praktik Terbaik untuk Memanfaatkan Pemikiran yang Luas?

Mengadopsi pemikiran yang luas secara efektif memerlukan dorongan yang bijaksana, manajemen konteks, dan interpretasi hasil.

Rekayasa Cepat

Instruksi Eksplisit:Mulailah dengan “Silakan gunakan pemikiran yang luas untuk…” untuk memberi sinyal pada model tersebut.
Kompleksitas Inkremental: Mulailah dengan subtugas yang lebih kecil (misalnya, “Jelaskan langkah-langkah untuk melakukan refaktor kode ini”), lalu tingkatkan ke alur kerja yang lebih besar.

Optimasi Jendela Konteks

Memotong: Membagi masukan besar menjadi beberapa bagian yang logis sehingga Claude 4 dapat menerapkan penalaran yang diperluas ke setiap blok tanpa mengenai batasan konteks.
File Memori (Hanya Opus 4): Gunakan berkas memori jangka panjang untuk konteks yang berulang, mengurangi overhead penalaran yang berulang.

Interpretasi dan Validasi

Ulasan Blok Pemikiran: Periksa alur pemikiran untuk mencari celah atau lompatan logika sebelum menerima hasil sebagai kesimpulan akhir.
Pemeriksaan Otomatis: Gabungkan dengan pengujian unit atau validasi berbasis aturan untuk memastikan kebenaran saat penalaran yang diperluas menyarankan perubahan kode atau analisis data.

Apa Saja Tantangan Umum dan Bagaimana Cara Mengatasinya?

Meskipun ampuh, berpikir luas dapat menimbulkan kerumitan yang perlu Anda atasi.

Latensi Berlebihan

SolusiBatasi mode berpikir pada segmen-segmen kritis; gunakan jendela konteks yang lebih pendek untuk eksplorasi awal.

Token Diserbu

Solusi: Memantau penggunaan token dalam log API; menerapkan perintah ringkasan untuk memampatkan blok pemikiran ketika kata-kata meningkat.

Rantai Pikiran yang Tidak Lengkap atau Membingungkan

Solusi: Sempurnakan petunjuk untuk memandu struktur (misalnya, “Langkah 1: Identifikasi asumsi; Langkah 2: Evaluasi alternatif”), dan gunakan pemikiran yang dirangkum untuk memeriksa silang.

Mulai

CometAPI menyediakan antarmuka REST terpadu yang menggabungkan ratusan model AI—termasuk keluarga Claude—di bawah titik akhir yang konsisten, dengan manajemen kunci API bawaan, kuota penggunaan, dan dasbor penagihan. Daripada harus mengelola beberapa URL dan kredensial vendor.

Pengembang dapat mengakses Claude Soneta 4 API (model: claude-sonnet-4-20250514 ; claude-sonnet-4-20250514-thinking) Dan Claude Opus 4 API (model: claude-opus-4-20250514; claude-opus-4-20250514-thinking)dll melalui API Komet. . Untuk memulai, jelajahi kemampuan model dalam tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. CometAPI juga telah menambahkan cometapi-sonnet-4-20250514dancometapi-sonnet-4-20250514-thinking khusus untuk digunakan di Kursor.

Baru mengenal CometAPI? Ringkas dan lepaskan Soneta 4 pada tugas terberat Anda.

Kami tidak sabar untuk melihat apa yang Anda buat. Jika ada yang terasa tidak beres, tekan tombol umpan balik—memberi tahu kami apa yang rusak adalah cara tercepat untuk memperbaikinya.

Kesimpulan

Melalui panduan lengkap tentang Pemikiran Lanjutan ini, Anda sekarang akan memiliki pemahaman yang jelas tentang cara mengaktifkan, mengonfigurasi, dan mengoptimalkan fitur tersebut untuk proyek Anda. Dengan iterasi berkelanjutan dari keluarga Claude 4, Pemikiran Lanjutan akan memainkan peran yang semakin penting dalam AI yang dapat dijelaskan, agen otomatis, dan penyelesaian tugas-tugas yang rumit. Ke depannya, kami berharap dapat melihat bagaimana Anda mengintegrasikannya ke dalam lebih banyak skenario industri, yang membuka babak baru dalam kolaborasi AI.