Apa itu DeepSeek-Reasoner?
DeepSeek-Reasoner adalah mode/naam API untuk model berfokus penalaran (atau “thinking”) milik DeepSeek (saat ini selaras dengan keluarga DeepSeek-V3.2). Mode ini dirancang untuk menghasilkan Chain-of-Thought (CoT) secara eksplisit sebelum menampilkan jawaban akhir—yakni, model secara sengaja menghasilkan penalaran internal langkah demi langkah yang diekspos (atau dapat diekspos) melalui API sehingga pemanggil dapat menginspeksi atau mendistilasinya. DeepSeek memosisikan varian reasoner sebagai padanan “thinking” untuk model chat non-thinking dan memasarkan varian ini untuk penalaran multi-langkah, matematika, pengodean, serta alur kerja agen.
Fitur utama (untuk pengguna)
- Keluaran Chain-of-Thought (CoT) yang eksplisit. API mengembalikan field
reasoning_contentterpisah yang memuat penalaran bertahap internal model bersamaan dengancontentfinal. Ini dirancang untuk kemudahan inspeksi dan logika agen hilir. - Mode “Thinking” vs “Chat”.
deepseek-reasoner(mode thinking) berbeda darideepseek-chat(mode non-thinking); keduanya ditingkatkan ke generasi V3.2. - Jendela konteks besar. DeepSeek menyediakan panjang konteks yang sangat besar. Varian Reasoner dipasarkan untuk penalaran bentuk panjang dan memori agen.
- Keluaran JSON / respons terstruktur. Mendukung keluaran JSON terstruktur yang berguna untuk konsumsi terprogram.
- Fokus pada agen/pembangun agen. V3.2 dan varian Speciale secara eksplisit digambarkan sebagai “model berfokus pada penalaran yang dibangun untuk agen.”
Kapabilitas teknis
- Masukan: prompt teks biasa, JSON terstruktur untuk pemanggilan alat/agen, file atau dokumen panjang (melalui konteks panjang); token adalah token NLP standar.
- Keluaran: API mengembalikan
reasoning_content(teks CoT) dancontent(jawaban akhir). Klien API dapat meminta hanya CoT atau hanya jawaban akhir dengan menyesuaikan max_tokens atau parameter respons. (Catatan praktis: mengekstrak CoT mungkin tetap ditagih sebagai keluaran model.) - DeepSeek telah melakukan iterasi melalui peta jalan yang dioptimalkan untuk penalaran: model besar dasar (keluarga R1) diikuti oleh pelatihan pasca terarah/PE (gaya RLHF) dan fine-tuning bergaya kebijakan untuk memperdalam penalaran. Tim juga menggunakan distilasi untuk memampatkan kapabilitas penalaran ke model yang lebih kecil dan mudah diterapkan.
- Seri V3.2 menambahkan pelatihan pasca berorientasi agen untuk penggunaan alat, inferensi hibrida (Think / Non-Think), dan optimisasi untuk iterasi “thinking” yang lebih cepat.
- Efisiensi inferensi dibantu oleh metode perhatian jarang (laporan menyebutnya DeepSeek Sparse Attention — DSA) yang memfokuskan komputasi pada segmen relevan alih-alih perhatian padat penuh pada urutan yang sangat panjang; ini mengurangi biaya untuk konteks yang sangat panjang.
Cara mengakses API deepseek-reasoner
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kunci API kredensial akses antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirim.
Langkah 2: Kirim Permintaan ke API deepseek-reasoner
Pilih endpoint “deepseek-reasoner” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumentasi API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar menggunakan format Chat.
Masukkan pertanyaan atau permintaan Anda ke field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.