Apa itu DeepSeek-Reasoner?

DeepSeek-Reasoner adalah mode penalaran (atau “thinking”) sekaligus nama API untuk model DeepSeek yang mengutamakan penalaran (saat ini selaras dengan keluarga DeepSeek-V3.2). Model ini dirancang untuk menghasilkan rantai pemikiran (CoT) yang eksplisit sebelum mengeluarkan jawaban akhir—yakni, model secara sengaja menghasilkan penalaran internal langkah demi langkah yang diekspos (atau dapat diekspos) melalui API agar pemanggil dapat meninjaunya atau mendistilasi. DeepSeek memosisikan varian reasoner sebagai padanan “thinking” untuk model chat non-thinking dan memasarkannya untuk penalaran multi-langkah, matematika, pengkodean, dan alur kerja agen.

Fitur utama (untuk pengguna)

Keluaran Chain-of-Thought (CoT) eksplisit. API mengembalikan field reasoning_content terpisah yang berisi penalaran internal model secara bertahap berdampingan dengan content akhir. Ini dirancang agar mudah diperiksa dan untuk logika agen di hilir.
Mode “Thinking” vs “Chat”. deepseek-reasoner (mode thinking) berbeda dari deepseek-chat (mode non-thinking); keduanya telah ditingkatkan ke generasi V3.2.
Jendela konteks besar. DeepSeek menyediakan panjang konteks yang sangat besar. Varian Reasoner dipasarkan untuk penalaran bentuk panjang dan memori agen.
Keluaran JSON / respons terstruktur. Mendukung keluaran JSON terstruktur yang berguna untuk konsumsi terprogram.
Fokus pada agen/pembangun agen. V3.2 dan varian Speciale secara eksplisit digambarkan sebagai “model yang mengutamakan penalaran dan dibangun untuk agen.”

Kapabilitas teknis

Input: prompt teks biasa, JSON terstruktur untuk pemanggilan tool/agen, file atau dokumen panjang (melalui konteks panjang); token adalah token NLP standar.
Output: API mengembalikan reasoning_content (teks CoT) dan content (jawaban akhir). Klien API dapat meminta hanya CoT atau hanya jawaban akhir dengan menyesuaikan max_tokens atau parameter respons. (Catatan praktis: mengekstrak CoT mungkin tetap ditagihkan sebagai keluaran model.)
DeepSeek telah melakukan iterasi melalui peta jalan yang mengkhusus pada penalaran: model dasar berskala besar (keluarga R1) diikuti pelatihan lanjutan terfokus / reinforcement learning (gaya RLHF) serta fine-tuning bergaya kebijakan untuk meningkatkan kedalaman penalaran. Tim juga menggunakan distilasi untuk memadatkan kapabilitas penalaran ke dalam model yang lebih kecil dan dapat diterapkan.
Seri V3.2 menambahkan post-training berorientasi agen untuk penggunaan tool, inferensi hibrida (Think / Non-Think), dan optimasi untuk iterasi “thinking” yang lebih cepat.
Efisiensi inferensi ditunjang oleh metode sparse attention (laporan menyebutnya DeepSeek Sparse Attention — DSA) yang memusatkan komputasi pada segmen yang relevan alih-alih attention padat penuh di seluruh urutan yang sangat panjang; ini mengurangi biaya untuk konteks yang sangat panjang.

Cara mengakses API deepseek-reasoner

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke Konsol CometAPI. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx lalu kirim.

Langkah 2: Kirim permintaan ke API deepseek-reasoner

Pilih endpoint “deepseek-reasoner” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dok API situs web kami. Situs kami juga menyediakan pengujian Apifox demi kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar menggunakan format Chat.

Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

Apa itu DeepSeek-Reasoner?

Fitur utama (untuk pengguna)

Keluaran Chain-of-Thought (CoT) eksplisit. API mengembalikan field reasoning_content terpisah yang berisi penalaran internal model secara bertahap berdampingan dengan content akhir. Ini dirancang agar mudah diperiksa dan untuk logika agen di hilir.
Mode “Thinking” vs “Chat”. deepseek-reasoner (mode thinking) berbeda dari deepseek-chat (mode non-thinking); keduanya telah ditingkatkan ke generasi V3.2.
Jendela konteks besar. DeepSeek menyediakan panjang konteks yang sangat besar. Varian Reasoner dipasarkan untuk penalaran bentuk panjang dan memori agen.
Keluaran JSON / respons terstruktur. Mendukung keluaran JSON terstruktur yang berguna untuk konsumsi terprogram.
Fokus pada agen/pembangun agen. V3.2 dan varian Speciale secara eksplisit digambarkan sebagai “model yang mengutamakan penalaran dan dibangun untuk agen.”

Kapabilitas teknis

Input: prompt teks biasa, JSON terstruktur untuk pemanggilan tool/agen, file atau dokumen panjang (melalui konteks panjang); token adalah token NLP standar.
Output: API mengembalikan reasoning_content (teks CoT) dan content (jawaban akhir). Klien API dapat meminta hanya CoT atau hanya jawaban akhir dengan menyesuaikan max_tokens atau parameter respons. (Catatan praktis: mengekstrak CoT mungkin tetap ditagihkan sebagai keluaran model.)
DeepSeek telah melakukan iterasi melalui peta jalan yang mengkhusus pada penalaran: model dasar berskala besar (keluarga R1) diikuti pelatihan lanjutan terfokus / reinforcement learning (gaya RLHF) serta fine-tuning bergaya kebijakan untuk meningkatkan kedalaman penalaran. Tim juga menggunakan distilasi untuk memadatkan kapabilitas penalaran ke dalam model yang lebih kecil dan dapat diterapkan.
Seri V3.2 menambahkan post-training berorientasi agen untuk penggunaan tool, inferensi hibrida (Think / Non-Think), dan optimasi untuk iterasi “thinking” yang lebih cepat.
Efisiensi inferensi ditunjang oleh metode sparse attention (laporan menyebutnya DeepSeek Sparse Attention — DSA) yang memusatkan komputasi pada segmen yang relevan alih-alih attention padat penuh di seluruh urutan yang sangat panjang; ini mengurangi biaya untuk konteks yang sangat panjang.

Cara mengakses API deepseek-reasoner

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim permintaan ke API deepseek-reasoner

Masukkan pertanyaan atau permintaan Anda ke dalam field content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

DeepSeek-Reasoner

Playground untuk DeepSeek-Reasoner

Apa itu DeepSeek-Reasoner?

Fitur utama (untuk pengguna)

Kapabilitas teknis

Cara mengakses API deepseek-reasoner

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim permintaan ke API deepseek-reasoner

Langkah 3: Ambil dan verifikasi hasil

Harga untuk DeepSeek-Reasoner

Kode contoh dan API untuk DeepSeek-Reasoner

Python Code Example

JavaScript Code Example

Curl Code Example

Versi DeepSeek-Reasoner

DeepSeek-Reasoner

Playground untuk DeepSeek-Reasoner

Apa itu DeepSeek-Reasoner?

Fitur utama (untuk pengguna)

Kapabilitas teknis

Cara mengakses API deepseek-reasoner

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim permintaan ke API deepseek-reasoner

Langkah 3: Ambil dan verifikasi hasil

Harga untuk DeepSeek-Reasoner

Kode contoh dan API untuk DeepSeek-Reasoner

Python Code Example

JavaScript Code Example

Curl Code Example

Versi DeepSeek-Reasoner

version
deepseek-r1-0528
deepseek-r1
deepseek-reasoner

version
deepseek-r1-0528
deepseek-r1
deepseek-reasoner