Cara Mengakses API DeepSeek-V3.2-Exp

DeepSeek merilis sebuah eksperimental model disebut DeepSeek-V3.2-Kadaluarsa on September 29, 2025, memperkenalkan mekanisme sparse-attention baru (DeepSeek Sparse Attention, atau DSA) yang menargetkan biaya inferensi yang jauh lebih rendah untuk beban kerja konteks panjang — dan perusahaan sekaligus memangkas harga API sekitar setengahnya. Panduan ini menjelaskan modelnya, arsitektur/fitur unggulannya, cara mengakses dan menggunakan API (dengan contoh kode), perbandingannya dengan model DeepSeek sebelumnya, dan cara mengurai serta menangani responsnya dalam produksi.

Apa itu DeepSeek-V3.2-Exp?

DeepSeek-V3.2-Exp adalah iterasi eksperimental dalam rangkaian DeepSeek V3. Rilis ini — diumumkan pada akhir September 2025 — diposisikan sebagai langkah "perantara" yang memvalidasi optimasi arsitektur untuk konteks yang lebih panjang, alih-alih sebagai lompatan besar dalam akurasi mentah. Inovasi utamanya adalah Perhatian Jarang DeepSeek (DSA), pola perhatian yang secara selektif memperhatikan bagian masukan yang panjang untuk mengurangi biaya komputasi dan memori sambil bertujuan menjaga kualitas keluaran sebanding dengan V3.1-Terminus.

Mengapa hal ini penting dalam praktik:

Biaya untuk tugas konteks panjang: DSA menargetkan biaya perhatian kuadratik, mengurangi komputasi untuk input yang sangat panjang (misalnya pengambilan multi-dokumen, transkrip panjang, dunia game yang besar). Biaya penggunaan API jauh lebih rendah untuk kasus penggunaan konteks panjang yang umum.
Kompatibilitas & aksesibilitas: API DeepSeek menggunakan format permintaan yang kompatibel dengan OpenAI, sehingga banyak alur kerja OpenAI SDK yang ada dapat diadaptasi dengan cepat.

Apa saja fitur utama dan arsitektur DeepSeek V3.2-Exp?

Apa itu DeepSeek Sparse Attention (DSA) dan bagaimana cara kerjanya?

DSA adalah sebuah perhatian yang jarang dan berbutir halus Skema yang dirancang untuk memperhatikan token secara selektif, alih-alih menghitung perhatian yang padat di seluruh konteks. Singkatnya:

Model ini secara dinamis memilih subset token untuk ditangani di setiap lapisan atau blok, mengurangi FLOP untuk panjang input yang panjang.
Pemilihan ini dirancang untuk mempertahankan konteks “penting” untuk tugas penalaran, memanfaatkan kombinasi kebijakan pemilihan yang dipelajari dan heuristik perutean.

DSA, sebagai inovasi inti dalam V3.2-Exp, bertujuan untuk menjaga kualitas keluaran mendekati model atensi-padat sekaligus mengurangi biaya inferensi, terutama ketika panjang konteks bertambah. Catatan rilis dan halaman model menekankan bahwa konfigurasi pelatihan telah diselaraskan dengan V3.1-Terminus sehingga perbedaan dalam metrik tolok ukur mencerminkan mekanisme atensi yang jarang, alih-alih perubahan pelatihan secara menyeluruh.

Arsitektur/fitur lain apa yang disertakan dengan V3.2-Exp?

Mode hibrida (berpikir vs tidak berpikir): DeepSeek memaparkan dua ID model: deepseek-chat (tidak berpikir / balasan lebih cepat) dan deepseek-reasoner (mode berpikir yang dapat mengekspos konten Rantai Pemikiran atau penalaran menengah). Mode ini memungkinkan pengembang memilih kecepatan vs. transparansi penalaran eksplisit.
Jendela konteks yang sangat besar: Keluarga V3.x mendukung konteks yang sangat besar (baris V3 memberi DeepSeek opsi konteks 128K dalam pembaruan terkini), membuatnya cocok untuk alur kerja multi-dokumen, log panjang, dan agen yang membutuhkan banyak pengetahuan.
Keluaran JSON & pemanggilan fungsi ketat (Beta): API mendukung response_format Objek yang dapat memaksa keluaran JSON (dan beta pemanggilan fungsi yang ketat). Ini membantu ketika Anda membutuhkan keluaran yang dapat diprediksi dan diurai mesin untuk integrasi alat.
Token streaming & penalaran: API mendukung respons streaming dan — untuk model penalaran — token konten penalaran yang berbeda (sering kali diekspos di bawah reasoning_content), yang memungkinkan Anda menampilkan atau mengaudit langkah-langkah antara model.

Bagaimana cara mengakses dan menggunakan API DeepSeek-V3.2-Exp melalui CometAPI?

DeepSeek sengaja mempertahankan format API bergaya OpenAI — sehingga SDK OpenAI yang ada atau perangkat yang kompatibel dapat ditargetkan ulang dengan URL dasar yang berbeda. Saya merekomendasikan penggunaan CometAPI untuk mengakses DeepSeek-V3.2-Exp karena harganya terjangkau dan merupakan gateway agregasi multimodal. DeepSeek mengekspos nama model yang memetakan ke perilaku V3.2-Exp. Contoh:

DeepSeek-V3.2-Exp-thinking — mode penalaran/berpikir dipetakan ke V3.2-Exp.

DeepSeek-V3.2-Exp-thinking — mode non-penalaran/obrolan dipetakan ke V3.2-Exp.

Bagaimana cara saya melakukan autentikasi dan apa URL dasarnya?

Dapatkan kunci API dari konsol pengembang CometAPI (ajukan di situs mereka).
URL dasar: (https://api.cometapi.com or https://api.cometapi.com/v1 untuk jalur yang kompatibel dengan OpenAI). Kompatibilitas OpenAI berarti banyak SDK OpenAI dapat diarahkan ulang ke DeepSeek dengan perubahan kecil.

ID model mana yang harus saya gunakan?

DeepSeek-V3.2-Exp-thinking— mode berpikir, menampilkan konten berantai pemikiran/penalaran. Keduanya telah diperbarui ke V3.2-Exp dalam catatan rilis terbaru.
DeepSeek-V3.2-Exp-nothinking — tidak berpikir, respon lebih cepat, penggunaan obrolan/penyelesaian yang umum.

Contoh: permintaan curl sederhana (penyelesaian obrolan)

curl -s https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $cometapi_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v3.2-exp",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Summarize the attached meeting transcript in 3 bullet points."}
    ],
    "max_tokens": 512,
    "stream": false
  }'

Contoh: Python (pola klien yang kompatibel dengan OpenAI)

Pola ini berfungsi setelah mengarahkan klien OpenAI ke URL dasar CometAPI (atau menggunakan SDK CometAPI). Contoh di bawah ini mengikuti gaya dokumentasi DeepSeek:

import os
import requests

API_KEY = os.environ
url = "https://api.deepseek.com/v1/chat/completions"
headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

payload = {
    "model": "deepseek-v3.2-exp",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Extract action items from the following notes..."}
    ],
    "max_tokens": 800
}

r = requests.post(url, headers=headers, json=payload)
r.raise_for_status()
print(r.json())

Tidak diperlukan SDK khusus — tetapi jika Anda sudah menggunakan SDK OpenAI, Anda sering kali dapat mengkonfigurasi ulang base_url dan api_key dan mempertahankan pola panggilan yang sama.

Penggunaan tingkat lanjut: memungkinkan penalaran atau `reasoning_content`

Jika Anda memerlukan rantai pemikiran internal model (untuk audit, distilasi, atau ekstraksi langkah perantara), beralihlah ke DeepSeek-V3.2-Exp-thinking. itu reasoning_content bidang (dan aliran atau token terkait) tersedia dalam respons untuk mode penalaran; dokumen API menyediakan reasoning_content sebagai kolom respons untuk memeriksa CoT yang dihasilkan sebelum jawaban akhir. Catatan: mengekspos token ini dapat memengaruhi penagihan karena merupakan bagian dari keluaran model.

Streaming dan pembaruan parsial

penggunaan "stream": true dalam permintaan untuk menerima token delta melalui SSE (peristiwa yang dikirim server).
stream_options dan include_usage memungkinkan Anda mengatur bagaimana dan kapan metadata penggunaan muncul selama streaming (berguna untuk UI tambahan).

Bagaimana DeepSeek-V3.2-Exp dibandingkan dengan model DeepSeek sebelumnya?

V3.2-Exp vs V3.1-Terminus

Perbedaan utama: V3.2-Exp memperkenalkan mekanisme sparse attention untuk mengurangi komputasi dalam konteks yang panjang sekaligus menjaga agar resep pelatihan lainnya tetap selaras dengan V3.1. Hal ini memungkinkan DeepSeek untuk membuat perbandingan yang lebih akurat mengenai peningkatan efisiensi. ()
Tolak ukur: Catatan publik menunjukkan V3.2-Exp berkinerja hampir sama dengan V3.1 pada banyak tugas penalaran/pengodean sementara jauh lebih murah pada konteks yang panjang; perlu dicatat bahwa tugas tertentu masih dapat mengalami kemunduran kecil tergantung pada bagaimana kelangkaan perhatian berinteraksi dengan interaksi token yang diperlukan.

V3.2-Exp vs R1 / Rilis lama

Lini R1 dan V3 memiliki tujuan desain yang berbeda (R1 secara historis berfokus pada berbagai tradeoff arsitektur dan kapasitas multimoda di beberapa cabang). V3.2-Exp merupakan penyempurnaan dalam keluarga V3 yang berfokus pada konteks dan throughput yang panjang. Jika beban kerja Anda berat pada benchmark akurasi raw single-turn, perbedaannya mungkin kecil; jika Anda beroperasi pada pipeline multi-dokumen, profil biaya V3.2-Exp kemungkinan lebih menarik.

Cara Mengakses API DeepSeek-V3.2-Exp

Tempat Mengakses Claude Sonnet 4.5

CometAPI adalah platform API terpadu yang menggabungkan lebih dari 500 model AI dari penyedia terkemuka—seperti seri GPT OpenAI, Gemini Google, Claude Anthropic, Midjourney, Suno, dan lainnya—menjadi satu antarmuka yang ramah bagi pengembang. Dengan menawarkan autentikasi yang konsisten, pemformatan permintaan, dan penanganan respons, CometAPI secara drastis menyederhanakan integrasi kapabilitas AI ke dalam aplikasi Anda. Baik Anda sedang membangun chatbot, generator gambar, komposer musik, atau alur kerja analitik berbasis data, CometAPI memungkinkan Anda melakukan iterasi lebih cepat, mengendalikan biaya, dan tetap tidak bergantung pada vendor—semuanya sambil memanfaatkan terobosan terbaru di seluruh ekosistem AI.

Pengembang dapat mengakses DeepSeek V3.2 Kedaluwarsa melalui CometAPI, versi model terbaru selalu diperbarui dengan situs web resmi. Untuk memulai, jelajahi kemampuan model di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.

Siap untuk berangkat?→ Daftar ke CometAPI hari ini !

Kesimpulan

DeepSeek-V3.2-Exp adalah rilis eksperimental pragmatis yang bertujuan untuk membuat pekerjaan konteks panjang lebih murah dan lebih layak sambil mempertahankan kualitas keluaran kelas V3. Bagi tim yang menangani dokumen panjang, transkrip, atau penalaran multi-dokumen, rilis ini patut dicoba: API mengikuti antarmuka bergaya OpenAI yang memudahkan integrasi, menyoroti mekanisme DSA dan pengurangan harga yang signifikan yang mengubah kalkulus ekonomi pembangunan skala besar. Seperti halnya model eksperimental lainnya, evaluasi komprehensif, instrumentasi, dan peluncuran bertahap sangat penting.

Apa itu DeepSeek-V3.2-Exp?

Apa saja fitur utama dan arsitektur DeepSeek V3.2-Exp?

Apa itu DeepSeek Sparse Attention (DSA) dan bagaimana cara kerjanya?

Arsitektur/fitur lain apa yang disertakan dengan V3.2-Exp?

Bagaimana cara mengakses dan menggunakan API DeepSeek-V3.2-Exp melalui CometAPI?

Bagaimana cara saya melakukan autentikasi dan apa URL dasarnya?

ID model mana yang harus saya gunakan?

Contoh: permintaan curl sederhana (penyelesaian obrolan)

Contoh: Python (pola klien yang kompatibel dengan OpenAI)

Penggunaan tingkat lanjut: memungkinkan penalaran atau `reasoning_content`

Streaming dan pembaruan parsial

Bagaimana DeepSeek-V3.2-Exp dibandingkan dengan model DeepSeek sebelumnya?

V3.2-Exp vs V3.1-Terminus

V3.2-Exp vs R1 / Rilis lama

Tempat Mengakses Claude Sonnet 4.5

Kesimpulan

Baca Selengkapnya

500+ Model dalam Satu API

Cara Mengakses API DeepSeek-V3.2-Exp

Apa itu DeepSeek-V3.2-Exp?

Apa saja fitur utama dan arsitektur DeepSeek V3.2-Exp?

Apa itu DeepSeek Sparse Attention (DSA) dan bagaimana cara kerjanya?

Arsitektur/fitur lain apa yang disertakan dengan V3.2-Exp?

Bagaimana cara mengakses dan menggunakan API DeepSeek-V3.2-Exp melalui CometAPI?

Bagaimana cara saya melakukan autentikasi dan apa URL dasarnya?

ID model mana yang harus saya gunakan?

Contoh: permintaan curl sederhana (penyelesaian obrolan)

Contoh: Python (pola klien yang kompatibel dengan OpenAI)

Penggunaan tingkat lanjut: memungkinkan penalaran atau reasoning_content

Streaming dan pembaruan parsial

Bagaimana DeepSeek-V3.2-Exp dibandingkan dengan model DeepSeek sebelumnya?

V3.2-Exp vs V3.1-Terminus

V3.2-Exp vs R1 / Rilis lama

Tempat Mengakses Claude Sonnet 4.5

Kesimpulan

Baca Selengkapnya

500+ Model dalam Satu API

Penggunaan tingkat lanjut: memungkinkan penalaran atau `reasoning_content`