DeepSeek mengeluarkan sebuah eksperimen model yang dipanggil DeepSeek-V3.2-Exp on September 29, 2025, memperkenalkan mekanisme jarang-perhatian baharu (DeepSeek Sparse Attention, atau DSA) yang menyasarkan kos inferens yang jauh lebih rendah untuk beban kerja konteks panjang — dan syarikat secara serentak mengurangkan harga API sebanyak kira-kira separuh. Panduan ini menerangkan model itu, seni bina/serlahkan ciri, cara mengakses dan menggunakan API (dengan contoh kod), cara ia dibandingkan dengan model DeepSeek terdahulu dan cara menghuraikan dan mengendalikan responsnya dalam pengeluaran.
Apakah DeepSeek-V3.2-Exp?
DeepSeek-V3.2-Exp ialah lelaran percubaan dalam trek V3 DeepSeek. Keluaran - diumumkan pada akhir September 2025 - diletakkan sebagai langkah "pertengahan" yang mengesahkan pengoptimuman seni bina untuk panjang konteks lanjutan dan bukannya sebagai lonjakan besar dalam ketepatan mentah. Inovasi tajuknya ialah DeepSeek Perhatian Jarang (DSA), corak perhatian yang secara selektif memperhatikan bahagian input yang panjang untuk mengurangkan kos pengiraan dan memori sambil menyasarkan untuk memastikan kualiti output setanding dengan V3.1-Terminus.
Mengapa ia penting dalam amalan:
- Kos untuk tugasan konteks panjang: DSA menyasarkan kos perhatian kuadratik, mengurangkan pengiraan untuk input yang sangat panjang (fikirkan pengambilan berbilang dokumen, transkrip panjang, dunia permainan yang besar). Kos penggunaan API adalah lebih rendah secara material untuk kes penggunaan konteks panjang biasa.
- Keserasian & kebolehaksesan: API DeepSeek menggunakan format permintaan yang serasi dengan OpenAI, jadi banyak aliran kerja OpenAI SDK sedia ada boleh disesuaikan dengan cepat.
Apakah ciri dan seni bina utama DeepSeek V3.2-Exp?
Apakah DeepSeek Sparse Attention (DSA) dan bagaimana ia berfungsi?
DSA ialah a perhatian jarang berbutir halus skim yang direka untuk menghadiri secara terpilih ke atas token dan bukannya mengira perhatian padat merentas konteks penuh. Secara ringkasnya:
- Model secara dinamik memilih subset token untuk diperhatikan pada setiap lapisan atau blok, mengurangkan FLOP untuk panjang input yang panjang.
- Pemilihan direka bentuk untuk mengekalkan konteks "penting" untuk tugas penaakulan, memanfaatkan gabungan dasar pemilihan yang dipelajari dan heuristik penghalaan.
DSA sebagai inovasi teras dalam V3.2-Exp, bertujuan untuk memastikan kualiti output hampir kepada model perhatian padat sambil mengurangkan kos inferens, terutamanya apabila panjang konteks berkembang. Nota keluaran dan halaman model menekankan bahawa konfigurasi latihan telah diselaraskan dengan V3.1-Terminus jadi perbezaan dalam metrik penanda aras mencerminkan mekanisme perhatian yang jarang dan bukannya perubahan latihan borong.
Apakah seni bina/ciri lain yang dihantar dengan V3.2-Exp?
- Mod hibrid (berfikir vs tidak berfikir): DeepSeek mendedahkan dua ID model:
deepseek-chat(tidak berfikir / balasan yang lebih pantas) dandeepseek-reasoner(mod pemikiran yang boleh mendedahkan Rantaian Pemikiran atau kandungan penaakulan pertengahan). Mod ini membolehkan pembangun memilih kelajuan berbanding ketelusan penaakulan eksplisit. - Tetingkap konteks yang sangat besar: Keluarga V3.x menyokong konteks yang sangat besar (barisan V3 memberikan pilihan konteks DeepSeek 128K dalam kemas kini semasa), menjadikannya sesuai untuk aliran kerja berbilang dokumen, log panjang dan ejen yang mempunyai pengetahuan.
- Output JSON & panggilan fungsi yang ketat (Beta): API menyokong a
response_formatobjek yang boleh memaksa output JSON (dan beta panggilan fungsi yang ketat). Ini membantu apabila anda memerlukan output yang boleh dihuraikan mesin yang boleh diramal untuk penyepaduan alat. - Token penstriman & penaakulan: API menyokong respons penstriman dan — untuk model penaakulan — token kandungan penaakulan yang berbeza (sering didedahkan di bawah
reasoning_content), yang membolehkan anda memaparkan atau mengaudit langkah perantaraan model.
Bagaimanakah saya boleh mengakses dan menggunakan API DeepSeek-V3.2-Exp melalui CometAPI?
DeepSeek sengaja menyimpan format API gaya OpenAI — jadi SDK OpenAI sedia ada atau alatan yang serasi boleh disasarkan semula dengan URL asas yang berbeza. Saya mengesyorkan menggunakan CometAPI untuk mengakses DeepSeek-V3.2-Exp kerana ia berharga rendah dan gerbang pengagregatan berbilang mod. DeepSeek mendedahkan nama model yang dipetakan kepada gelagat V3.2-Exp. Contoh:
DeepSeek-V3.2-Exp-thinking — mod penaakulan/pemikiran dipetakan kepada V3.2-Exp.
DeepSeek-V3.2-Exp-thinking — mod bukan alasan/sembang dipetakan kepada V3.2-Exp.
Bagaimanakah cara saya mengesahkan dan apakah URL asas?
- Dapatkan kunci API daripada konsol pembangun CometAPI (gunakan di tapak mereka).
- URL asas: (
https://api.cometapi.comorhttps://api.cometapi.com/v1untuk laluan serasi OpenAI). Keserasian OpenAI bermakna banyak SDK OpenAI boleh dihalakan semula ke DeepSeek dengan perubahan kecil.
ID model manakah yang harus saya gunakan?
DeepSeek-V3.2-Exp-thinking— mod pemikiran, mendedahkan kandungan rantaian pemikiran/penaakulan. Kedua-duanya telah dinaik taraf kepada V3.2-Exp dalam nota keluaran terkini.DeepSeek-V3.2-Exp-nothinking— tidak berfikir, respons yang lebih cepat, penggunaan sembang/penyelesaian biasa.
Contoh: permintaan curl mudah (penyelesaian sembang)
curl -s https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $cometapi_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v3.2-exp",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize the attached meeting transcript in 3 bullet points."}
],
"max_tokens": 512,
"stream": false
}'
Contoh: Python (corak klien serasi OpenAI)
Corak ini berfungsi selepas menghalakan klien OpenAI ke URL asas CometAPI (atau menggunakan SDK CometAPI). Contoh di bawah mengikut gaya dokumen DeepSeek:
import os
import requests
API_KEY = os.environ
url = "https://api.deepseek.com/v1/chat/completions"
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
payload = {
"model": "deepseek-v3.2-exp",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Extract action items from the following notes..."}
],
"max_tokens": 800
}
r = requests.post(url, headers=headers, json=payload)
r.raise_for_status()
print(r.json())
Tiada SDK khas diperlukan — tetapi jika anda sudah menggunakan SDK OpenAI, anda sering boleh mengkonfigurasi semula base_url and api_key dan mengekalkan corak panggilan yang sama.
Penggunaan lanjutan: membolehkan penaakulan atau reasoning_content
Jika anda memerlukan rantaian pemikiran dalaman model (untuk pengauditan, penyulingan atau pengekstrakan langkah perantaraan), tukar ke DeepSeek-V3.2-Exp-thinking. Yang reasoning_content medan (dan aliran atau token yang berkaitan) tersedia dalam respons untuk mod penaakulan; yang disediakan oleh dokumen API reasoning_content sebagai medan tindak balas untuk memeriksa CoT yang dijana sebelum jawapan akhir. Nota: mendedahkan token ini boleh menjejaskan pengebilan kerana ia adalah sebahagian daripada output model.
Penstriman dan kemas kini separa
- Penggunaan
"stream": truedalam permintaan untuk menerima delta token melalui SSE (peristiwa dihantar pelayan). stream_optionsandinclude_usagemembolehkan anda menala cara dan bila metadata penggunaan muncul semasa strim (membantu untuk UI tambahan).
Bagaimanakah DeepSeek-V3.2-Exp dibandingkan dengan model DeepSeek sebelumnya?
V3.2-Exp lwn V3.1-Terminus
- Perbezaan utama: V3.2-Exp memperkenalkan mekanisme perhatian yang jarang untuk mengurangkan pengiraan untuk konteks yang panjang sambil mengekalkan resipi latihan yang lain sejajar dengan V3.1. Ini membolehkan DeepSeek membuat perbandingan epal-ke-epal yang lebih bersih bagi keuntungan kecekapan. ()
- tanda aras: Nota awam menunjukkan V3.2-Exp berprestasi secara kasar setanding dengan V3.1 pada banyak tugas penaakulan/pengekodan sementara lebih murah pada konteks yang panjang; ambil perhatian bahawa tugas tertentu masih boleh mempunyai regresi kecil bergantung pada cara keterbatasan perhatian berinteraksi dengan interaksi token yang diperlukan.
V3.2-Exp vs R1 / Keluaran lama
- Barisan R1 dan V3 mengikut matlamat reka bentuk yang berbeza (R1 secara sejarah tertumpu pada pertukaran seni bina yang berbeza dan kapasiti multimodal di beberapa cawangan). V3.2-Exp ialah penyempurnaan dalam keluarga V3 yang memfokuskan pada konteks dan daya pengeluaran yang panjang. Jika beban kerja anda berat pada penanda aras ketepatan mentah satu pusingan, perbezaannya mungkin sederhana; jika anda beroperasi pada saluran paip berbilang dokumen, profil kos V3.2-Exp berkemungkinan lebih menarik.

Di mana untuk Mengakses Claude Sonnet 4.5
CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.
Pembangun boleh mengakses DeepSeek V3.2 Exp melalui CometAPI, versi model terkini sentiasa dikemas kini dengan laman web rasmi. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.
Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !
Kesimpulan
DeepSeek-V3.2-Exp ialah keluaran percubaan pragmatik yang bertujuan untuk menjadikan kerja konteks panjang lebih murah dan boleh dilaksanakan sambil mengekalkan kualiti keluaran kelas V3. Untuk pasukan yang berurusan dengan dokumen panjang, transkrip atau penaakulan berbilang dokumen, ia patut dicuba: API mengikut antara muka gaya OpenAI yang menjadikan penyepaduan secara mudah, ia menyerlahkan kedua-dua mekanisme DSA dan pengurangan harga yang bermakna yang mengubah kalkulus ekonomi bangunan pada skala. Seperti mana-mana model eksperimen, penilaian komprehensif, instrumentasi dan pelancaran berperingkat adalah penting.
