DeepSeek V3.1 ialah naik taraf terbaharu dalam siri V DeepSeek: model bahasa berskala besar hibrid “berfikir / bukan berfikir” yang disasarkan kepada kecerdasan umum berkapasiti tinggi, kos rendah, dan penggunaan alat berorientasikan agen. Ia mengekalkan keserasian API gaya OpenAI, menambah pemanggilan alat yang lebih pintar, dan—mengikut syarikat—memberikan penjanaan lebih pantas serta kebolehpercayaan agen yang dipertingkat.
Ciri asas (apa yang ditawarkan)
- Mod inferens dwiganda: deepseek-chat (bukan berfikir / lebih pantas) dan deepseek-reasoner (berfikir / rantaian pemikiran/kemahiran agen lebih kuat). UI menyediakan togol “DeepThink” untuk pengguna akhir.
- Konteks panjang: bahan rasmi dan laporan komuniti menekankan tetingkap konteks 128k token untuk salasilah keluarga V3. Ini membolehkan pemprosesan hujung-ke-hujung bagi dokumen yang sangat panjang.
- Pengendalian alat/agen yang dipertingkat: pengoptimuman pasca latihan disasarkan kepada pemanggilan alat yang boleh dipercayai, aliran kerja agen berbilang langkah, dan integrasi plugin/alatan.
Butiran teknikal (seni bina, latihan, dan pelaksanaan)
Korpus latihan & kejuruteraan konteks panjang. Kemas kini DeepSeek V3.1 menekankan lanjutan konteks panjang dua fasa di atas titik semak V3 terdahulu: nota awam menunjukkan sejumlah token tambahan besar diperuntukkan kepada fasa lanjutan 32k dan 128k (DeepSeek melaporkan ratusan bilion token digunakan dalam langkah lanjutan tersebut). Keluaran ini turut mengemas kini konfigurasi tokenizer untuk menyokong rejim konteks yang lebih besar.
Saiz model dan penskalaan mikro untuk inferens. Laporan awam dan komuniti memberikan jumlah parameter yang agak berbeza (keputusan biasa bagi keluaran baharu): pengindeks dan cermin pihak ketiga menyenaraikan ~671B parameter (37B aktif) dalam sesetengah penerangan masa larian, manakala ringkasan komuniti lain melaporkan ~685B sebagai saiz nominal seni bina penaakulan hibrid.
Mod inferens & kompromi kejuruteraan. Deepseek V3.1 menampilkan dua mod inferens pragmatik: deepseek-chat (dioptimumkan untuk sembang berasaskan giliran standard, kependaman lebih rendah) dan deepseek-reasoner (mod “thinking” yang mengutamakan rantaian pemikiran dan penaakulan berstruktur).
Had & risiko
- Kematangan penanda aras & kebolehulangan: banyak dakwaan prestasi adalah awal, dipacu komuniti, atau selektif. Penilaian bebas dan piawai masih dalam proses mengejar. (Risiko: tuntutan berlebihan).
- Keselamatan & halusinasi: seperti semua LLM, Deepseek V3.1 tertakluk kepada halusinasi dan risiko kandungan berbahaya; mod penaakulan yang lebih kuat kadangkala menghasilkan output berbilang langkah yang yakin tetapi salah. Pengguna harus menggunakan lapisan keselamatan dan semakan manusia untuk output kritikal. (Tiada vendor atau sumber bebas mendakwa penghapusan halusinasi.)
- Kos & kependaman inferens: mod penaakulan menukar kependaman untuk keupayaan; untuk inferens pengguna berskala besar ini menambah kos. Sesetengah pengulas menyatakan reaksi pasaran terhadap model terbuka, murah, berkelajuan tinggi boleh menjadi tidak menentu.
Kes penggunaan umum & menarik
- Analisis & pemeringkasan dokumen panjang: undang-undang, R&D, ulasan literatur — manfaatkan tetingkap konteks 128k token untuk ringkasan hujung-ke-hujung.
- Aliran kerja agen dan orkestrasi alat: automasi yang memerlukan panggilan alat berbilang langkah (API, carian, kalkulator). Penalaan agen pasca latihan Deepseek V3.1 bertujuan meningkatkan kebolehpercayaan di sini.
- Penjanaan kod & bantuan perisian: laporan penanda aras awal menekankan prestasi pengaturcaraan yang kukuh; sesuai untuk pengaturcaraan berpasangan, semakan kod, dan tugasan penjanaan dengan penyeliaan manusia.
- Penyebaran perusahaan di mana pilihan kos/kependaman penting: pilih mod chat untuk pembantu perbualan yang murah/lebih pantas dan reasoner untuk tugas penaakulan mendalam luar talian atau premium.
Cara memanggil API Deepseek V3.1 daripada CometAPI
deepseek v3.1 Harga API di CometAPI, 20% lebih rendah daripada harga rasmi:
| Token Masukan | $0.44 |
| Token Keluaran | $1.32 |
Langkah Diperlukan
- Log masuk ke cometapi.com. Jika anda bukan pengguna kami, sila daftar terlebih dahulu
- Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan URL laman ini: https://api.cometapi.com/
Kaedah Penggunaan
- Pilih titik akhir “
deepseek-v3.1“ / “deepseek-v3-1-250821” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah dan badan permintaan diperoleh daripada dok API laman web kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
Panggilan API
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk migrasi lancar. Butiran utama ke Dokumen API:
- Parameter Teras:
prompt,max_tokens_to_sample,temperature,stop_sequences - Titik Akhir:
https://api.cometapi.com/v1/chat/completions - Parameter Model: “
deepseek-v3.1“ / “deepseek-v3-1-250821“ - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
Gantikan
CometAPI_API_KEYdengan kunci anda; ambil perhatian base URL.
Python
from openai import OpenAI
client = OpenAI(
api_key=os.environ,
base_url="https://api.cometapi.com/v1/chat/completions" # important
)
resp = client.chat.completions.create(
model="deepseek-v3.1",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize this PDF in 5 bullets."}
],
temperature=0.3,
response_format={"type": "json_object"} # for structured outputs
)
print(resp.choices.message.content)
Lihat juga Grok 4
