Ciri asas (apa yang ditawarkan)
- Dua mod inferens: deepseek-chat (tanpa penaakulan / lebih pantas) dan deepseek-reasoner (berfikir / kemahiran rantai pemikiran/agen lebih kuat)。UI menyediakan togol “DeepThink” untuk pengguna akhir。
- Konteks panjang: bahan rasmi dan laporan komuniti menekankan tetingkap konteks 128k token untuk salasilah keluarga V3。Ini membolehkan pemprosesan hujung ke hujung bagi dokumen yang sangat panjang。
- Pengendalian alat/agen yang dipertingkat: pengoptimuman pasca latihan disasarkan pada pemanggilan alat yang boleh dipercayai、aliran kerja agen berbilang langkah、dan penyepaduan pemalam/alat。
Butiran teknikal (senibina, latihan, dan pelaksanaan)
Korpus latihan & kejuruteraan konteks panjang. Kemas kini Deepseek V3.1 menekankan pelanjutan konteks panjang dua fasa berasaskan titik semak V3 terdahulu: nota awam menunjukkan token tambahan besar diperuntukkan kepada fasa pelanjutan 32k dan 128k (DeepSeek melaporkan ratusan bilion token digunakan dalam langkah pelanjutan)。Keluaran ini juga mengemas kini konfigurasi tokenizer untuk menyokong rejim konteks yang lebih besar。
Saiz model dan penskalaan mikro untuk inferens. Laporan awam dan komuniti memberikan kiraan parameter yang agak berbeza (hasil yang lazim bagi keluaran baharu): pengindeks dan cermin pihak ketiga menyenaraikan ~671B parameter (37B aktif) dalam sesetengah penerangan masa jalan, manakala ringkasan komuniti lain melaporkan ~685B sebagai saiz nominal senibina penaakulan hibrid。
Mod inferens & kompromi kejuruteraan. Deepseek V3.1 menyediakan dua mod inferens pragmatik: deepseek-chat (dioptimumkan untuk sembang berasaskan giliran piawai, kependaman lebih rendah) dan deepseek-reasoner (mod “berfikir” yang mengutamakan rantai pemikiran dan penaakulan berstruktur)。
Had & risiko
- Kematangan penanda aras & kebolehulangan: banyak dakwaan prestasi adalah awal, dipacu komuniti, atau selektif。Penilaian bebas dan piawai masih sedang menyusul。(Risiko: tuntutan berlebihan)。
- Keselamatan & halusinasi: seperti semua LLM besar, Deepseek V3.1 tertakluk kepada risiko halusinasi dan kandungan berbahaya; mod penaakulan yang lebih kuat kadangkala boleh menghasilkan keluaran berbilang langkah yang yakin tetapi salah。Pengguna harus menggunakan lapisan keselamatan dan semakan manusia pada keluaran kritikal。(Tiada vendor atau sumber bebas yang mendakwa penghapusan halusinasi。)
- Kos & kependaman inferens: mod penaakulan menukar kependaman dengan keupayaan; untuk inferens pengguna berskala besar ini menambah kos。Sesetengah pengulas menyatakan bahawa reaksi pasaran terhadap model terbuka, murah dan berkelajuan tinggi boleh menjadi tidak menentu。
Kes penggunaan umum & menarik
- Analisis & pemeringkasan dokumen panjang: undang-undang, R\&D, ulasan literatur — manfaatkan tetingkap 128k token untuk ringkasan hujung ke hujung。
- Aliran kerja agen dan orkestrasi alatan: automasi yang memerlukan panggilan alat berbilang langkah (API, carian, kalkulator)。Penalaan agen pasca latihan Deepseek V3.1 bertujuan meningkatkan kebolehpercayaan di sini。
- Penjanaan kod & bantuan perisian: laporan penanda aras awal menekankan prestasi pengaturcaraan yang kukuh; sesuai untuk pengaturcaraan berpasangan, semakan kod, dan tugas penjanaan dengan penyeliaan manusia。
- Pelaksanaan perusahaan di mana pilihan kos/kependaman penting: pilih mod sembang untuk pembantu perbualan yang murah/lebih pantas dan reasoner untuk tugas penaakulan mendalam luar talian atau premium。
- Cara mengakses deepseek-v3.1 API
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com。Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu。Log masuk ke konsol CometAPI anda。Dapatkan kunci API kelayakan akses bagi antara muka。Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar。
Langkah 2: Hantar Permintaan ke API deepseek-v3.1
Pilih titik akhir “deepseek-v3.1” untuk menghantar permintaan API dan tetapkan badan permintaan。Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami。Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda。Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda。URL asas ialah format Chat。
Masukkan soalan atau permintaan anda ke medan content—inilah yang akan dibalas oleh model。Proseskan respons API untuk mendapatkan jawapan yang dijana。
Langkah 3: Dapatkan dan Sahkan Keputusan
Proseskan respons API untuk mendapatkan jawapan yang dijana。Selepas pemprosesan, API membalas dengan status tugasan dan data keluaran。
