Spesifikasi teknikal DeepSeek-V4-Flash
| Item | Butiran |
|---|---|
| Model | DeepSeek-V4-Flash |
| Provider | DeepSeek |
| Family | Siri pratonton DeepSeek-V4 |
| Architecture | Mixture-of-Experts (MoE) |
| Total parameters | 284B |
| Activated parameters | 13B |
| Context length | 1,000,000 tokens |
| Precision | FP4 + FP8 mixed |
| Reasoning modes | Non-think, Think, Think Max |
| Release status | Model pratonton |
| License | MIT License |
Apakah DeepSeek-V4-Flash?
DeepSeek-V4-Flash ialah model pratonton berfokuskan kecekapan dalam siri V4 oleh DeepSeek. Ia dibina sebagai model bahasa Mixture-of-Experts dengan jejak aktif yang agak kecil untuk saiznya, yang membantu ia kekal responsif sambil masih menyokong tetingkap konteks 1M token yang sangat besar.
Ciri utama DeepSeek-V4-Flash
- Konteks sejuta token: Model ini menyokong tetingkap konteks 1,000,000 token, sesuai untuk dokumen yang sangat panjang, pangkalan kod besar, dan sesi agen berbilang langkah.
- Reka bentuk MoE mengutamakan kecekapan: Ia menggunakan 284B jumlah parameter tetapi hanya 13B parameter diaktifkan bagi setiap permintaan, satu tetapan yang disasarkan kepada inferens yang lebih pantas dan cekap.
- Tiga mod penaakulan: Non-think, Think, dan Think Max membolehkan anda menukar kelajuan untuk penaakulan lebih mendalam apabila tugasan menjadi lebih sukar.
- Seni bina konteks panjang yang kukuh: DeepSeek menyatakan siri V4 menggabungkan Compressed Sparse Attention dan Heavily Compressed Attention untuk meningkatkan kecekapan konteks panjang.
- Pengkodan dan tingkah laku agen yang kompetitif: Kad model melaporkan keputusan kukuh pada penanda aras pengkodan dan agentic, termasuk HumanEval, SWE Verified, Terminal Bench 2.0, dan BrowseComp.
- Berat model terbuka dan penyebaran setempat: Keluaran ini merangkumi pemberat model, panduan inferens setempat, dan MIT License, yang menjadikan hos kendiri dan eksperimen lebih praktikal.
Prestasi penanda aras DeepSeek-V4-Flash
Keputusan terpilih daripada kad model rasmi menunjukkan bahawa DeepSeek-V4-Flash bertambah baik berbanding DeepSeek-V3.2-Base pada beberapa penanda aras teras:
| Penanda aras | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Dalam jadual penaakulan dan agen, varian Flash juga mencatat keputusan kukuh pada tugasan terminal dan perisian, dengan Flash Max mencapai 56.9 pada Terminal Bench 2.0 dan 79.0 pada SWE Verified, sambil masih ketinggalan di belakang model Pro yang lebih besar pada tugasan paling sukar yang berat pengetahuan dan berasaskan agen.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | Kesesuaian terbaik | Kompromi |
|---|---|---|
| DeepSeek-V4-Flash | Kerja pantas berkonteks panjang, pembantu pengkodan, dan aliran agen berkapasiti tinggi | Sedikit di belakang Pro dalam pengetahuan tulen dan tugas agen yang paling kompleks |
| DeepSeek-V4-Pro | Tugasan berkeupayaan tertinggi, penaakulan lebih mendalam, dan aliran kerja agen yang lebih sukar | Lebih berat dan kurang berorientasikan kecekapan berbanding Flash |
| DeepSeek-V3.2 | Garis asas lebih lama untuk perbandingan dan perancangan migrasi | Prestasi penanda aras lebih rendah daripada V4-Flash pada jadual rasmi |
Kes penggunaan tipikal untuk DeepSeek-V4-Flash
- Analisis dokumen panjang untuk kontrak, pek penyelidikan, pangkalan pengetahuan sokongan, dan wiki dalaman.
- Pembantu pengkodan yang perlu memeriksa repositori besar, mengikuti arahan merentas banyak fail, dan mengekalkan konteks.
- Aliran kerja agen di mana model perlu menaakul, memanggil alat, dan mengulangi tanpa kehilangan jejak.
- Sistem sembang perusahaan yang memanfaatkan tetingkap konteks yang sangat besar dan penyebaran yang mudah.
- Prototip penyebaran setempat untuk pasukan yang ingin menilai tingkah laku DeepSeek-V4 sebelum pengukuhan produksi.
Cara mengakses dan menggunakan Deepseek v4 Flash API
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Daftar masuk ke CometAPI console. Dapatkan kunci API kelayakan akses bagi antara muka tersebut. Klik “Add Token” pada API token di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke deepseek v4 flash API
Pilih endpoint “deepseek-v4-flash” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Tempat untuk memanggilnya: format Anthropic Messages dan format Chat.
Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output. Dayakan ciri seperti penstriman, cache prompt, atau pengendalian konteks panjang melalui parameter standard.