Spesifikasi teknikal DeepSeek-V4-Flash
| Item | Perincian |
|---|---|
| Model | DeepSeek-V4-Flash |
| Provider | DeepSeek |
| Family | Siri pratonton DeepSeek-V4 |
| Architecture | Mixture-of-Experts (MoE) |
| Total parameters | 284B |
| Activated parameters | 13B |
| Context length | 1,000,000 token |
| Precision | FP4 + FP8 bercampur |
| Reasoning modes | Non-think, Think, Think Max |
| Release status | Model pratonton |
| License | Lesen MIT |
Apakah DeepSeek-V4-Flash?
DeepSeek-V4-Flash ialah model pratonton berfokus kecekapan dalam siri V4 oleh DeepSeek. Ia dibina sebagai model bahasa Mixture-of-Experts dengan jejak aktif yang agak kecil untuk saiznya, yang membantu kekal responsif sambil masih menyokong tetingkap konteks 1M token yang sangat besar.
Ciri utama DeepSeek-V4-Flash
- Konteks sejuta token: Model menyokong tetingkap konteks 1,000,000 token, menjadikannya sesuai untuk dokumen yang sangat panjang, kod asas yang besar, dan sesi agen berbilang langkah.
- Reka bentuk MoE berkecekapan diutamakan: Ia menggunakan 284B jumlah parameter tetapi hanya 13B parameter diaktifkan bagi setiap permintaan, susunan yang disasarkan kepada inferens yang lebih pantas dan cekap.
- Tiga mod penaakulan: Non-think, Think, dan Think Max membolehkan anda menukar kelajuan untuk penaakulan yang lebih mendalam apabila tugas menjadi lebih sukar.
- Seni bina konteks panjang yang kukuh: DeepSeek menyatakan siri V4 menggabungkan Compressed Sparse Attention dan Heavily Compressed Attention untuk meningkatkan kecekapan konteks panjang.
- Pengkodan dan tingkah laku agen yang kompetitif: Kad model melaporkan keputusan yang kukuh pada penanda aras pengkodan dan agenik, termasuk HumanEval, SWE Verified, Terminal Bench 2.0, dan BrowseComp.
- Bobot model terbuka dan penempatan setempat: Pelepasan termasuk berat model, panduan inferens setempat, dan Lesen MIT, menjadikan pengehosan sendiri dan eksperimen praktikal.
Prestasi penanda aras DeepSeek-V4-Flash
Keputusan terpilih daripada kad model rasmi menunjukkan bahawa DeepSeek-V4-Flash bertambah baik berbanding DeepSeek-V3.2-Base pada beberapa penanda aras teras:
| Benchmark | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Dalam jadual penaakulan-dan-agen, varian Flash turut mencatat keputusan kukuh pada tugas terminal dan perisian, dengan Flash Max mencapai 56.9 pada Terminal Bench 2.0 dan 79.0 pada SWE Verified, sambil masih ketinggalan di belakang model Pro yang lebih besar pada tugas paling berat berorientasikan pengetahuan dan agenik.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | Kesesuaian terbaik | Kompromi |
|---|---|---|
| DeepSeek-V4-Flash | Kerja pantas ber-konteks panjang, pembantu pengekodan, dan aliran agen berthroughput tinggi | Sedikit ketinggalan berbanding Pro pada pengetahuan tulen dan tugas agenik paling kompleks |
| DeepSeek-V4-Pro | Tugas berkeupayaan tertinggi, penaakulan lebih mendalam, dan aliran kerja agen yang lebih sukar | Lebih berat dan kurang berorientasikan kecekapan berbanding Flash |
| DeepSeek-V3.2 | Teras lama untuk perbandingan dan perancangan migrasi | Prestasi penanda aras lebih rendah daripada V4-Flash pada jadual rasmi |
Kes penggunaan lazim untuk DeepSeek-V4-Flash
- Analisis dokumen panjang untuk kontrak, pakej penyelidikan, pangkalan pengetahuan sokongan, dan wiki dalaman.
- Pembantu pengekodan yang perlu memeriksa repositori besar, mengikut arahan merentasi banyak fail, dan mengekalkan konteks.
- Aliran kerja agen di mana model perlu membuat penaakulan, memanggil alat, dan mengulang tanpa kehilangan konteks.
- Sistem sembang perusahaan yang mendapat manfaat daripada tetingkap konteks yang sangat besar dan penempatan berhalangan rendah.
- Penempatan setempat prototaip untuk pasukan yang mahu menilai tingkah laku DeepSeek-V4 sebelum pembajaan produksi.
Cara mengakses dan menggunakan Deepseek v4 Flash API
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke CometAPI console. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke deepseek v4 flash API
Pilih endpoint “deepseek-v4-flash” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan CometAPI key sebenar daripada akaun anda. Tempat untuk memanggilnya: format Anthropic Messages dan format Chat.
Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API membalas dengan status tugas dan data output. Dayakan ciri seperti penstriman, cache gesaan, atau pengendalian konteks panjang melalui parameter standard.