Spesifikasi teknis DeepSeek-V4-Flash
| Item | Detail |
|---|---|
| Model | DeepSeek-V4-Flash |
| Provider | DeepSeek |
| Family | Seri pratinjau DeepSeek-V4 |
| Architecture | Mixture-of-Experts (MoE) |
| Total parameters | 284B |
| Activated parameters | 13B |
| Context length | 1,000,000 tokens |
| Precision | FP4 + FP8 campuran |
| Reasoning modes | Non-think, Think, Think Max |
| Release status | Model pratinjau |
| License | MIT License |
Apa itu DeepSeek-V4-Flash?
DeepSeek-V4-Flash adalah model pratinjau berfokus efisiensi dari DeepSeek dalam seri V4. Model ini dibangun sebagai model bahasa Mixture-of-Experts dengan jejak aktif yang relatif kecil untuk ukurannya, yang membantu tetap responsif sekaligus mendukung jendela konteks 1M-token yang sangat besar.
Fitur utama DeepSeek-V4-Flash
- Konteks sejuta token: Model ini mendukung jendela konteks 1,000,000 token, sehingga cocok untuk dokumen yang sangat panjang, basis kode besar, dan sesi agen multi-langkah.
- Desain MoE berorientasi efisiensi: Model ini menggunakan total 284B parameter namun hanya 13B parameter yang diaktifkan per permintaan, sebuah pengaturan yang ditujukan untuk inferensi yang lebih cepat dan efisien.
- Tiga mode penalaran: Non-think, Think, dan Think Max memungkinkan Anda menukar kecepatan dengan penalaran yang lebih mendalam ketika tugas semakin sulit.
- Arsitektur konteks panjang yang kuat: DeepSeek menyatakan bahwa seri V4 menggabungkan Compressed Sparse Attention dan Heavily Compressed Attention untuk meningkatkan efisiensi pada konteks panjang.
- Kemampuan pemrograman dan perilaku agen yang kompetitif: Kartu model melaporkan hasil yang kuat pada tolok ukur pemrograman dan agen, termasuk HumanEval, SWE Verified, Terminal Bench 2.0, dan BrowseComp.
- Bobot terbuka dan penerapan lokal: Rilis ini mencakup bobot model, panduan inferensi lokal, dan MIT License, yang membuat hosting mandiri dan eksperimen menjadi praktis.
Kinerja tolok ukur DeepSeek-V4-Flash
Hasil terpilih dari kartu model resmi menunjukkan bahwa DeepSeek-V4-Flash meningkat dibanding DeepSeek-V3.2-Base pada beberapa tolok ukur inti:
| Benchmark | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Dalam tabel penalaran-dan-agen, varian Flash juga membukukan hasil yang solid pada tugas terminal dan perangkat lunak, dengan Flash Max mencapai 56.9 pada Terminal Bench 2.0 dan 79.0 pada SWE Verified, meski masih berada di belakang model Pro yang lebih besar pada tugas paling berat yang berfokus pada pengetahuan dan keagenan.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | Penggunaan paling cocok | Kompromi |
|---|---|---|
| DeepSeek-V4-Flash | Pekerjaan cepat dan konteks panjang, asisten pemrograman, dan alur agen dengan throughput tinggi | Sedikit di belakang Pro pada pengetahuan murni dan tugas keagenan paling kompleks |
| DeepSeek-V4-Pro | Tugas dengan kapabilitas tertinggi, penalaran lebih mendalam, dan alur kerja agen yang lebih sulit | Lebih berat dan kurang berorientasi efisiensi dibanding Flash |
| DeepSeek-V3.2 | Baseline lama untuk perbandingan dan perencanaan migrasi | Kinerja tolok ukur lebih rendah daripada V4-Flash pada tabel resmi |
Kasus penggunaan khas untuk DeepSeek-V4-Flash
- Analisis dokumen panjang untuk kontrak, paket riset, basis pengetahuan dukungan, dan wiki internal.
- Asisten pemrograman yang perlu memeriksa repo besar, mengikuti instruksi di banyak file, dan menjaga konteks tetap hidup.
- Alur kerja agen di mana model perlu bernalar, memanggil alat, dan melakukan iterasi tanpa kehilangan benang merah.
- Sistem chat enterprise yang mendapat manfaat dari jendela konteks sangat besar dan penerapan yang minim hambatan.
- Penerapan lokal prototipe bagi tim yang ingin mengevaluasi perilaku DeepSeek-V4 sebelum penguatan untuk produksi.
Cara mengakses dan menggunakan Deepseek v4 Flash API
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke Konsol CometAPI. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim permintaan ke deepseek v4 flash API
Pilih endpoint “deepseek-v4-flash” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Di mana memanggilnya: format Anthropic Messages dan format Chat.
Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran. Aktifkan fitur seperti streaming, prompt caching, atau penanganan konteks panjang melalui parameter standar.