Spesifikasi teknis DeepSeek-V4-Flash
| Item | Detail |
|---|---|
| Model | DeepSeek-V4-Flash |
| Provider | DeepSeek |
| Family | seri pratinjau DeepSeek-V4 |
| Architecture | Campuran pakar (MoE) |
| Total parameters | 284B |
| Activated parameters | 13B |
| Context length | 1,000,000 tokens |
| Precision | FP4 + FP8 campuran |
| Reasoning modes | Non-think, Think, Think Max |
| Release status | Model pratinjau |
| License | MIT License |
Apa itu DeepSeek-V4-Flash?
DeepSeek-V4-Flash adalah model pratinjau berfokus pada efisiensi dalam seri V4 milik DeepSeek. Model ini dibangun sebagai model bahasa Mixture-of-Experts dengan jejak aktif yang relatif kecil untuk ukurannya, yang membantu tetap responsif sekaligus mendukung jendela konteks 1M-token yang sangat besar.
Fitur utama DeepSeek-V4-Flash
- Konteks sejuta token: Model ini mendukung jendela konteks 1,000,000 token, sehingga cocok untuk dokumen sangat panjang, kode basis besar, dan sesi agen multi-langkah.
- Desain MoE yang mengutamakan efisiensi: Menggunakan total 284B parameter namun hanya 13B parameter diaktifkan per permintaan, sebuah konfigurasi yang ditujukan untuk inferensi lebih cepat dan efisien.
- Tiga mode penalaran: Non-think, Think, dan Think Max memungkinkan Anda menukar kecepatan dengan penalaran lebih dalam saat tugas menjadi lebih sulit.
- Arsitektur konteks panjang yang kuat: DeepSeek menyatakan seri V4 menggabungkan Compressed Sparse Attention dan Heavily Compressed Attention untuk meningkatkan efisiensi konteks panjang.
- Pengodean kompetitif dan perilaku agen: Kartu model melaporkan hasil kuat pada tolok ukur pengodean dan agen, termasuk HumanEval, SWE Verified, Terminal Bench 2.0, dan BrowseComp.
- Bobot terbuka dan penerapan lokal: Rilis mencakup bobot model, panduan inferensi lokal, dan MIT License, yang membuat hosting mandiri serta eksperimen menjadi praktis.
Performa benchmark DeepSeek-V4-Flash
Hasil terpilih dari kartu model resmi menunjukkan bahwa DeepSeek-V4-Flash meningkat dibanding DeepSeek-V3.2-Base pada beberapa tolok ukur inti:
| Benchmark | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Pada tabel penalaran dan agen, varian Flash juga mencatat hasil solid pada tugas terminal dan perangkat lunak, dengan Flash Max mencapai 56.9 pada Terminal Bench 2.0 dan 79.0 pada SWE Verified, meskipun masih di belakang model Pro yang lebih besar pada tugas paling berat yang sarat pengetahuan dan keagenan.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | Kecocokan terbaik | Kompromi |
|---|---|---|
| DeepSeek-V4-Flash | Pekerjaan cepat dengan konteks panjang, asisten pengodean, dan aliran agen ber-throughput tinggi | Sedikit di belakang Pro pada pengetahuan murni dan tugas agenik paling kompleks |
| DeepSeek-V4-Pro | Tugas berkapabilitas tertinggi, penalaran lebih mendalam, dan alur kerja agen yang lebih sulit | Lebih berat dan kurang berorientasi pada efisiensi dibanding Flash |
| DeepSeek-V3.2 | Baseline lama untuk perbandingan dan perencanaan migrasi | Performa benchmark lebih rendah daripada V4-Flash pada tabel resmi |
Kasus penggunaan khas untuk DeepSeek-V4-Flash
- Analisis dokumen panjang untuk kontrak, paket riset, basis pengetahuan dukungan, dan wiki internal.
- Asisten pengodean yang perlu memeriksa repo besar, mengikuti instruksi lintas banyak file, dan menjaga konteks tetap hidup.
- Alur kerja agen di mana model perlu bernalar, memanggil alat, dan beriterasi tanpa kehilangan benang merah.
- Sistem chat perusahaan yang diuntungkan oleh jendela konteks sangat besar dan penerapan dengan friksi rendah.
- Penerapan lokal prototipe bagi tim yang ingin mengevaluasi perilaku DeepSeek-V4 sebelum pengerasan untuk produksi.
Cara mengakses dan menggunakan Deepseek v4 Flash API
Langkah 1: Daftar untuk API Key
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses API key antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirim.
Langkah 2: Kirim permintaan ke deepseek v4 flash API
Pilih endpoint “deepseek-v4-flash” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan CometAPI key aktual dari akun Anda. Where to call it: format [Anthropic Messages] dan format [Chat].
Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Mengambil dan Memverifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran. Aktifkan fitur seperti streaming, cache prompt, atau penanganan konteks panjang melalui parameter standar.