DeepSeek-V4-Flash'ın teknik özellikleri
| Öğe | Ayrıntılar |
|---|---|
| Model | DeepSeek-V4-Flash |
| Sağlayıcı | DeepSeek |
| Aile | DeepSeek-V4 preview series |
| Mimari | Uzman Karışımı (MoE) |
| Toplam parametre | 284B |
| Aktif parametreler | 13B |
| Bağlam uzunluğu | 1,000,000 tokens |
| Hassasiyet | FP4 + FP8 mixed |
| Akıl yürütme modları | Non-think, Think, Think Max |
| Yayın durumu | Preview model |
| Lisans | MIT License |
DeepSeek-V4-Flash nedir?
DeepSeek-V4-Flash, DeepSeek’in V4 serisindeki verimliliğe odaklı önizleme modelidir. Boyutuna göre görece küçük bir aktif ayak izine sahip bir Uzman Karışımı dil modeli olarak inşa edilmiştir; bu, çok büyük 1M-token bağlam penceresini desteklerken yanıt verebilirliğini korumasına yardımcı olur.
DeepSeek-V4-Flash'ın başlıca özellikleri
- Milyon-token bağlam: Model 1,000,000-token bağlam penceresini destekler; bu da onu çok uzun belgeler, büyük kod depoları ve çok adımlı aracı oturumları için uygun kılar.
- Verimlilik öncelikli MoE tasarımı: Toplam 284B parametre kullanır, ancak istek başına yalnızca 13B aktif parametre; bu kurulum daha hızlı ve verimli çıkarım amaçlar.
- Üç akıl yürütme modu: Non-think, Think ve Think Max, görev zorlaştığında hız ile daha derin akıl yürütme arasında tercih yapmanıza olanak tanır.
- Güçlü uzun-bağlam mimarisi: DeepSeek, V4 serisinin uzun bağlam verimliliğini artırmak için Compressed Sparse Attention ile Heavily Compressed Attention'ı birleştirdiğini söylüyor.
- Rekabetçi kodlama ve aracı davranışı: Model kartı, HumanEval, SWE Verified, Terminal Bench 2.0 ve BrowseComp dahil olmak üzere kodlama ve aracı kıyaslarında güçlü sonuçlar bildiriyor.
- Açık ağırlıklar ve yerel dağıtım: Sürüm, model ağırlıkları, yerel çıkarım kılavuzu ve MIT Lisansı içerir; bu da kendi barındırmayı ve denemeleri pratik kılar.
DeepSeek-V4-Flash'ın kıyaslama performansı
Resmi model kartından seçilen sonuçlar, DeepSeek-V4-Flash'ın birkaç çekirdek kıyaslamada DeepSeek-V3.2-Base'e göre iyileştiğini gösteriyor:
| Kıyaslama | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Akıl yürütme ve aracı tablosunda, Flash varyantı terminal ve yazılım görevlerinde de sağlam sonuçlar elde ediyor; Flash Max, Terminal Bench 2.0'da 56.9'a ve SWE Verified'da 79.0'a ulaşıyor, ancak en zor bilgi-yoğun ve aracısal görevlerde hâlâ daha büyük Pro modelinin gerisinde kalıyor.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | En uygun kullanım | Ödün |
|---|---|---|
| DeepSeek-V4-Flash | Hızlı, uzun-bağlam işleri, kodlama asistanları ve yüksek verimli aracı akışları | Saf bilgi ve en karmaşık aracısal görevlerde Pro'nun biraz gerisinde |
| DeepSeek-V4-Pro | En yüksek yetenek gerektiren görevler, daha derin akıl yürütme ve daha zor aracı iş akışları | Flash'e göre daha ağır ve verimliliğe daha az odaklı |
| DeepSeek-V3.2 | Karşılaştırma ve geçiş planlaması için daha eski temel | Resmi tablolarda V4-Flash'tan daha düşük kıyaslama performansı |
DeepSeek-V4-Flash için tipik kullanım senaryoları
- Sözleşmeler, araştırma paketleri, destek bilgi tabanları ve dahili wikiler için uzun belge analizi.
- Büyük depoları incelemesi, birçok dosyada talimatları takip etmesi ve bağlamı canlı tutması gereken kodlama asistanları.
- Modelin akıl yürütmesi, araçları çağırması ve konuyu kaybetmeden yinelemesi gereken aracı iş akışları.
- Çok büyük bir bağlam penceresi ve düşük sürtünmeli dağıtımdan faydalanan kurumsal sohbet sistemleri.
- Üretim sertleştirmesinden önce DeepSeek-V4 davranışını değerlendirmek isteyen ekipler için prototip yerel dağıtımlar.
Deepseek v4 Flash API'ye nasıl erişilir ve kullanılır
Adım 1: API anahtarı için kaydolun
cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI console hesabınıza giriş yapın. Arayüzün erişim kimliği olan API anahtarını edinin. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
Adım 2: deepseek v4 flash API'ye istek gönderin
API isteği göndermek için “deepseek-v4-flash” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Kolaylığınız için sitemiz Apifox testi de sunar. <YOUR_API_KEY> ifadesini hesabınızdaki gerçek CometAPI anahtarıyla değiştirin. Nereden çağırılır: Anthropic Messages formatı ve Chat formatı.
Sorunuzu veya isteğinizi content alanına ekleyin—modelin yanıtlayacağı kısım burasıdır. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları alın ve doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemden sonra API, görev durumunu ve çıktı verilerini döndürür. Akış, istem önbellekleme veya uzun bağlam işleme gibi özellikleri standart parametrelerle etkinleştirin.