DeepSeek-V4-Flash'ın teknik özellikleri
| Öğe | Ayrıntılar |
|---|---|
| Model | DeepSeek-V4-Flash |
| Sağlayıcı | DeepSeek |
| Aile | DeepSeek-V4 preview series |
| Mimari | Mixture-of-Experts (MoE) |
| Toplam parametre | 284B |
| Aktif parametreler | 13B |
| Bağlam uzunluğu | 1,000,000 tokens |
| Hassasiyet | FP4 + FP8 karışık |
| Akıl yürütme modları | Non-think, Think, Think Max |
| Yayın durumu | Preview model |
| Lisans | MIT License |
DeepSeek-V4-Flash nedir?
DeepSeek-V4-Flash, DeepSeek’in V4 serisindeki verimlilik odaklı önizleme modelidir. Göreli olarak küçük bir aktif ayak izine sahip bir Uzman Karışımı (MoE) dil modeli olarak tasarlanmıştır; bu, yanıt verebilirliğini korurken çok büyük 1M-token bağlam penceresini de desteklemesine yardımcı olur.
DeepSeek-V4-Flash'in başlıca özellikleri
- Milyon token'lık bağlam: Model, 1,000,000-token bağlam penceresini destekler; bu da çok uzun belgeler, büyük kod tabanları ve çok adımlı ajan oturumları için uygundur.
- Verimlilik-öncelikli MoE tasarımı: 284B toplam parametre kullanır ancak istek başına yalnızca 13B parametre etkinleştirir; bu kurulum daha hızlı ve daha verimli çıkarımı hedefler.
- Üç akıl yürütme modu: Non-think, Think ve Think Max, görev zorlaştıkça hızı daha derin akıl yürütmeyle takas etmenize olanak tanır.
- Güçlü uzun-bağlam mimarisi: DeepSeek, V4 serisinin uzun-bağlam verimliliğini artırmak için Compressed Sparse Attention ve Heavily Compressed Attention’ı birleştirdiğini söylüyor.
- Rekabetçi kodlama ve ajan davranışı: Model kartı, HumanEval, SWE Verified, Terminal Bench 2.0 ve BrowseComp dahil kodlama ve ajans kıyaslarında güçlü sonuçlar bildirmektedir.
- Açık ağırlıklar ve yerel dağıtım: Yayın, model ağırlıklarını, yerel çıkarım kılavuzunu ve MIT License’ı içerir; bu da kendi altyapınızda barındırmayı ve denemeleri pratik hale getirir.
DeepSeek-V4-Flash'in kıyaslama performansı
Resmi model kartından seçilen sonuçlar, DeepSeek-V4-Flash’in birkaç temel kıyaslamada DeepSeek-V3.2-Base’e göre iyileştiğini gösteriyor:
| Kıyaslama | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Akıl yürütme ve ajan tablolarında, Flash varyantı terminal ve yazılım görevlerinde de sağlam sonuçlar sunuyor; Flash Max, Terminal Bench 2.0’da 56.9’a ve SWE Verified’da 79.0’a ulaşıyor, ancak en zorlu bilgi-yoğun ve ajans görevlerinde daha büyük Pro modelinin gerisinde kalıyor.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Model | En uygun | Ödün |
|---|---|---|
| DeepSeek-V4-Flash | Hızlı, uzun-bağlam işleri, kodlama asistanları ve yüksek hacimli ajan akışları | Salt bilgi ve en karmaşık ajans görevlerinde Pro’nun biraz gerisinde |
| DeepSeek-V4-Pro | En yüksek yetenek gerektiren görevler, daha derin akıl yürütme ve daha zor ajan iş akışları | Flash’a kıyasla daha ağır ve verimlilik odaklı değil |
| DeepSeek-V3.2 | Karşılaştırma ve geçiş planlaması için daha eski temel | Resmi tablolarda V4-Flash’tan daha düşük kıyas performansı |
DeepSeek-V4-Flash için tipik kullanım senaryoları
- Sözleşmeler, araştırma paketleri, destek bilgi tabanları ve dahili vikiler için uzun-belge analizi.
- Büyük depoları incelemesi, birçok dosya boyunca talimatları takip etmesi ve bağlamı canlı tutması gereken kodlama asistanları.
- Modelin akıl yürütmesi, araç çağırması ve konuyu kaybetmeden yinelemesi gereken ajan iş akışları.
- Çok büyük bağlam penceresi ve düşük sürtünmeli dağıtımdan yararlanan kurumsal sohbet sistemleri.
- Üretim sertleştirmesinden önce DeepSeek-V4 davranışını değerlendirmek isteyen ekipler için prototip yerel dağıtımlar.
Deepseek v4 Flash API’ye nasıl erişilir ve nasıl kullanılır
Adım 1: API anahtarı için kaydolun
cometapi.com adresinde oturum açın. Henüz kullanıcımız değilseniz, lütfen önce kayıt olun. CometAPI konsolu hesabınıza giriş yapın. Arayüzün erişim kimlik bilgisi API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
Adım 2: deepseek v4 flash API’ye istek gönderin
API isteği göndermek için “deepseek-v4-flash” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından elde edilir. Kolaylık için sitemiz Apifox testi de sağlar. Hesabınızdaki gerçek CometAPI anahtarınızla <YOUR_API_KEY> değerini değiştirin. Nereden çağırılır: Anthropic Messages biçimi ve Chat biçimi.
Sorunuzu veya isteğinizi content alanına ekleyin—modelin yanıtlayacağı kısım burasıdır. Üretilen yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları alın ve doğrulayın
Üretilen yanıtı almak için API yanıtını işleyin. İşlemden sonra, API görev durumunu ve çıktı verilerini döndürür. Akış, komut önbellekleme veya uzun-bağlam işleme gibi özellikleri standart parametrelerle etkinleştirin.