Teknik özellikler
| Öğe | DeepSeek-V4-Pro |
|---|---|
| Sağlayıcı | DeepSeek |
| API model adı | deepseek-v4-pro |
| Temel URL'ler | https://api.deepseek.com ve https://api.deepseek.com/anthropic |
| Girdi türü | Metin |
| Çıktı türü | Metin, araç çağrıları, akıl yürütme çıktısı |
| Bağlam uzunluğu | 1,000,000 token |
| Maksimum çıktı | 384,000 token |
| Akıl yürütme modları | Düşünmesiz, düşünme (varsayılan) |
| Aracı/kodlama varsayılanları | reasoning_effort yüksek olarak ayarlanabilir; karmaşık aracı istekleri max kullanabilir |
| Desteklenen özellikler | JSON Çıktısı, Araç Çağrıları, Sohbet Önek Tamamlama (beta), FIM Tamamlama (düşünmesiz modda beta) |
| Yerel/açık ağırlıklar sürümü | 1.6T toplam parametre, 49B etkin parametre, FP4 + FP8 karma hassasiyet |
| Lisans (model kartı) | MIT |
| Başvuru model kartı | Hugging Face üzerinde DeepSeek-V4-Pro önizlemesi |
DeepSeek-V4-Pro nedir?
DeepSeek-V4-Pro, DeepSeek’in V4 önizleme ailesinin daha güçlü üyesidir. Resmi model kartı, 49B etkin parametreli ve bir milyon token’lık bağlam penceresine sahip 1.6T parametreli bir MoE model olduğunu ve uzun vadeli bilgi işleri, kod üretimi ve aracı görevleri hedeflediğini belirtir. API belgeleri, modeli standart DeepSeek chat-completions yüzeyi üzerinden sunar ve hem OpenAI hem de Anthropic SDK tarzlarını destekler.
Başlıca özellikler
- Milyon belirteçlik bağlam: DeepSeek, modeli çok büyük belge kümeleri, depolar ve çok adımlı aracı oturumları için uygun kılan 1M token’lık bağlam uzunluğunu belgeliyor.
- İki akıl yürütme modu: API, düşünmesiz ve düşünme modlarını destekler; varsayılan düşünme modudur ve belgelerde, Claude Code veya OpenCode gibi karmaşık aracı isteklerinin otomatik olarak
maxçabasını kullanabileceği belirtilir. - Araç çağrısı yeteneği: DeepSeek’in düşünme modu, arama, dosya işlemleri veya harici işlevlere ihtiyaç duyan ajanlar için önemli olan araç çağrılarını destekler.
- Uzun bağlam verimliliği: Model kartına göre V4, V3.2’ye kıyasla uzun bağlam hesaplama ve KV önbellek maliyetini azaltmak için Compressed Sparse Attention ve Heavily Compressed Attention ile hibrit bir dikkat tasarımı kullanır. citeturn980363view2
- Kodlama ve akıl yürütme odağı: DeepSeek, V4-Pro-Max düşünme modunun kodlama kıyaslarında ilerlediğini ve akıl yürütme ile ajans görevlerinde önde gelen kapalı kaynak modellere olan farkın büyük bölümünü kapattığını belirtiyor. citeturn980363view2
- SDK esnekliği: Standart OpenAI uyumlu sohbet tamamlamaları üzerinden veya araç odaklı iş akışları için DeepSeek’in Anthropic uyumlu uç noktası aracılığıyla erişilebilir.
Karşılaştırma performansı
Resmi DeepSeek model kartı, temel model ailesi ve V4-Pro-Max karşılaştırma seti için aşağıdaki değerlendirme sonuçlarını rapor eder. Temel model tablosunda, V4-Pro, MMLU-Pro (73.5 vs. 65.5), FACTS Parametric (62.6 vs. 27.1) ve LongBench-V2 (51.5 vs. 40.2) dahil olmak üzere çeşitli bilgi ve uzun bağlam kıyaslarında V3.2-Base’ten daha yüksek puan alır.
| Benchmark | V3.2-Base | V4-Flash-Base | V4-Pro-Base |
|---|---|---|---|
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| FACTS Parametric (EM) | 27.1 | 33.9 | 62.6 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Aynı model kartı, seçili görevlerde V4-Pro-Max’in, önde gelen sınır modellerle rekabetçi kaldığını da gösterir. Örneğin, yayınlanan karşılaştırma tablosunda MMLU-Pro’da 87.5, SimpleQA-Verified’da 57.9, GPQA Diamond’da 90.1 ve Terminal Bench 2.0’da 67.9 puan alır.
DeepSeek-V4-Pro vs DeepSeek-V4-Flash vs DeepSeek-V3.2
| Model | En uygun kullanım | Bağlam | Notlar |
|---|---|---|---|
| DeepSeek-V4-Pro | Yoğun akıl yürütme, kodlama, ajanlar, büyük belgeler | 1M | En büyük V4 modelidir, 49B etkin parametre, serideki en güçlü genel kapasite. citeturn980363view2turn980363view0 |
| DeepSeek-V4-Flash | Daha hızlı, daha hafif genel kullanım | 1M | Daha küçük 284B/13B model; yine de düşünme ve araç çağrılarını destekler. citeturn980363view2turn980363view0 |
| DeepSeek-V3.2 | Önceki nesil uzun bağlam taban çizgisi | 128K in earlier API docs; V4 uses a different 1M context design | Verimlilik kazanımları için referans noktası olarak faydalıdır; V4-Pro’nun model kartı, V3.2’ye kıyasla uzun bağlam FLOP’larında ve KV önbelleğinde büyük azaltımlar rapor eder. citeturn321011view1turn980363view2 |
En iyi kullanım senaryoları
- Depo ölçeğinde kodlama asistanları ve refaktoring araçları
- Uzun belgelerin analizi ve sentezi
- Çok turlu akıl yürütmeye ihtiyaç duyan, araç kullanan ajanlar
- Uzun bellek ve yapılandırılmış çıktılardan fayda sağlayan teknik destek iş akışları
- Model kartının güçlü benchmark performansı gösterdiği Çince ve çok dilli bilgi görevleri
Deepseek v4 pro API'ye nasıl erişilir ve nasıl kullanılır
Adım 1: API anahtarı için kaydolun
cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz, lütfen önce kayıt olun. CometAPI console hesabınıza giriş yapın. Arayüzün erişim kimliği API anahtarını alın. Kişisel merkezdeki API token bölümünde “Add Token”ı tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
Adım 2: Deepseek v4 pro API'ye istek gönderin
“deepseek-v4-pro” uç noktasını seçerek API isteğini gönderin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi sunar. Hesabınızdaki gerçek CometAPI anahtarınızla <YOUR_API_KEY> değerini değiştirin. Nereden çağırılır: Anthropic Messages formatı ve Chat formatı.
Sorunuzu veya isteğinizi content alanına ekleyin — modelin yanıtlayacağı kısım budur. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları alın ve doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşleme sonrasında, API görev durumunu ve çıktı verilerini döndürür. Akış, istem önbellekleme veya uzun bağlam işleme gibi özellikleri standart parametreler aracılığıyla etkinleştirin.