Техникалық сипаттамалар
| Элемент | DeepSeek-V4-Pro |
|---|---|
| Провайдер | DeepSeek |
| API модель атауы | deepseek-v4-pro |
| Негізгі URL-дер | https://api.deepseek.com және https://api.deepseek.com/anthropic |
| Енгізу түрі | Text |
| Шығыс түрі | Text, құрал шақырулары, ойлау нәтижесі |
| Контекст ұзындығы | 1,000,000 tokens |
| Ең жоғары шығыс | 384,000 tokens |
| Ойлау режимдері | Non-thinking, thinking (әдепкі) |
| Агент/кодтау әдепкілері | reasoning_effort жоғарыға орнатылуы мүмкін; күрделі агент сұраулары max пайдалануы ықтимал |
| Қолдайтын мүмкіндіктер | JSON шығысы, құрал шақырулары, Chat Prefix Completion (бета), FIM Completion (бета, non-thinking режимінде) |
| Жергілікті/ашық салмақ релизі | 1.6T жалпы параметрлер, 49B іске қосылған параметрлер, FP4 + FP8 аралас дәлдік |
| Лицензия (модель картасы) | MIT |
| Анықтамалық модель картасы | DeepSeek-V4-Pro preview on Hugging Face |
DeepSeek-V4-Pro деген не?
DeepSeek-V4-Pro — DeepSeek компаниясының V4 алдын ала қарау сериясындағы қуаты жоғары мүшесі. Ресми модель картасында ол 1.6T параметрлі, 49B белсендірілген параметрі бар және миллион токендік контекст терезесі бар MoE моделі ретінде сипатталады; ұзақ көкжиекті білім жұмысы, код генерациясы және агент тапсырмаларына бағытталған. API құжаттары оны стандартты DeepSeek chat-completions интерфейсі арқылы ұсынады және OpenAI мен Anthropic SDK стилдерін қолдайды.
Негізгі мүмкіндіктер
- Million-token контекст: DeepSeek 1M-token контекст ұзындығын құжаттайды; бұл модельді өте үлкен құжат жиындарына, репозиторийлерге және көпқадамды агент сессияларына жарамды етеді.
- Екі ойлау режимі: API non-thinking және thinking режимдерін қолдайды; thinking — әдепкі. Құжаттар Claude Code немесе OpenCode сияқты күрделі агент сұраулары автоматты түрде
maxкүшіне өтуі мүмкін екенін атап өтеді. - Құрал шақыруларын қолдау: DeepSeek-тің thinking режимі құрал шақыруларын қолдайды; бұл іздеу, файл операциялары немесе сыртқы функциялар қажет агенттер үшін маңызды.
- Ұзын контекст тиімділігі: Модель картасы V4 нұсқасының Compressed Sparse Attention және Heavily Compressed Attention бар гибридті назар архитектурасын қолданатынын, бұл ұзын контекстте есептеулер мен KV кэш құнын V3.2-мен салыстырғанда азайтатынын айтады. citeturn980363view2
- Кодтау және ойлау фокусы: DeepSeek V4-Pro-Max ойлау режімі кодтау бенчмарктарында ілгерілеуді көрсетіп, ойлау және агенттік тапсырмаларда жетекші жабық модельдермен арақашықтықты едәуір қысқартатынын айтады. citeturn980363view2
- SDK икемділігі: Оған стандартты OpenAI-үйлесімді chat completions арқылы немесе құралға бағытталған жұмыс үрдістері үшін DeepSeek-тің Anthropic-үйлесімді эндпоинті арқылы қол жеткізуге болады.
Бенчмарк көрсеткіштері
Ресми DeepSeek модель картасы базалық модельдер отбасы және V4-Pro-Max салыстыру жиыны үшін келесі бағалау нәтижелерін береді. Базалық модельдер кестесінде V4-Pro, V3.2-Base моделінен бірнеше білім және ұзын контекст бенчмарктарында жоғары нәтиже көрсетеді, соның ішінде MMLU-Pro (73.5 vs. 65.5), FACTS Parametric (62.6 vs. 27.1) және LongBench-V2 (51.5 vs. 40.2).
| Бенчмарк | V3.2-Base | V4-Flash-Base | V4-Pro-Base |
|---|---|---|---|
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| FACTS Parametric (EM) | 27.1 | 33.9 | 62.6 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
Сол модель картасы V4-Pro-Max-тың таңдаулы тапсырмаларда алдыңғы қатарлы модельдермен бәсекеге қабілетті болып қалғанын көрсетеді. Мысалы, ол MMLU-Pro бойынша 87.5, SimpleQA-Verified бойынша 57.9, GPQA Diamond бойынша 90.1 және Terminal Bench 2.0 бойынша 67.9 көрсеткіштерін жарияланған салыстыру кестесінде көрсетеді.
DeepSeek-V4-Pro vs DeepSeek-V4-Flash vs DeepSeek-V3.2
| Модель | Ең қолайлы | Контекст | Ескертпелер |
|---|---|---|---|
| DeepSeek-V4-Pro | Күрделі ойлау, кодтау, агенттер, үлкен құжаттар | 1M | Ең үлкен V4 модель, 49B белсендірілген параметрлер, сериядағы ең жоғары жалпы қабілет. citeturn980363view2turn980363view0 |
| DeepSeek-V4-Flash | Жылдамырақ, жеңілірек жалпы қолдану | 1M | Кіші 284B/13B модель, thinking және құрал шақыруларын қолдайды. citeturn980363view2turn980363view0 |
| DeepSeek-V3.2 | Алдыңғы буын ұзын контекст базасы | 128K (ертеректегі API құжаттарында); V4 1M контекст үшін басқа дизайн қолданады | Тиімділік өсімін салыстыру үшін пайдалы эталон; V4-Pro-ның модель картасы V3.2-мен салыстырғанда ұзын контекст FLOPs және KV cache бойынша үлкен қысқартуларды хабарлайды. citeturn321011view1turn980363view2 |
Ең жақсы қолдану сценарийлері
- Репозиторий ауқымындағы код көмекшілері және рефакторинг құралдары
- Ұзын құжаттарды талдау және синтез
- Көпқадамды ойлау қажет құрал қолданатын агенттер
- Ұзақ жад пен құрылымдалған шығыстар пайдалы болатын техникалық қолдау жұмыс арналары
- Қытай және көптілді білім тапсырмалары, онда модель картасы жоғары бенчмарк өнімділігін көрсетеді
Deepseek v4 pro API-ға қалай қол жеткізіп, пайдалану керек
1-қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз. CometAPI консоліне кіріңіз. Интерфейс үшін қол жеткізуге арналған API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” түймесін басып, sk-xxxxx түріндегі токен кілтін алып, жіберіңіз.
2-қадам: Deepseek v4 proAPI-ге сұраулар жіберу
API сұрауын жіберу үшін “deepseek-v4-pro” эндпоинтін таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің веб-сайттағы API құжаттарынан алынады. Қолайлылық үшін веб-сайтымызда Apifox сынағы да бар. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз. Қайда шақыруға болады: Anthropic Messages форматы және Chat форматы.
Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель осыған жауап береді. API жауаптарын өңдеп, жасалған жауапты алыңыз.
3-қадам: Нәтижелерді алу және тексеру
API жауаптарын өңдеп, жасалған жауапты алыңыз. Өңдеуден кейін API тапсырма күйі мен шығыс деректерін қайтарады. Стандартты параметрлер арқылы ағындық беру, prompt кэштеу немесе ұзын контекстті өңдеу сияқты мүмкіндіктерді қосыңыз.