DeepSeek-V3.2

DeepSeek
deepseek-v3.2
Енгізу:$0.22/M
Шығыс:$0.35/M
Контекст:128K
Максималды шығыс:4K
DeepSeek v3.2 — DeepSeek V3 отбасы құрамындағы ең жаңа өндірістік шығарылым: ұзын контексті түсінуге, агенттер мен құралдарды сенімді пайдалануға, озық пайымдауға, кодтауға және математикаға арналған, пайымдауды бірінші орынға қоятын ашық салмақты үлкен тілдік модельдер отбасы.

DeepSeek v3.2 деген не?

DeepSeek v3.2 — DeepSeek V3 отбасындағы ең соңғы өндірістік шығарылым: ұзын контексті түсіну, берік агент/құрал қолдану, озық пайымдау, кодтау және математика үшін әзірленген, пайымдауды алға қоятын үлкен ашық салмақты тілдік модельдер отбасы. Шығарылым бірнеше нұсқамен бірге келеді (өндірістік V3.2 және жоғары өнімді V3.2-Speciale). Жоба шығын-тиімді ұзын-контексттік инференсті DeepSeek Sparse Attention (DSA) деп аталатын жаңа сиретілген назар механизмі және агенттер/«ойлау» жұмыс ағымдары («Thinking in Tool-Use») арқылы ерекше атап көрсетеді.

Негізгі мүмкіндіктер (жоғары деңгей)

  • DeepSeek Sparse Attention (DSA): ұзын контекст жағдайларында есептеуді едәуір азайтып, ұзақ-қашықтықты пайымдауды сақтауға арналған сирек назар механизмі. (Негізгі зерттеу тұжырымы; V3.2-Exp ішінде қолданылады.)
  • Агенттік ойлау + құрал қолданумен біріктіру: V3.2 «ойлауды» құрал қолдануға ендіруге басымдық береді: модель құралдарды шақырғанда пайымдау-ойлау режимдерінде де, ойламайтын (қалыпты) режимде де жұмыс істей алады, бұл көпқадамды тапсырмалар мен құралдар оркестрациясындағы шешім қабылдауды жақсартады.
  • Ауқымды агент деректерін синтездеу конвейері: DeepSeek интерактивті тапсырмаларға төзімділікті арттыру үшін мыңдаған орта мен ондаған мың күрделі нұсқауларды қамтитын оқу корпусы мен агент-синтездеу конвейерін хабарлайды.
  • DeepSeek Sparse Attention (DSA): DSA — V3.2 желісінде (алғаш V3.2-Exp ішінде) ұсынылған, назардың күрделілігін (наивті O(L²)-ден k ≪ L болатын O(L·k) түріне) азайтатын, әрбір сұрау токені үшін кілт/мән токендерінің шағын жиынтығын таңдайтын ұсақ-түйекті сирек назар әдісі. Нәтижесінде өте ұзын контексттер үшін (128K) жад/есептеу талаптары айтарлықтай төмендейді, ұзын-контекст инференсін айтарлықтай арзандатады.
  • Mixture-of-Experts (MoE) тірегі және Multi-head Latent Attention (MLA): V3 отбасы сыйымдылықты тиімді арттыру үшін MoE қолданады (номиналды параметрлер саны үлкен, бірақ әр токенге шаққандағы активация шектеулі), ал сапаны сақтау және есептеуді бақылау үшін MLA әдістерімен бірге пайдаланылады.

Техникалық сипаттамалар (қысқаша)

  • Номиналды параметр ауқымы: ~671B – 685B (нұсқаға байланысты).
  • Контекст терезесі (құжатталған сілтеме): 128,000 токен (128K) vLLM/анықтамалық конфигурацияларда.
  • Назар: DeepSeek Sparse Attention (DSA) + MLA; ұзын контексттер үшін назар күрделілігі төмендетілген.
  • Сандық және оқыту дәлдігі: BF16 / F32 және таратылымға қолжетімді сығылған квантталған форматтар (F8_E4M3 және т.б.).
  • Архитектуралық отбасы: MoE (mixture-of-experts) тірегі, токенге шаққандағы активация үнемімен.
  • Кіріс / шығыс: стандартты токенделген мәтін кірісі (чат/хабарлама форматтары қолдау табады); құрал шақыруларын (tool-use API primitives) және API арқылы интерактивті чат-стильдегі шақыруларды да, бағдарламалық толықтыруларды да қолдайды.
  • Ұсынылатын нұсқалар: v3.2, v3.2-Exp (эксперименттік, DSA дебюты), v3.2-Speciale (пайымдауды-алға қоятын, қысқа мерзімге тек API).

Бенчмарк көрсеткіштері

Жоғары есептеумен V3.2-Speciale бірқатар пайымдау/математика/кодтау бенчмарктерінде заманауи жоғары деңгейлі модельдермен теңеседі немесе олардан асады және таңдаулы күрделі математика есептер жинақтарында үздік нәтижелерге жетеді. Препринт кейбір пайымдау бенчмарктерінде GPT-5 / Kimi K2 сияқты модельдермен паритетті ерекше атап өтеді, сондай-ақ бұрынғы DeepSeek R1/V3 базалық нұсқаларымен салыстырғандағы нақты жақсартуларды көрсетеді:

  • AIME: 70.0-ден → 87.5 (Δ +17.5).
  • GPQA: 71.5 → 81.0 (Δ +9.5).
  • LCB_v6: 63.5 → 73.3 (Δ +9.8).
  • Aider: 57.0 → 71.6 (Δ +14.6).

Басқа модельдермен салыстыру (жоғары деңгей)

  • GPT-5 / Gemini 3 Pro-мен салыстырғанда (қоғамдық мәлімдемелер): DeepSeek авторлары және бірнеше баспасөз өкілдері Speciale нұсқасы үшін таңдалған пайымдау мен кодтау тапсырмаларында паритетті немесе артықшылықты мәлімдейді, сондай-ақ құн тиімділігі мен ашық лицензиялауды ерекшелендіретін факторлар ретінде атап көрсетеді.
  • Ашық модельдермен (Olmo, Nemotron, Moonshot және т.б.) салыстырғанда: DeepSeek ұзын контекст тиімділігі үшін негізгі ерекшелік ретінде агенттік оқытуды және DSA-ны атап өтеді.

Типтік қолдану жағдайлары

  • Агенттік жүйелер / оркестрация: модель деңгейіндегі «ойлау» + айқын құрал-шақыру примитивтерінен пайда көретін көпқұралды агенттер (API-лер, веб-скреперлер, код орындау коннекторлары).
  • Ұзын құжаттардағы пайымдау / талдау: құқықтық құжаттар, ірі зерттеу корпустары, кездесулер транскрипттері — ұзын-контекст нұсқалары (128k токен) өте үлкен контексттерді бір шақыруда сақтауға мүмкіндік береді.
  • Күрделі математика және кодтауға көмек: жеткізуші бенчмарктеріне сәйкес V3.2-Speciale озық математикалық пайымдау және кең ауқымды код жөндеу тапсырмалары үшін ұсынылады.
  • Құнға сезімтал өндірістік енгізулер: DSA + баға өзгерістері жоғары контексттік жүктемелер үшін инференс құнын төмендетуге бағытталған.

DeepSeek v3.2 API-ін қолдануды қалай бастауға болады

CometAPI ішіндегі DeepSeek v3.2 API бағасы, ресми бағадан 20% төмен:

Кіріс токендері$0.22
Шығыс токендері$0.35

Қажетті қадамдар

  • cometapi.com сайтына кіріңіз. Егер әлі пайдаланушымыз болмасаңыз, алдымен тіркеліңіз
  • Интерфейстің қолжеткізу тіркелгісі — API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” түймесін басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.
  • Осы сайттың URL-ын алыңыз: https://api.cometapi.com/

Қолдану тәсілі

  1. API сұрауын жіберу және сұрау денесін орнату үшін “deepseek-v3.2” соңғы нүктесін таңдаңыз. Сұрау әдісі мен сұрау денесін біздің веб-сайттағы API құжатынан алуға болады. Ыңғайлылық үшін сайтымызда Apifox сынағы да бар.
  2. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз.
  3. Chat форматын таңдаңыз: сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель дәл осыған жауап береді.
  4. API жауаптарын өңдеп, жасалған жауапты алыңыз.

Көбірек модельдер