DeepSeek V3.1 API

CometAPI
AnnaAug 21, 2025
DeepSeek V3.1 API

DeepSeek V3.1 — DeepSeek-тің V-сериясындағы ең жаңа жаңартуы: жоғары өткізу қабілетті, төмен құнды жалпылама интеллект пен агенттік құралдарды пайдалану үшін жасалған гибридті “ойлау / ойламау” үлкен тілдік модель. Ол OpenAI стиліндегі API-мен үйлесімділікті сақтайды, ақылдырақ құрал шақыруды қосады және — компанияның мәліметінше — генерация жылдамдығын арттырып, агенттердің сенімділігін жақсартады.

Негізгі мүмкіндіктер (не ұсынады)

  • Екі инференс режимі: deepseek-chat (ойламайтын / жылдамырақ) және deepseek-reasoner (ойлайтын / ойлау тізбегі мен агент дағдылары күштірек). UI соңғы пайдаланушыларға арналған “DeepThink” ауыстырғышын көрсетеді.
  • Ұзақ контекст: ресми материалдар мен қауымдастық есептері V3 отбасында 128k токен контекстік терезені атап өтеді. Бұл өте ұзын құжаттарды тұтас өңдеуге мүмкіндік береді.
  • Құрал/агентпен жұмыс жақсартылды: оқытудан кейінгі оңтайландыру сенімді құрал шақыруға, көпқадамды агенттік жұмыс процестеріне және плагин/құрал интеграцияларына бағытталған.

Техникалық мәліметтер (архитектура, оқыту және іске асыру)

Оқу корпусы және ұзақ контекстке арналған инженерлік тәсілдер. Deepseek V3.1 жаңартуы бұрынғы V3 чекпойнттарының негізінде екі кезеңді ұзақ контекст кеңейтуін атап өтеді: ашық жазбалар 32k және 128k кеңейту фазаларына арналған айтарлықтай қосымша токендерді көрсетеді (DeepSeek кеңейту қадамдарында жүздеген миллиард токен пайдаланылғанын хабарлайды). Релиз сондай-ақ үлкен контекст режимдерін қолдау үшін токенизатор конфигурациясын жаңартты.

Модель өлшемі және инференс үшін микромасштабтау. Қоғамдық және қауымдастық есептері параметр саны бойынша аздап әртүрлі мәліметтер береді (жаңа релиздер үшін бұл жиі кездеседі): үшінші тарап индекстеушілер мен айна сайттар кейбір орындалу сипаттамаларында ~671B параметрді (37B белсенді) көрсетеді, ал басқа қауымдастық жинақтары гибридті пайымдау архитектурасының номиналды өлшемі ретінде ~685B көрсетеді.

Инференс режимдері және инженерлік компромистер. Deepseek V3.1 екі прагматикалық инференс режимін ұсынады: deepseek-chat (стандартты кезекті чат үшін оңтайландырылған, кідірісі төмен) және deepseek-reasoner (ойлау тізбегін және құрылымды пайымдауды басым қоятын “ойлайтын” режим).

Шектеулер және тәуекелдер

  • Бенчмарктардың пісіп-жетілуі және қайталанбалығы: көптеген өнімділік мәлімдемелері ерте, қауымдастыққа негізделген немесе таңдаулы. Тәуелсіз, стандартталған бағалаулар әлі де қалыптасу үстінде. (Тәуекел: шамадан тыс мәлімдемелер).
  • Қауіпсіздік және галлюцинациялар: барлық үлкен LLM сияқты, Deepseek V3.1 де галлюцинация және зиянды мазмұн тәуекелдеріне ұшырауы мүмкін; күштірек ойлау режимдері кейде сенімді көрінетін, бірақ қате көпқадамды нәтижелер бере алады. Пайдаланушылар маңызды нәтижелерге қауіпсіздік қабаттарын және адамдық тексеруді қолдануы тиіс. (Ешбір вендор немесе тәуелсіз дереккөз галлюцинацияны толық жоюды мәлімдемейді.)
  • Инференс құны және кідірісі: ойлау режимі кідірісті мүмкіндіктерге айырбастайды; кең ауқымды тұтынушылық инференс үшін бұл құнды арттырады. Кейбір комментаторлар нарықтың ашық, арзан, жоғары жылдамдықты модельдерге реакциясы құбылмалы болуы мүмкін екенін атап өтеді.

Жиі және тартымды қолдану сценарийлері

  • Ұзақ құжаттарды талдау және қысқаша мазмұндау: құқық, ҒЗТКЖ, әдеби шолулар — 128k токендік терезені пайдаланып, тұтас қысқаша мазмұндаулар жасау.
  • Агенттік жұмыс процестері және құралдарды үйлестіру: көпқадамды құрал шақыруларын (API, іздеу, калькуляторлар) талап ететін автоматтандырулар. Deepseek V3.1-дің оқытудан кейінгі агенттік баптауы мұнда сенімділікті арттыруға бағытталған.
  • Код генерациясы және бағдарламалық қамтамасыз ету бойынша көмек: ерте бенчмарк есептері күшті бағдарламалау өнімділігін атап өтеді; адамдық бақылаумен жұптық бағдарламалау, код шолу және генерация тапсырмаларына жарамды.
  • Кәсіпорындық орналастыруда құн/кідіріс таңдауы маңызды болғанда: арзан/жылдамырақ сөйлесу ассистенттері үшін chat режимін, ал офлайн немесе премиум терең ойлау тапсырмалары үшін reasoner режимін таңдаңыз.

Deepseek V3.1 API-ін CometAPI арқылы қалай шақыруға болады

CometAPI-дегі deepseek v3.1 API бағалары, ресми бағадан 20% төмен:

Кіріс токендер$0.44
Шығыс токендер$1.32

Қажетті қадамдар

  • cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз
  • Интерфейстің қолжетімділік құжаты — API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” батырмасын басып, токен кілтін алыңыз: sk-xxxxx және жіберіңіз.
  • Осы сайттың url-ін алыңыз: https://api.cometapi.com/

Пайдалану тәсілі

  1. API сұрауын жіберу үшін “deepseek-v3.1“ / “deepseek-v3-1-250821” endpoint таңдап, сұрау денесін орнатыңыз. Сұрау әдісі мен денесін біздің вебсайттағы API құжатынан алыңыз. Ыңғайлылық үшін вебсайт Apifox тестін де ұсынады.
  2. <YOUR_API_KEY> мәнін есептік жазбаңыздағы нақты CometAPI кілтіңізге ауыстырыңыз.
  3. Сұрағыңызды немесе өтінішіңізді мазмұн өрісіне енгізіңіз — модель соған жауап береді.
  4. . API жауабын өңдеп, жасалған жауапты алыңыз.

API шақыру

CometAPI толық үйлесімді REST API ұсынады — үздіксіз көшу үшін. Негізгі мәліметтер API doc:

  • Негізгі параметрлер: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Модель параметрі:deepseek-v3.1“ / “deepseek-v3-1-250821
  • Аутентификация: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

CometAPI_API_KEY мәнін өз кілтіңізбен ауыстырыңыз; базалық URL-ді ескеріңіз.

Python

from openai import OpenAI

client = OpenAI(
    api_key=os.environ,
    base_url="https://api.cometapi.com/v1/chat/completions"  # important

)

resp = client.chat.completions.create(
    model="deepseek-v3.1",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Summarize this PDF in 5 bullets."}
    ],
    temperature=0.3,
    response_format={"type": "json_object"}  # for structured outputs

)
print(resp.choices.message.content)

Қосымша қараңыз Grok 4

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік