Can DeepSeek-V4-Pro handle 1M-token documents in the API?

Yes. DeepSeek-V4-Pro with a 1M-token context length and up to 384K output tokens, so it is built for very long documents and multi-file workflows.

Does DeepSeek-V4-Pro support thinking mode and tool calls?

Yes. DeepSeek-V4-Pro supports both thinking and non-thinking modes, plus JSON output and tool calls.

When should I use DeepSeek-V4-Pro instead of DeepSeek-V4-Flash?

Use DeepSeek-V4-Pro when accuracy and agentic coding matter more than speed. DeepSeek says V4-Flash is the faster, more economical option, while V4-Pro is stronger on coding and broader agent evaluations.

Is DeepSeek-V4-Pro good for coding agents like Claude Code or OpenCode?

Yes. DeepSeek-V4-Pro configured for Claude Code and OpenCode, with `reasoningEffort` set to `max` and thinking enabled.

How do I integrate DeepSeek-V4-Pro with OpenAI-compatible SDKs?

Use the CometAPI base URL `https://api.cometapi.com` with the model name `deepseek-v4-pro`

Is DeepSeek-V4-Pro suitable for search-heavy research workflows?

Yes. V4-Pro performs strongly on search and retrieval-style tasks, and it outperforms DeepSeek-V3.2 by a substantial margin in both objective and subjective Q&A categories.

Rimelig DeepSeek V4 Pro API | text-to-text

Tekniske spesifikasjoner

Element	DeepSeek-V4-Pro
Leverandør	DeepSeek
API-modellnavn	deepseek-v4-pro
Base-URL-er	https://api.deepseek.com and https://api.deepseek.com/anthropic
Inndatatype	Text
Utdatatype	Text, tool calls, reasoning output
Kontekstlengde	1,000,000 tokens
Maksimal utdata	384,000 tokens
Resonneringsmoduser	Non-thinking, thinking (default)
Standardinnstillinger for agent/koding	reasoning_effort can be set as high; complex agent requests may use max
Støttede funksjoner	JSON Output, Tool Calls, Chat Prefix Completion (beta), FIM Completion (beta in non-thinking mode)
Lokal/åpne-vekter-utgivelse	1.6T total parameters, 49B activated parameters, FP4 + FP8 mixed precision
Lisens (modellkort)	MIT
Referansemodellkort	DeepSeek-V4-Pro preview on Hugging Face

Hva er DeepSeek-V4-Pro?

DeepSeek-V4-Pro er det sterkere medlemmet i DeepSeeks V4 forhåndsvisningsfamilie. Det offisielle modellkortet beskriver den som en MoE-modell med 1,6T parametere, 49B aktiverte parametere og et kontekstvindu på én million token, rettet mot kunnskapsarbeid med lang horisont, kodegenerering og agentoppgaver. API-dokumentasjonen eksponerer den via DeepSeeks standard chat-completions-grensesnitt og støtter både OpenAI- og Anthropic-lignende SDK-stiler.

Hovedfunksjoner

Million-token-kontekst: DeepSeek dokumenterer en kontekstkapsitet på 1M-token, noe som gjør modellen egnet for svært store dokumentsett, kodelagre og flertrinns agentsesjoner.
To resonnementstilstander: API-et støtter non-thinking og thinking; thinking er standard, og dokumentasjonen påpeker at komplekse agentforespørsler som Claude Code eller OpenCode automatisk kan bruke max innsats.
Støtte for verktøykall: DeepSeeks thinking-modus støtter verktøykall, noe som er viktig for agenter som trenger søk, filoperasjoner eller eksterne funksjoner.
Effektivitet for lang kontekst: Modellkortet sier at V4 bruker et hybrid attention-design med Compressed Sparse Attention og Heavily Compressed Attention for å redusere beregning og KV-cache-kostnader for lange kontekster sammenlignet med V3.2. citeturn980363view2
Fokus på koding og resonnement: DeepSeek sier at V4-Pro-Max-resonneringsmodus forbedrer kode-benchmarks og lukker mye av gapet til ledende lukkede modeller på resonnement og agentiske oppgaver. citeturn980363view2
SDK-fleksibilitet: Den kan nås via standard OpenAI-kompatible chat-completions eller via DeepSeeks Anthropic-kompatible endepunkt for verktøyorienterte arbeidsflyter.

Benchmark-ytelse

Det offisielle DeepSeek-modellkortet rapporterer følgende evalueringsresultater for basismodellfamilien og for sammenligningssettet V4-Pro-Max. I basismodelltabellen scorer V4-Pro høyere enn V3.2-Base på flere kunnskaps- og langkontekst-benchmarks, inkludert MMLU-Pro (73.5 vs. 65.5), FACTS Parametric (62.6 vs. 27.1) og LongBench-V2 (51.5 vs. 40.2).

Benchmark	V3.2-Base	V4-Flash-Base	V4-Pro-Base
MMLU-Pro (EM)	65.5	68.3	73.5
FACTS Parametric (EM)	27.1	33.9	62.6
HumanEval (Pass@1)	62.8	69.5	76.8
LongBench-V2 (EM)	40.2	44.7	51.5

Det samme modellkortet viser også at V4-Pro-Max fortsatt er konkurransedyktig med toppmodeller på utvalgte oppgaver. For eksempel oppnår den 87.5 på MMLU-Pro, 57.9 på SimpleQA-Verified, 90.1 på GPQA Diamond og 67.9 på Terminal Bench 2.0 i den publiserte sammenligningstabellen.

DeepSeek-V4-Pro vs DeepSeek-V4-Flash vs DeepSeek-V3.2

Modell	Best egnet	Kontekst	Notater
DeepSeek-V4-Pro	Tungt resonnement, koding, agenter, store dokumenter	1M	Største V4-modell, 49B aktiverte parametere, sterkeste totale kapasitet i serien. citeturn980363view2turn980363view0
DeepSeek-V4-Flash	Raskere, lettere generell bruk	1M	Mindre 284B/13B-modell, støtter fortsatt thinking og verktøykall. citeturn980363view2turn980363view0
DeepSeek-V3.2	Forrige generasjons langkontekst-baseline	128K i tidligere API-dokumentasjon; V4 bruker et annet 1M-kontekstdesign	Nyttig som referansepunkt for effektivitetsgevinster; V4-Pros modellkort rapporterer store reduksjoner i FLOPs for lang kontekst og KV-cache kontra V3.2. citeturn321011view1turn980363view2

Beste bruksområder

Kodeassistenter og refaktoringsverktøy på lagernivå
Analyse og syntese av lange dokumenter
Verktøybrukende agenter som trenger flertrinns resonnement
Tekniske støttearbeidsflyter som drar nytte av lang hukommelse og strukturerte utdata
Kinesiske og flerspråklige kunnskapsoppgaver der modellkortet viser sterk benchmark-ytelse

Slik får du tilgang til og bruker Deepseek v4 pro API

Trinn 1: Registrer deg for API-nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn i din CometAPI-konsoll. Hent tilgangslegitimasjonen (API-nøkkel) til grensesnittet. Klikk “Add Token” ved API token i det personlige senteret, få token-nøkkelen: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til Deepseek v4 proAPI

Velg endepunktet “deepseek-v4-pro” for å sende API-forespørselen og sett forespørselens body. Forespørselsmetoden og bodyen hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for din bekvemmelighet. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. Hvor å kalle det: Anthropic Messages-format og Chat-format.

Sett inn spørsmålet eller forespørselen din i content-feltet—det er dette modellen vil svare på. Behandle API-responsen for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-responsen for å hente det genererte svaret. Etter behandling svarer API-et med oppgavens status og utdata. Aktiver funksjoner som streaming, prompt-caching eller håndtering av lang kontekst via standardparametere.

Priser for DeepSeek V4 Pro

Utforsk konkurransedyktige priser for DeepSeek V4 Pro, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan DeepSeek V4 Pro kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

Komet-pris (USD / M Tokens)	Offisiell pris (USD / M Tokens)	Rabatt
Inndata:$0.416/M Utdata:$0.832/M	Inndata:$0.52/M Utdata:$1.04/M	-20%

Eksempelkode og API for DeepSeek V4 Pro

Få tilgang til omfattende eksempelkode og API-ressurser for DeepSeek V4 Pro for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til DeepSeek V4 Pro i prosjektene dine.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("
</reasoning>

<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("\n</reasoning>\n\n<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const stream = await client.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Which number is greater, 9.11 or 9.8? Answer with one sentence." },
  ],
  thinking: { type: "enabled" },
  reasoning_effort: "high",
  max_tokens: 256,
  stream: true,
});

let thinking = false;
for await (const chunk of stream) {
  const delta = chunk.choices[0]?.delta ?? {};
  const reasoning = delta.reasoning_content ?? "";
  const content = delta.content ?? "";

  if (reasoning) {
    if (!thinking) {
      process.stdout.write("<reasoning>\n");
      thinking = true;
    }
    process.stdout.write(reasoning);
  }

  if (content) {
    if (thinking) {
      process.stdout.write("\n</reasoning>\n\n<answer>\n");
      thinking = false;
    }
    process.stdout.write(content);
  }
}

process.stdout.write("\n");

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

if ! command -v jq >/dev/null 2>&1; then
  echo "jq is required to parse streamed reasoning_content in this shell example." >&2
  exit 1
fi

thinking=false

curl --silent --no-buffer --location --request POST "https://api.cometapi.com/v1/chat/completions" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data-raw '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "high",
    "max_tokens": 256,
    "stream": true
  }' | while IFS= read -r line; do
    case "$line" in
      data:\ *) data=${line#data: } ;;
      *) continue ;;
    esac

    [ "$data" = "[DONE]" ] && break

    reasoning=$(printf '%s' "$data" | jq -r '.choices[0].delta.reasoning_content // empty')
    content=$(printf '%s' "$data" | jq -r '.choices[0].delta.content // empty')

    if [ -n "$reasoning" ]; then
      if [ "$thinking" = false ]; then
        printf '<reasoning>\n'
        thinking=true
      fi
      printf '%s' "$reasoning"
    fi

    if [ -n "$content" ]; then
      if [ "$thinking" = true ]; then
        printf '\n</reasoning>\n\n<answer>\n'
        thinking=false
      fi
      printf '%s' "$content"
    fi
  done

printf '\n'

Versjoner av DeepSeek V4 Pro

Grunnen til at DeepSeek V4 Pro har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.

version
deepseek-v4-pro