Can DeepSeek-V4-Pro handle 1M-token documents in the API?

Yes. DeepSeek-V4-Pro with a 1M-token context length and up to 384K output tokens, so it is built for very long documents and multi-file workflows.

Does DeepSeek-V4-Pro support thinking mode and tool calls?

Yes. DeepSeek-V4-Pro supports both thinking and non-thinking modes, plus JSON output and tool calls.

When should I use DeepSeek-V4-Pro instead of DeepSeek-V4-Flash?

Use DeepSeek-V4-Pro when accuracy and agentic coding matter more than speed. DeepSeek says V4-Flash is the faster, more economical option, while V4-Pro is stronger on coding and broader agent evaluations.

Is DeepSeek-V4-Pro good for coding agents like Claude Code or OpenCode?

Yes. DeepSeek-V4-Pro configured for Claude Code and OpenCode, with `reasoningEffort` set to `max` and thinking enabled.

How do I integrate DeepSeek-V4-Pro with OpenAI-compatible SDKs?

Use the CometAPI base URL `https://api.cometapi.com` with the model name `deepseek-v4-pro`

Is DeepSeek-V4-Pro suitable for search-heavy research workflows?

Yes. V4-Pro performs strongly on search and retrieval-style tasks, and it outperforms DeepSeek-V3.2 by a substantial margin in both objective and subjective Q&A categories.

Przystępne cenowo API DeepSeek V4 Pro | text-to-text

Specyfikacja techniczna

Element	DeepSeek-V4-Pro
Dostawca	DeepSeek
Nazwa modelu API	deepseek-v4-pro
Podstawowe adresy URL	https://api.deepseek.com and https://api.deepseek.com/anthropic
Typ wejścia	Text
Typ wyjścia	Text, tool calls, reasoning output
Długość kontekstu	1,000,000 tokens
Maksymalna długość wyjścia	384,000 tokens
Tryby rozumowania	Non-thinking, thinking (default)
Domyślne ustawienia agenta/kodowania	reasoning_effort can be set as high; complex agent requests may use max
Obsługiwane funkcje	JSON Output, Tool Calls, Chat Prefix Completion (beta), FIM Completion (beta in non-thinking mode)
Wydanie z lokalnymi/otwartymi wagami	1.6T total parameters, 49B activated parameters, FP4 + FP8 mixed precision
Licencja (karta modelu)	MIT
Referencyjna karta modelu	DeepSeek-V4-Pro preview on Hugging Face

Czym jest DeepSeek-V4-Pro?

DeepSeek-V4-Pro to mocniejszy członek rodziny DeepSeek V4 w wersji preview. Oficjalna karta modelu opisuje go jako model MoE z 1.6T parametrów i 49B aktywowanych parametrów oraz oknem kontekstu o rozmiarze miliona tokenów, przeznaczony do długoterminowej pracy z wiedzą, generowania kodu i zadań agentowych. Dokumentacja API udostępnia go przez standardowy interfejs chat-completions DeepSeek i obsługuje zarówno styl SDK OpenAI, jak i Anthropic.

Główne funkcje

Milion-tokenowy kontekst: DeepSeek dokumentuje długość kontekstu 1M tokenów, co sprawia, że model nadaje się do bardzo dużych zbiorów dokumentów, repozytoriów i wieloetapowych sesji agentów.
Dwa tryby rozumowania: API obsługuje tryby non-thinking i thinking; thinking jest domyślny, a dokumentacja zauważa, że złożone żądania agentowe, takie jak Claude Code lub OpenCode, mogą automatycznie używać max effort.
Obsługa wywołań narzędzi: tryb thinking w DeepSeek wspiera wywołania narzędzi, co jest ważne dla agentów wymagających wyszukiwania, operacji na plikach lub funkcji zewnętrznych.
Wydajność przy długim kontekście: karta modelu mówi, że V4 używa hybrydowego mechanizmu uwagi z Compressed Sparse Attention i Heavily Compressed Attention, aby zmniejszyć koszty obliczeń i pamięci podręcznej KV dla długiego kontekstu względem V3.2. citeturn980363view2
Skoncentrowany na kodowaniu i rozumowaniu: DeepSeek twierdzi, że tryb rozumowania V4-Pro-Max poprawia wyniki w benchmarkach programistycznych i zmniejsza znaczną część luki względem wiodących modeli zamkniętych w zadaniach rozumowania i agentowych. citeturn980363view2
Elastyczność SDK: Można uzyskać dostęp poprzez standardowe, zgodne z OpenAI, chat completions lub przez endpoint zgodny z Anthropic dla przepływów zorientowanych na narzędzia.

Wydajność w benchmarkach

Oficjalna karta modelu DeepSeek podaje następujące wyniki ewaluacji dla rodziny modeli bazowych oraz dla porównania V4-Pro-Max. W tabeli modeli bazowych V4-Pro uzyskuje wynik wyższy niż V3.2-Base w kilku benchmarkach wiedzy i długiego kontekstu, m.in. MMLU-Pro (73.5 vs. 65.5), FACTS Parametric (62.6 vs. 27.1) oraz LongBench-V2 (51.5 vs. 40.2).

Benchmark	V3.2-Base	V4-Flash-Base	V4-Pro-Base
MMLU-Pro (EM)	65.5	68.3	73.5
FACTS Parametric (EM)	27.1	33.9	62.6
HumanEval (Pass@1)	62.8	69.5	76.8
LongBench-V2 (EM)	40.2	44.7	51.5

Ta sama karta modelu pokazuje również, że V4-Pro-Max pozostaje konkurencyjny względem czołowych modeli na wybranych zadaniach. Na przykład osiąga 87.5 na MMLU-Pro, 57.9 na SimpleQA-Verified, 90.1 na GPQA Diamond oraz 67.9 na Terminal Bench 2.0 w opublikowanej tabeli porównawczej.

DeepSeek-V4-Pro vs DeepSeek-V4-Flash vs DeepSeek-V3.2

Model	Najlepiej nadaje się do	Kontekst	Uwagi
DeepSeek-V4-Pro	Złożone rozumowanie, kodowanie, agenci, duże dokumenty	1M	Największy model V4, 49B aktywowanych parametrów, najsilniejsza ogólna wydajność w serii. citeturn980363view2turn980363view0
DeepSeek-V4-Flash	Szybsze, lżejsze zastosowania ogólne	1M	Mniejszy model 284B/13B, nadal obsługuje thinking i wywołania narzędzi. citeturn980363view2turn980363view0
DeepSeek-V3.2	Bazowy model poprzedniej generacji dla długiego kontekstu	128K w wcześniejszych dokumentach API; V4 używa innego projektu kontekstu 1M	Przydatny jako punkt odniesienia dla zysków efektywności; karta modelu V4-Pro raportuje duże redukcje FLOPs dla długiego kontekstu i pamięci podręcznej KV względem V3.2. citeturn321011view1turn980363view2

Najlepsze przypadki użycia

Asystenci programistyczni w skali repozytorium i narzędzia do refaktoryzacji
Analiza i synteza długich dokumentów
Agenci korzystający z narzędzi, wymagający wieloetapowego rozumowania
Przepływy wsparcia technicznego, które korzystają z długiej pamięci i ustrukturyzowanych wyników
Zadania wiedzowe w języku chińskim i wielojęzyczne, gdzie karta modelu pokazuje silne wyniki benchmarków

Jak uzyskać dostęp i korzystać z API Deepseek v4 pro

Krok 1: Zarejestruj się, aby uzyskać klucz API

Zaloguj się do cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojego CometAPI console. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokenu: sk-xxxxx i zatwierdź.

Krok 2: Wysyłanie żądań do Deepseek v4 proAPI

Wybierz endpoint „deepseek-v4-pro”, aby wysłać żądanie do API i ustaw ciało żądania. Metodę żądania i ciało żądania znajdziesz w dokumentacji API na naszej stronie. Nasza strona zapewnia też test w Apifox dla Twojej wygody. Zamień <YOUR_API_KEY> na rzeczywisty klucz CometAPI z Twojego konta. Where to call it: [Anthropic Messages] format and [Chat] format.

Wstaw swoje pytanie lub prośbę do pola content — to na to model odpowie . Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.

Krok 3: Pobierz i zweryfikuj wyniki

Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Włącz funkcje takie jak strumieniowanie, buforowanie promptów czy obsługa długiego kontekstu poprzez standardowe parametry.

Cennik dla DeepSeek V4 Pro

Poznaj konkurencyjne ceny dla DeepSeek V4 Pro, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak DeepSeek V4 Pro może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.

Cena Comet (USD / M Tokens)	Oficjalna cena (USD / M Tokens)	Zniżka
Wejście:$0.416/M Wyjście:$0.832/M	Wejście:$0.52/M Wyjście:$1.04/M	-20%

Przykładowy kod i API dla DeepSeek V4 Pro

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla DeepSeek V4 Pro, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał DeepSeek V4 Pro w Twoich projektach.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("
</reasoning>

<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("\n</reasoning>\n\n<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const stream = await client.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Which number is greater, 9.11 or 9.8? Answer with one sentence." },
  ],
  thinking: { type: "enabled" },
  reasoning_effort: "high",
  max_tokens: 256,
  stream: true,
});

let thinking = false;
for await (const chunk of stream) {
  const delta = chunk.choices[0]?.delta ?? {};
  const reasoning = delta.reasoning_content ?? "";
  const content = delta.content ?? "";

  if (reasoning) {
    if (!thinking) {
      process.stdout.write("<reasoning>\n");
      thinking = true;
    }
    process.stdout.write(reasoning);
  }

  if (content) {
    if (thinking) {
      process.stdout.write("\n</reasoning>\n\n<answer>\n");
      thinking = false;
    }
    process.stdout.write(content);
  }
}

process.stdout.write("\n");

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

if ! command -v jq >/dev/null 2>&1; then
  echo "jq is required to parse streamed reasoning_content in this shell example." >&2
  exit 1
fi

thinking=false

curl --silent --no-buffer --location --request POST "https://api.cometapi.com/v1/chat/completions" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data-raw '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "high",
    "max_tokens": 256,
    "stream": true
  }' | while IFS= read -r line; do
    case "$line" in
      data:\ *) data=${line#data: } ;;
      *) continue ;;
    esac

    [ "$data" = "[DONE]" ] && break

    reasoning=$(printf '%s' "$data" | jq -r '.choices[0].delta.reasoning_content // empty')
    content=$(printf '%s' "$data" | jq -r '.choices[0].delta.content // empty')

    if [ -n "$reasoning" ]; then
      if [ "$thinking" = false ]; then
        printf '<reasoning>\n'
        thinking=true
      fi
      printf '%s' "$reasoning"
    fi

    if [ -n "$content" ]; then
      if [ "$thinking" = true ]; then
        printf '\n</reasoning>\n\n<answer>\n'
        thinking=false
      fi
      printf '%s' "$content"
    fi
  done

printf '\n'

Wersje modelu DeepSeek V4 Pro

Powody, dla których DeepSeek V4 Pro posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.

version
deepseek-v4-pro