Can DeepSeek-V4-Pro handle 1M-token documents in the API?

Yes. DeepSeek-V4-Pro with a 1M-token context length and up to 384K output tokens, so it is built for very long documents and multi-file workflows.

Does DeepSeek-V4-Pro support thinking mode and tool calls?

Yes. DeepSeek-V4-Pro supports both thinking and non-thinking modes, plus JSON output and tool calls.

When should I use DeepSeek-V4-Pro instead of DeepSeek-V4-Flash?

Use DeepSeek-V4-Pro when accuracy and agentic coding matter more than speed. DeepSeek says V4-Flash is the faster, more economical option, while V4-Pro is stronger on coding and broader agent evaluations.

Is DeepSeek-V4-Pro good for coding agents like Claude Code or OpenCode?

Yes. DeepSeek-V4-Pro configured for Claude Code and OpenCode, with `reasoningEffort` set to `max` and thinking enabled.

How do I integrate DeepSeek-V4-Pro with OpenAI-compatible SDKs?

Use the CometAPI base URL `https://api.cometapi.com` with the model name `deepseek-v4-pro`

Is DeepSeek-V4-Pro suitable for search-heavy research workflows?

Yes. V4-Pro performs strongly on search and retrieval-style tasks, and it outperforms DeepSeek-V3.2 by a substantial margin in both objective and subjective Q&A categories.

سستی DeepSeek V4 Pro API | text-to-text

تکنیکی خصوصیات

آئٹم	DeepSeek-V4-Pro
فراہم کنندہ	DeepSeek
API ماڈل کا نام	deepseek-v4-pro
بنیادی URLs	https://api.deepseek.com اور https://api.deepseek.com/anthropic
ان پٹ کی قسم	متن
آؤٹ پٹ کی قسم	متن، ٹول کالز، ریزننگ آؤٹ پٹ
کانٹیکسٹ کی لمبائی	1,000,000 tokens
زیادہ سے زیادہ آؤٹ پٹ	384,000 tokens
استدلالی موڈز	Non-thinking, thinking (default)
ایجنٹ/کوڈنگ ڈیفالٹس	reasoning_effort کو high تک سیٹ کیا جا سکتا ہے؛ پیچیدہ ایجنٹ درخواستیں max استعمال کر سکتی ہیں
تعاون یافتہ خصوصیات	JSON Output, Tool Calls, Chat Prefix Completion (beta), FIM Completion (beta in non-thinking mode)
مقامی/اوپن-ویٹس ریلیز	1.6T کل پیرامیٹرز، 49B فعال پیرامیٹرز، FP4 + FP8 مکسڈ پریسِژن
لائسنس (ماڈل کارڈ)	MIT
حوالہ جاتی ماڈل کارڈ	Hugging Face پر DeepSeek-V4-Pro پریویو

DeepSeek-V4-Pro کیا ہے؟

DeepSeek-V4-Pro، DeepSeek کی V4 پریویو فیملی کا زیادہ طاقتور رکن ہے۔ آفیشل ماڈل کارڈ اسے 1.6T-پیرامیٹر MoE ماڈل قرار دیتا ہے جس میں 49B فعال پیرامیٹرز اور ایک ملین ٹوکن کا کانٹیکسٹ ونڈو شامل ہے، جو طویل المدتی علمی کام، کوڈ جنریشن اور ایجنٹ ٹاسکس کے لیے موزوں ہے۔ API ڈاکس اسے معیاری DeepSeek چیٹ-کمپلیشنز انٹرفیس کے ذریعے پیش کرتی ہیں اور OpenAI اور Anthropic دونوں SDK اسٹائلز کو سپورٹ کرتی ہیں۔

اہم خصوصیات

ملین-ٹوکن کانٹیکسٹ: DeepSeek 1M-ٹوکن کانٹیکسٹ لمبائی دستاویزی طور پر بیان کرتا ہے، جو ماڈل کو بہت بڑے دستاویزی مجموعوں، ریپوزٹریز اور کثیر مرحلہ ایجنٹ سیشنز کے لیے موزوں بناتا ہے۔
دو استدلالی موڈز: API non-thinking اور thinking موڈز کو سپورٹ کرتی ہے؛ thinking ڈیفالٹ ہے، اور ڈاکس نوٹ کرتی ہیں کہ Claude Code یا OpenCode جیسے پیچیدہ ایجنٹ ریکوئیسٹس خودکار طور پر max effort استعمال کر سکتی ہیں۔
ٹول کال کی صلاحیت: DeepSeek کا thinking موڈ ٹول کالز کو سپورٹ کرتا ہے، جو ان ایجنٹس کے لیے اہم ہے جنہیں سرچ، فائل آپریشنز یا بیرونی فنکشنز درکار ہوں۔
لانگ-کانٹیکسٹ ایفیشنسی: ماڈل کارڈ کے مطابق V4 ایک ہائبرڈ اٹینشن ڈیزائن استعمال کرتا ہے جس میں Compressed Sparse Attention اور Heavily Compressed Attention شامل ہیں، تاکہ V3.2 کے مقابلے میں طویل کانٹیکسٹ کی کمپیوٹ اور KV cache لاگت کم ہو۔ citeturn980363view2
کوڈنگ اور استدلال پر توجہ: DeepSeek کے مطابق V4-Pro-Max reasoning موڈ کوڈنگ بینچ مارکس میں ترقی لاتا ہے اور استدلال اور ایجنٹک ٹاسکس پر نمایاں بند-سورس ماڈلز کے ساتھ فاصلے کو کافی حد تک کم کرتا ہے۔ citeturn980363view2
SDK کی لچک: اسے معیاری OpenAI-مطابق چیٹ کمپلیشنز کے ذریعے یا ٹول-مرکوز ورک فلو کے لیے DeepSeek کے Anthropic-مطابق اینڈ پوائنٹ کے ذریعے ایکسیس کیا جا سکتا ہے۔

بینچ مارک کارکردگی

آفیشل DeepSeek ماڈل کارڈ بیس ماڈل فیملی اور V4-Pro-Max کے موازنہ سیٹ کے لیے درج ذیل جانچ نتائج رپورٹ کرتا ہے۔ بیس-ماڈل ٹیبل میں، V4-Pro کئی علمی اور طویل کانٹیکسٹ بینچ مارکس پر V3.2-Base سے زیادہ اسکور کرتا ہے، جن میں MMLU-Pro (73.5 بمقابلہ 65.5)، FACTS Parametric (62.6 بمقابلہ 27.1)، اور LongBench-V2 (51.5 بمقابلہ 40.2) شامل ہیں۔

بینچ مارک	V3.2-Base	V4-Flash-Base	V4-Pro-Base
MMLU-Pro (EM)	65.5	68.3	73.5
FACTS Parametric (EM)	27.1	33.9	62.6
HumanEval (Pass@1)	62.8	69.5	76.8
LongBench-V2 (EM)	40.2	44.7	51.5

اسی ماڈل کارڈ میں یہ بھی دکھایا گیا ہے کہ V4-Pro-Max منتخب ٹاسکس پر صفِ اوّل کے ماڈلز کے ساتھ مسابقتی رہتا ہے۔ مثال کے طور پر، یہ MMLU-Pro پر 87.5، SimpleQA-Verified پر 57.9، GPQA Diamond پر 90.1، اور Terminal Bench 2.0 پر 67.9 اسکور کرتا ہے جیسا کہ شائع شدہ موازنہ ٹیبل میں درج ہے۔

DeepSeek-V4-Pro بمقابلہ DeepSeek-V4-Flash بمقابلہ DeepSeek-V3.2

ماڈل	بہترین استعمال	کانٹیکسٹ	نوٹس
DeepSeek-V4-Pro	بھاری استدلال، کوڈنگ، ایجنٹس، بڑی دستاویزات	1M	V4 کا سب سے بڑا ماڈل، 49B فعال پیرامیٹرز، اس سیریز میں مجموعی طور پر سب سے زیادہ صلاحیت۔ citeturn980363view2turn980363view0
DeepSeek-V4-Flash	تیز تر، ہلکے عام استعمال کے لیے	1M	چھوٹا 284B/13B ماڈل، ابھی بھی thinking اور ٹول کالز کو سپورٹ کرتا ہے۔ citeturn980363view2turn980363view0
DeepSeek-V3.2	سابقہ نسل کا لانگ-کانٹیکسٹ بیس لائن	پرانی API ڈاکس میں 128K؛ V4 ایک مختلف 1M کانٹیکسٹ ڈیزائن استعمال کرتا ہے	کارکردگی میں بہتری کے لیے حوالہ نقطہ کے طور پر مفید؛ V4-Pro کے ماڈل کارڈ کے مطابق V3.2 کے مقابلے میں لانگ-کانٹیکسٹ FLOPs اور KV cache میں بڑی کمی رپورٹ کی گئی ہے۔ citeturn321011view1turn980363view2

بہترین استعمالات

ریپوزٹری-سکیل کوڈنگ اسسٹنٹس اور ریفیکٹرنگ ٹولز
طویل دستاویزات کا تجزیہ اور ترکیب
وہ ایجنٹس جو ٹولز استعمال کرتے ہیں اور جنہیں متعدد موڑ والا استدلال درکار ہو
ٹیکنیکل سپورٹ ورک فلو جنہیں طویل میموری اور منظم آؤٹ پٹس سے فائدہ ہو
چینی اور کثیر لسانی علمی ٹاسکس جہاں ماڈل کارڈ مضبوط بینچ مارک کارکردگی دکھاتا ہے

Deepseek v4 pro API تک رسائی اور استعمال کا طریقہ

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کے لیے ایکسس کریڈنشل API key حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور جمع کروائیں۔

مرحلہ 2: Deepseek v4 proAPI کو درخواست بھیجیں

API درخواست بھیجنے کے لیے “deepseek-v4-pro” اینڈپوائنٹ منتخب کریں اور ریکوئیسٹ باڈی سیٹ کریں۔ ریکوئیسٹ میتھڈ اور ریکوئیسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی حقیقی CometAPI key سے <YOUR_API_KEY> کو تبدیل کریں۔ کہاں کال کریں: Anthropic Messages فارمیٹ اور Chat فارمیٹ۔

اپنا سوال یا درخواست content فیلڈ میں درج کریں—اسی پر ماڈل جواب دے گا۔ API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔

مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں

API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔ پروسیسنگ کے بعد، API ٹاسک کی حیثیت اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔ معیاری پیرامیٹرز کے ذریعے اسٹریمنگ، پرامپٹ کیشنگ یا لانگ-کانٹیکسٹ ہینڈلنگ جیسی خصوصیات فعال کریں۔

DeepSeek V4 Pro کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔

Comet قیمت (USD / M Tokens)	سرکاری قیمت (USD / M Tokens)	رعایت
ان پٹ:$0.416/M آؤٹ پٹ:$0.832/M	ان پٹ:$0.52/M آؤٹ پٹ:$1.04/M	-20%

DeepSeek V4 Pro کے لیے نمونہ کوڈ اور API

DeepSeek V4 Pro کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں DeepSeek V4 Pro کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("
</reasoning>

<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("\n</reasoning>\n\n<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const stream = await client.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Which number is greater, 9.11 or 9.8? Answer with one sentence." },
  ],
  thinking: { type: "enabled" },
  reasoning_effort: "high",
  max_tokens: 256,
  stream: true,
});

let thinking = false;
for await (const chunk of stream) {
  const delta = chunk.choices[0]?.delta ?? {};
  const reasoning = delta.reasoning_content ?? "";
  const content = delta.content ?? "";

  if (reasoning) {
    if (!thinking) {
      process.stdout.write("<reasoning>\n");
      thinking = true;
    }
    process.stdout.write(reasoning);
  }

  if (content) {
    if (thinking) {
      process.stdout.write("\n</reasoning>\n\n<answer>\n");
      thinking = false;
    }
    process.stdout.write(content);
  }
}

process.stdout.write("\n");

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

if ! command -v jq >/dev/null 2>&1; then
  echo "jq is required to parse streamed reasoning_content in this shell example." >&2
  exit 1
fi

thinking=false

curl --silent --no-buffer --location --request POST "https://api.cometapi.com/v1/chat/completions" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data-raw '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "high",
    "max_tokens": 256,
    "stream": true
  }' | while IFS= read -r line; do
    case "$line" in
      data:\ *) data=${line#data: } ;;
      *) continue ;;
    esac

    [ "$data" = "[DONE]" ] && break

    reasoning=$(printf '%s' "$data" | jq -r '.choices[0].delta.reasoning_content // empty')
    content=$(printf '%s' "$data" | jq -r '.choices[0].delta.content // empty')

    if [ -n "$reasoning" ]; then
      if [ "$thinking" = false ]; then
        printf '<reasoning>\n'
        thinking=true
      fi
      printf '%s' "$reasoning"
    fi

    if [ -n "$content" ]; then
      if [ "$thinking" = true ]; then
        printf '\n</reasoning>\n\n<answer>\n'
        thinking=false
      fi
      printf '%s' "$content"
    fi
  done

printf '\n'

DeepSeek V4 Pro کے ورژن

DeepSeek V4 Pro کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔

version
deepseek-v4-pro