Can DeepSeek-V4-Pro handle 1M-token documents in the API?

Yes. DeepSeek-V4-Pro with a 1M-token context length and up to 384K output tokens, so it is built for very long documents and multi-file workflows.

Does DeepSeek-V4-Pro support thinking mode and tool calls?

Yes. DeepSeek-V4-Pro supports both thinking and non-thinking modes, plus JSON output and tool calls.

When should I use DeepSeek-V4-Pro instead of DeepSeek-V4-Flash?

Use DeepSeek-V4-Pro when accuracy and agentic coding matter more than speed. DeepSeek says V4-Flash is the faster, more economical option, while V4-Pro is stronger on coding and broader agent evaluations.

Is DeepSeek-V4-Pro good for coding agents like Claude Code or OpenCode?

Yes. DeepSeek-V4-Pro configured for Claude Code and OpenCode, with `reasoningEffort` set to `max` and thinking enabled.

How do I integrate DeepSeek-V4-Pro with OpenAI-compatible SDKs?

Use the CometAPI base URL `https://api.cometapi.com` with the model name `deepseek-v4-pro`

Is DeepSeek-V4-Pro suitable for search-heavy research workflows?

Yes. V4-Pro performs strongly on search and retrieval-style tasks, and it outperforms DeepSeek-V3.2 by a substantial margin in both objective and subjective Q&A categories.

API DeepSeek V4 Pro Terjangkau | text-to-text

Spesifikasi teknis

Item	DeepSeek-V4-Pro
Provider	DeepSeek
API model name	deepseek-v4-pro
Base URLs	https://api.deepseek.com and https://api.deepseek.com/anthropic
Input type	Teks
Output type	Teks, panggilan alat, keluaran penalaran
Context length	1,000,000 tokens
Max output	384,000 tokens
Reasoning modes	Non-thinking, thinking (default)
Agent/coding defaults	reasoning_effort dapat disetel tinggi; permintaan agen yang kompleks dapat menggunakan max
Supported features	JSON Output, Tool Calls, Chat Prefix Completion (beta), FIM Completion (beta in non-thinking mode)
Local/open-weights release	1.6T total parameters, 49B activated parameters, FP4 + FP8 mixed precision
License (model card)	MIT
Reference model card	DeepSeek-V4-Pro preview on Hugging Face

Apa itu DeepSeek-V4-Pro?

DeepSeek-V4-Pro adalah anggota yang lebih kuat dari keluarga pratinjau V4 milik DeepSeek. Model card resmi menggambarkannya sebagai model MoE berparameter 1.6T dengan 49B parameter yang diaktifkan dan jendela konteks satu juta token, ditujukan untuk pekerjaan pengetahuan jangka panjang, pembuatan kode, dan tugas agen. Dokumentasi API mengeksposnya melalui permukaan chat-completions standar DeepSeek dan mendukung gaya SDK OpenAI maupun Anthropic.

Fitur utama

Konteks sejuta token: DeepSeek mendokumentasikan panjang konteks 1M token, yang membuat model ini cocok untuk kumpulan dokumen sangat besar, repositori, dan sesi agen multi-langkah.
Dua mode penalaran: API mendukung mode non-thinking dan thinking; thinking adalah default, dan dokumen mencatat bahwa permintaan agen yang kompleks seperti Claude Code atau OpenCode dapat secara otomatis menggunakan upaya max.
Mendukung panggilan alat: Mode thinking DeepSeek mendukung tool call, yang penting untuk agen yang memerlukan pencarian, operasi file, atau fungsi eksternal.
Efisiensi konteks panjang: Model card menyatakan V4 menggunakan desain atensi hibrida dengan Compressed Sparse Attention dan Heavily Compressed Attention untuk mengurangi komputasi konteks panjang dan biaya KV cache dibanding V3.2. citeturn980363view2
Fokus pada pengkodean dan penalaran: DeepSeek menyatakan mode penalaran V4-Pro-Max meningkatkan tolok ukur pengkodean dan menutup banyak celah dengan model tertutup terkemuka pada tugas penalaran dan agensi. citeturn980363view2
Fleksibilitas SDK: Dapat diakses melalui chat completions yang kompatibel dengan OpenAI standar atau melalui endpoint yang kompatibel dengan Anthropic milik DeepSeek untuk alur kerja berorientasi alat.

Performa benchmark

Model card resmi DeepSeek melaporkan hasil evaluasi berikut untuk keluarga model dasar dan untuk himpunan perbandingan V4-Pro-Max. Dalam tabel model dasar, V4-Pro mencetak lebih tinggi daripada V3.2-Base pada beberapa tolok ukur pengetahuan dan konteks panjang, termasuk MMLU-Pro (73.5 vs. 65.5), FACTS Parametric (62.6 vs. 27.1), dan LongBench-V2 (51.5 vs. 40.2).

Benchmark	V3.2-Base	V4-Flash-Base	V4-Pro-Base
MMLU-Pro (EM)	65.5	68.3	73.5
FACTS Parametric (EM)	27.1	33.9	62.6
HumanEval (Pass@1)	62.8	69.5	76.8
LongBench-V2 (EM)	40.2	44.7	51.5

Model card yang sama juga menunjukkan V4-Pro-Max tetap kompetitif dengan model frontier teratas pada tugas tertentu. Misalnya, ia membukukan 87.5 pada MMLU-Pro, 57.9 pada SimpleQA-Verified, 90.1 pada GPQA Diamond, dan 67.9 pada Terminal Bench 2.0 dalam tabel perbandingan yang dipublikasikan.

DeepSeek-V4-Pro vs DeepSeek-V4-Flash vs DeepSeek-V3.2

Model	Kesesuaian terbaik	Konteks	Catatan
DeepSeek-V4-Pro	Penalaran berat, pengkodean, agen, dokumen besar	1M	Model V4 terbesar, 49B parameter aktif, kapasitas keseluruhan terkuat dalam seri. citeturn980363view2turn980363view0
DeepSeek-V4-Flash	Lebih cepat, lebih ringan untuk penggunaan umum	1M	Model 284B/13B yang lebih kecil, tetap mendukung thinking dan panggilan alat. citeturn980363view2turn980363view0
DeepSeek-V3.2	Baseline konteks panjang generasi sebelumnya	128K dalam dokumen API sebelumnya; V4 menggunakan desain konteks 1M yang berbeda	Berguna sebagai titik acuan untuk peningkatan efisiensi; model card V4-Pro melaporkan pengurangan besar pada FLOPs konteks panjang dan KV cache dibanding V3.2. citeturn321011view1turn980363view2

Kasus penggunaan terbaik

Asisten pengkodean skala repositori dan alat refaktorisasi
Analisis dan sintesis dokumen panjang
Agen yang menggunakan alat dan membutuhkan penalaran multi-giliran
Alur kerja dukungan teknis yang diuntungkan oleh memori panjang dan keluaran terstruktur
Tugas pengetahuan berbahasa Mandarin dan multibahasa di mana model card menunjukkan performa benchmark yang kuat

Cara mengakses dan menggunakan Deepseek v4 pro API

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, harap daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim Permintaan ke Deepseek v4 pro API

Pilih endpoint “deepseek-v4-pro” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Di mana memanggilnya: format Anthropic Messages dan format Chat.

Masukkan pertanyaan atau permintaan Anda ke kolom content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran. Aktifkan fitur seperti streaming, caching prompt, atau penanganan konteks panjang melalui parameter standar.

Harga untuk DeepSeek V4 Pro

Jelajahi harga kompetitif untuk DeepSeek V4 Pro, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana DeepSeek V4 Pro dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

Harga Comet (USD / M Tokens)	Harga Resmi (USD / M Tokens)	Diskon
Masukan:$0.416/M Keluaran:$0.832/M	Masukan:$0.52/M Keluaran:$1.04/M	-20%

Kode contoh dan API untuk DeepSeek V4 Pro

Akses kode sampel komprehensif dan sumber daya API untuk DeepSeek V4 Pro guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh DeepSeek V4 Pro dalam proyek Anda.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("
</reasoning>

<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."},
    ],
    stream=True,
    max_tokens=256,
    reasoning_effort="high",
    extra_body={"thinking": {"type": "enabled"}},
)

thinking = False
for chunk in stream:
    delta = chunk.choices[0].delta
    reasoning = (delta.model_extra or {}).get("reasoning_content") or ""
    content = delta.content or ""

    if reasoning:
        if not thinking:
            print("<reasoning>")
            thinking = True
        print(reasoning, end="", flush=True)

    if content:
        if thinking:
            print("\n</reasoning>\n\n<answer>")
            thinking = False
        print(content, end="", flush=True)

print()

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const stream = await client.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Which number is greater, 9.11 or 9.8? Answer with one sentence." },
  ],
  thinking: { type: "enabled" },
  reasoning_effort: "high",
  max_tokens: 256,
  stream: true,
});

let thinking = false;
for await (const chunk of stream) {
  const delta = chunk.choices[0]?.delta ?? {};
  const reasoning = delta.reasoning_content ?? "";
  const content = delta.content ?? "";

  if (reasoning) {
    if (!thinking) {
      process.stdout.write("<reasoning>\n");
      thinking = true;
    }
    process.stdout.write(reasoning);
  }

  if (content) {
    if (thinking) {
      process.stdout.write("\n</reasoning>\n\n<answer>\n");
      thinking = false;
    }
    process.stdout.write(content);
  }
}

process.stdout.write("\n");

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

if ! command -v jq >/dev/null 2>&1; then
  echo "jq is required to parse streamed reasoning_content in this shell example." >&2
  exit 1
fi

thinking=false

curl --silent --no-buffer --location --request POST "https://api.cometapi.com/v1/chat/completions" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data-raw '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Which number is greater, 9.11 or 9.8? Answer with one sentence."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "high",
    "max_tokens": 256,
    "stream": true
  }' | while IFS= read -r line; do
    case "$line" in
      data:\ *) data=${line#data: } ;;
      *) continue ;;
    esac

    [ "$data" = "[DONE]" ] && break

    reasoning=$(printf '%s' "$data" | jq -r '.choices[0].delta.reasoning_content // empty')
    content=$(printf '%s' "$data" | jq -r '.choices[0].delta.content // empty')

    if [ -n "$reasoning" ]; then
      if [ "$thinking" = false ]; then
        printf '<reasoning>\n'
        thinking=true
      fi
      printf '%s' "$reasoning"
    fi

    if [ -n "$content" ]; then
      if [ "$thinking" = true ]; then
        printf '\n</reasoning>\n\n<answer>\n'
        thinking=false
      fi
      printf '%s' "$content"
    fi
  done

printf '\n'

Versi DeepSeek V4 Pro

Alasan DeepSeek V4 Pro memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.

version
deepseek-v4-pro