モデル料金エンタープライズ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
会社
会社概要エンタープライズ
リソース
AIモデルブログ変更履歴サポート
利用規約プライバシーポリシー
© 2026 CometAPI · All rights reserved
Home/Models/DeepSeek/DeepSeek V4 Flash
D

DeepSeek V4 Flash

入力:$0.12/M
出力:$0.24/M
DeepSeek V4 Flashは、DeepSeekによる効率性を最適化したMixture-of-Expertsモデルで、総パラメータ数は284B、アクティブなパラメータ数は13B、1M-tokenのコンテキストウィンドウに対応しています。高速な推論と高スループットのワークロード向けに設計されており、強力な推論能力とコーディング性能を維持します。
新着
商用利用
Playground
概要
機能
料金プラン
API

DeepSeek-V4-Flash の技術仕様

項目詳細
モデルDeepSeek-V4-Flash
提供元DeepSeek
シリーズDeepSeek-V4 preview series
アーキテクチャMixture-of-Experts(MoE)
総パラメータ数284B
有効化パラメータ数13B
コンテキスト長1,000,000 tokens
数値精度FP4 + FP8 mixed
推論モードNon-think, Think, Think Max
リリース状況Preview model
ライセンスMIT License

DeepSeek-V4-Flash とは?

DeepSeek-V4-Flash は、DeepSeek の V4 シリーズにおける効率重視のプレビューモデルです。Mixture-of-Experts 言語モデルとして構築され、モデル全体の規模に対してアクティブなフットプリントを比較的小さく保つことで、高い応答性を維持しつつ、非常に大きい 1M トークンのコンテキストウィンドウをサポートします。

DeepSeek-V4-Flash の主な特長

  • 1,000,000 トークンのコンテキスト: 1,000,000 トークンのコンテキストウィンドウをサポートし、非常に長い文書、大規模なコードベース、多段のエージェントセッションに適しています。
  • 効率最優先の MoE 設計: 総パラメータは 284B ですが、リクエストごとに有効化されるパラメータは 13B のみで、より高速かつ効率的な推論を狙った構成です。
  • 3 つの推論モード: Non-think、Think、Think Max により、タスクの難易度に応じてスピードとより深い推論をトレードオフできます。
  • 強力な長コンテキストアーキテクチャ: V4 シリーズは、Compressed Sparse Attention と Heavily Compressed Attention を組み合わせ、長いコンテキストでの効率を高めたとされています。
  • 競争力のあるコーディングとエージェント挙動: モデルカードでは、HumanEval、SWE Verified、Terminal Bench 2.0、BrowseComp などのコーディングおよびエージェント系ベンチマークで強力な結果が報告されています。
  • オープンなウェイトとローカル展開: リリースにはモデルのウェイト、ローカル推論のガイダンス、MIT License が含まれており、セルフホスティングや実験を現実的にします。

DeepSeek-V4-Flash のベンチマーク性能

公式のモデルカードに掲載された選択結果では、DeepSeek-V4-Flash は複数の中核ベンチマークで DeepSeek-V3.2-Base を上回っています。

ベンチマークDeepSeek-V3.2-BaseDeepSeek-V4-Flash-BaseDeepSeek-V4-Pro-Base
AGIEval (EM)80.182.683.1
MMLU (EM)87.888.790.1
MMLU-Pro (EM)65.568.373.5
HumanEval (Pass@1)62.869.576.8
LongBench-V2 (EM)40.244.751.5

推論およびエージェント系の比較では、Flash バリアントはターミナルやソフトウェアタスクでも堅実な結果を示しており、Flash Max は Terminal Bench 2.0 で 56.9、SWE Verified で 79.0 を達成しています。一方で、知識依存度が高く最も複雑なエージェント性タスクでは、より大きい Pro モデルに依然として及びません。

DeepSeek-V4-Flash と DeepSeek-V4-Pro と DeepSeek-V3.2 の比較

モデル最適用途トレードオフ
DeepSeek-V4-Flash高速処理、長コンテキスト作業、コーディング支援、高スループットのエージェントフロー純粋な知識タスクや最も複雑なエージェント性タスクでは Pro にわずかに劣る
DeepSeek-V4-Pro最高性能を要するタスク、より深い推論、より難度の高いエージェントワークフローFlash よりも重く、効率重視ではない
DeepSeek-V3.2比較・移行計画のための旧来ベースライン公式テーブル上では V4-Flash よりベンチマーク性能が低い

DeepSeek-V4-Flash の代表的なユースケース

  1. 長文書の分析(契約書、リサーチパック、サポートナレッジベース、社内 Wiki など)
  2. コーディングアシスタント(大規模リポジトリの把握、複数ファイルにわたる指示追従、コンテキスト維持)
  3. エージェントワークフロー(ツール呼び出しや反復を伴う推論でも、文脈を失わずに進行)
  4. エンタープライズ向けチャットシステム(非常に大きなコンテキストウィンドウと低摩擦な導入の恩恵)
  5. ローカルでの試験的デプロイ(本番強化前に DeepSeek-V4 の挙動を評価したいチーム向け)

How to access and use Deepseek v4 Flash API

Step 1: Sign Up for API Key

cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI console にサインインします。インターフェースのアクセス認証用 API キーを取得します。パーソナルセンターの API token で “Add Token” をクリックし、トークンキー:sk-xxxxx を取得して送信します。

Step 2: Send Requests to deepseek v4 flash API

“deepseek-v4-flash” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドおよびリクエストボディは当社サイトの API ドキュメントから取得します。当社サイトでは Apifox によるテストも提供しています。あなたのアカウントから取得した実際の CometAPI キーで <YOUR_API_KEY> を置き換えてください。呼び出し場所: Anthropic Messages フォーマットおよび Chat フォーマット。

質問やリクエストを content フィールドに挿入します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

Step 3: Retrieve and Verify Results

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データで応答します。標準パラメータを用いて、ストリーミング、プロンプトキャッシュ、長コンテキスト処理などの機能を有効化します。

よくある質問

Can DeepSeek-V4-Flash API handle 1M-token prompts?

Yes. DeepSeek-V4-Flash with a 1M-token context length, so it is built for very long prompts, documents, and codebases.

Does DeepSeek-V4-Flash API support thinking mode and non-thinking mode?

Yes. DeepSeek-V4-Flash supports both non-thinking and thinking modes, with thinking enabled by default.

Does DeepSeek-V4-Flash API support JSON output and tool calls?

Yes. DeepSeek lists both JSON Output and Tool Calls as supported features for DeepSeek-V4-Flash.

When should I use DeepSeek-V4-Flash API instead of DeepSeek-V4-Pro?

Use V4-Flash when you want the V4-series context window and agent features but do not need the larger Pro model. The official report shows V4-Pro is stronger on several knowledge-heavy benchmarks, so Pro is the better fit for maximum capability.

How do I integrate DeepSeek-V4-Flash API with OpenAI SDKs via CometAPI?

Use the OpenAI-compatible base URL https://api.cometapi.com and set the model to deepseek-v4-flash. DeepSeek also documents an Anthropic-compatible endpoint, so you can reuse common OpenAI/Anthropic SDK patterns with the same API surface.

Is DeepSeek-V4-Flash API suitable for coding agents like Claude Code or OpenCode?

Yes, and the V4 family is designed for the same agent-style API surface and reasoning controls.

What are DeepSeek-V4-Flash API's known limitations?

It is smaller than DeepSeek-V4-Pro, so it trails Pro on some knowledge-heavy and complex agentic tasks. DeepSeek also labels the V4 series as a preview release, so teams should test it on their own workloads.

DeepSeek V4 Flashの料金

DeepSeek V4 Flashの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。DeepSeek V4 Flashがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
入力:$0.12/M
出力:$0.24/M
入力:$0.15/M
出力:$0.3/M
-20%

DeepSeek V4 FlashのサンプルコードとAPI

DeepSeek V4 Flashの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでDeepSeek V4 Flashの潜在能力を最大限に活用できるよう支援します。
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
    stream=False,
    extra_body={
        "thinking": {"type": "enabled"},
        "reasoning_effort": "high",
    },
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
    stream=False,
    extra_body={
        "thinking": {"type": "enabled"},
        "reasoning_effort": "high",
    },
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Hello!" },
  ],
  thinking: { type: "enabled" },
  reasoning_effort: "high",
  stream: false,
});

console.log(completion.choices[0].message.content);

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Hello!"
      }
    ],
    "thinking": {
      "type": "enabled"
    },
    "reasoning_effort": "high",
    "stream": false
  }'