DeepSeek V3.1 は、DeepSeek の V シリーズにおける最新のアップグレードであり、高スループット・低コストの汎用インテリジェンスとエージェント的なツール利用を目的とした、「思考/非思考」ハイブリッド 大規模言語モデルです。OpenAI スタイルの API 互換性を維持し、より賢いツール呼び出しを追加し、同社によれば生成速度の向上とエージェントの信頼性改善を実現しています。
基本機能(提供内容)
- デュアル推論モード: deepseek-chat(非思考/高速)と deepseek-reasoner(思考/より強力なチェーン・オブ・ソート/エージェントスキル)。UI にはエンドユーザー向けの「DeepThink」トグルが用意されています。
- 長文脈: 公式資料とコミュニティの報告は、V3 系列における128k トークンのコンテキストウィンドウを強調しています。これにより、非常に長いドキュメントのエンドツーエンド処理が可能になります。
- ツール/エージェント処理の改善: ツール呼び出しの信頼性、マルチステップのエージェントワークフロー、プラグイン/ツール統合を狙った学習後最適化。
技術詳細(アーキテクチャ、学習、実装)
学習コーパスと長文脈エンジニアリング。 Deepseek V3.1 のアップデートは、既存の V3 チェックポイントに対する2 段階の長文脈拡張を強調しています。公開情報によれば、32k と 128k の拡張フェーズに多量の追加トークンが割り当てられており(拡張ステップには数千億トークンが用いられたと DeepSeek は報告)、リリースでは大きなコンテキスト運用を支えるためトークナイザー設定も更新されました。
モデル規模と推論向けのマイクロスケーリング。 公開情報とコミュニティ報告にはパラメータ数に若干の相違が見られます(新規リリースではよくある傾向)。一部のサードパーティのインデクサやミラーは、実行時の記述において約 671B パラメータ(うち 37B がアクティブ)とし、他のコミュニティ要約ではハイブリッド推論アーキテクチャの名目上の規模を約 685Bとしています。
推論モードとエンジニアリング上のトレードオフ。 Deepseek V3.1 は実用的な 2 種の推論モードを公開しています。deepseek-chat(標準的なターンベースのチャットに最適化、低レイテンシ)と deepseek-reasoner(チェーン・オブ・ソートや構造化推論を優先する「思考」モード)。
制限事項とリスク
- ベンチマークの成熟度と再現性: 多くの性能主張は初期段階で、コミュニティ主導または選択的なものです。独立かつ標準化された評価はまだ追いついていません。(リスク: 誇大主張)
- 安全性とハルシネーション: 他の大規模 LLM 同様、Deepseek V3.1 にはハルシネーションおよび有害コンテンツのリスクがあります。より強力な推論モードは、時に「自信があるが誤った」多段の出力を生成することがあります。重要な出力にはセーフティレイヤーと人手によるレビューを適用してください。(ベンダーや独立ソースはいずれもハルシネーションの解消を主張していません。)
- 推論コストとレイテンシ: リーズニングモードは能力と引き換えにレイテンシが増大します。大規模なコンシューマ推論ではコスト増につながります。オープンで安価・高速なモデルへの市場の反応は変動的になり得るとの指摘もあります。
代表的で魅力的なユースケース
- 長文書の分析と要約: 法務、R&D、文献レビュー — 128k トークンのウィンドウを活用してエンドツーエンドの要約を実施。
- エージェントワークフローとツールのオーケストレーション: 複数ステップのツール呼び出し(API、検索、計算機)を要する自動化。Deepseek V3.1 の学習後エージェント調整は、ここでの信頼性向上を意図しています。
- コード生成とソフトウェア支援: 初期ベンチマーク報告では高いプログラミング性能が強調されています。人の監督のもとでのペアプロ、コードレビュー、生成タスクに適しています。
- コスト/レイテンシの選択が重要なエンタープライズ導入: 会話型アシスタントには低コスト・高速の chat モードを、深い推論が求められるオフラインまたはプレミアム用途には reasoner を選択。
CometAPI から Deepseek V3.1 API を呼び出す方法
CometAPI における deepseek v3.1 の API 料金(公式価格から 20% オフ):
| 入力トークン | $0.44 |
| 出力トークン | $1.32 |
必要な手順
- cometapi.com にログインしてください。未登録の場合は、先に登録してください
- インターフェースのアクセス認証 API キーを取得します。個人センターの API トークンで「Add Token」をクリックし、トークンキー: sk-xxxxx を取得して提出します。
- 本サイトの URL を取得: https://api.cometapi.com/
使い方
- “
deepseek-v3.1“ / “deepseek-v3-1-250821” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエスト方法とリクエストボディは当社ウェブサイトの API ドキュメントで取得できます。利便性のため Apifox テストも提供しています。 - <YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えます。
- モデルが応答する質問やリクエストを content フィールドに挿入します。
- . API 応答を処理して生成結果を取得します。
API 呼び出し
CometAPI は完全互換の REST API を提供しており、移行をシームレスにします。主な詳細は API doc:
- Core Parameters:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint:
https://api.cometapi.com/v1/chat/completions - Model Parameter: “
deepseek-v3.1“ / “deepseek-v3-1-250821“ - Authentication:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
CometAPI_API_KEYを自分のキーに置き換えてください。base URL に注意してください。
Python
from openai import OpenAI
client = OpenAI(
api_key=os.environ,
base_url="https://api.cometapi.com/v1/chat/completions" # important
)
resp = client.chat.completions.create(
model="deepseek-v3.1",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize this PDF in 5 bullets."}
],
temperature=0.3,
response_format={"type": "json_object"} # for structured outputs
)
print(resp.choices.message.content)
こちらも参照 Grok 4
