ディープシークV3.1 is the upgrade in DeepSeek’s V-series: a ハイブリッド「思考/非思考」 高スループット、低コストの汎用知能とエージェントツールの使用を目的とした大規模言語モデル。 OpenAIスタイルのAPI互換性、追加 よりスマートなツール呼び出し同社によれば、これにより、生成の高速化とエージェントの信頼性の向上が実現します。
基本機能(提供される機能)
- デュアル推論モード: ディープシークチャット (考えずに/より速く)そして ディープシーク推論者 (思考力 / 思考の連鎖/エージェントスキルの強化)。UIにはエンドユーザー向けの「DeepThink」トグルが表示されます。
- 長いコンテキスト: 公式資料やコミュニティレポートでは、 128kトークン V3ファミリー系統のコンテキストウィンドウ。これにより、非常に長いドキュメントのエンドツーエンド処理が可能になります。
- ツール/エージェントの取り扱いの改善: 信頼性の高いツール呼び出し、マルチステップエージェントワークフロー、プラグイン/ツールの統合を目的としたトレーニング後の最適化。
技術的な詳細(アーキテクチャ、トレーニング、実装)
トレーニングコーパスとロングコンテキストエンジニアリング。 Deepseek V3.1アップデートでは、 2段階のロングコンテキスト拡張 以前のV3チェックポイントに加えて、公開ノートには32kと128kの拡張フェーズに充てられた主要な追加トークンが示されています(DeepSeekは、拡張ステップで数千億のトークンが使用されたと報告しています)。このリリースでは、 トークナイザーの設定 より大きなコンテキスト体制をサポートするため。
推論のためのモデルのサイズとマイクロスケーリング。 公開レポートとコミュニティレポートでは、多少異なるパラメータの集計が行われます(新しいリリースではよくある結果です)。サードパーティのインデックス作成ツールとミラーリスト 約671Bのパラメータ(アクティブ37B) 一部のランタイムの説明では、他のコミュニティの要約では、 約685億 ハイブリッド推論アーキテクチャの公称サイズとして。
推論モードとエンジニアリングのトレードオフ。 Deepseek V3.1 では、XNUMX つの実用的な推論モードが公開されています。 deepseek-chat (標準的なターンベースチャットに最適化され、低遅延) deepseek-reasoner (思考の連鎖と構造化された推論を優先する「思考」モード)。
制限とリスク
- ベンチマークの成熟度と再現性: 多くのパフォーマンスに関する主張は、初期段階、コミュニティ主導、あるいは選択的なものであり、独立した標準化された評価はまだ追いついていない。 (リスク:過剰な主張).
- 安全性と幻覚: 他の大規模LLMと同様に、Deepseek V3.1は幻覚や有害コンテンツのリスクにさらされており、より強力な推論モードでは、 自信はあるが間違っている 複数段階の出力。ユーザーは重要な出力に対して安全レイヤーを適用し、人間によるレビューを行う必要があります。(幻覚の除去を主張するベンダーや独立系情報源はありません。)
- 推論コストとレイテンシ: 推論モードでは、レイテンシと引き換えに処理能力が高められます。大規模な消費者向け推論では、このことがコストの増加につながります。一部の評論家は、オープンで安価、かつ高速なモデルに対する市場の反応は不安定になり得ると指摘しています。
一般的で魅力的なユースケース
- 長文文書の分析と要約: 法律、研究開発、文献レビューなど、エンドツーエンドの要約に 128k トークン ウィンドウを活用します。
- エージェントのワークフローとツールのオーケストレーション: 複数ステップのツール呼び出し(API、検索、計算機など)を必要とする自動化。Deepseek V3.1のトレーニング後エージェントチューニングは、この点における信頼性の向上を目的としています。
- コード生成とソフトウェア支援: 初期のベンチマークレポートでは、強力なプログラミングパフォーマンスが強調されており、ペアプログラミング、コードレビュー、および人間の監視による生成タスクに適しています。
- コスト/レイテンシーの選択が重要となるエンタープライズ展開: 選ぶ チャット 安価で高速な会話アシスタントのためのモードと 推論者 オフラインまたはプレミアムの深い推論タスク向け。
電話方法 Deepseek V3.1 CometAPI からの API
deepseek v3.1 CometAPI の API 価格、公式価格より 20% オフ:
| 入力トークン | $0.44 |
| 出力トークン | $1.32 |
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
deepseek-v3.1「/」deepseek-v3-1-250821” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
API呼び出し
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- コアパラメータ:
prompt,max_tokens_to_sample,temperature,stop_sequences - 終点:
https://api.cometapi.com/v1/chat/completions - モデルパラメータ: 「
deepseek-v3.1「/」deepseek-v3-1-250821「 - 認証:
Bearer YOUR_CometAPI_API_KEY - コンテンツタイプ:
application/json.
交換する
CometAPI_API_KEYキーを使って、 ベースURL.
Python
from openai import OpenAI
client = OpenAI(
api_key=os.environ,
base_url="https://api.cometapi.com/v1/chat/completions" # important
)
resp = client.chat.completions.create(
model="deepseek-v3.1",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize this PDF in 5 bullets."}
],
temperature=0.3,
response_format={"type": "json_object"} # for structured outputs
)
print(resp.choices.message.content)
も参照してください グロク4



