DeepSeek-V3.2

DeepSeek
deepseek-v3.2
輸入:$0.22/M
輸出:$0.35/M
上下文:128K
最大輸出:4K
DeepSeek v3.2 是 DeepSeek V3 系列中最新的正式發佈版本:一個大型、推理優先的開放權重語言模型系列,旨在支援長上下文理解、穩健的 Agent/工具運用、高階推理、程式設計與數學。

DeepSeek v3.2 是什麼?

DeepSeek v3.2 是 DeepSeek V3 系列中最新的生產版本:一個以推理為先的開放權重語言模型家族,專為長上下文理解、穩健的代理/工具使用、高級推理、程式碼與數學而設計。此次發佈包含多個變體(生產版 V3.2 與高效能的 V3.2-Speciale)。該專案強調透過名為 DeepSeek Sparse Attention (DSA) 的新型稀疏注意力機制以及代理/「思考」工作流程(「在工具使用中的思考」)來實現具成本效益的長上下文推理。

主要功能(高層概覽)

  • DeepSeek Sparse Attention (DSA): 一種稀疏注意力機制,旨在於長上下文情境下顯著降低計算量,同時保留長距離推理能力。(核心研究主張;用於 V3.2-Exp。)
  • 代理式思考 + 工具使用整合: V3.2 強調將「思考」嵌入工具使用:模型在呼叫工具時可在推理/思考模式與非思考(一般)模式間運作,提升多步驟任務與工具協同的決策品質。
  • 大規模代理資料合成管線: DeepSeek 報告稱其訓練語料與代理合成管線涵蓋數千個環境、數萬條複雜指令,以提升互動式任務的魯棒性。
  • DeepSeek Sparse Attention (DSA): DSA 是在 V3.2 系列中引入的細粒度稀疏注意力方法(首先於 V3.2-Exp),將注意力複雜度由天真式的 O(L²) 降至 O(L·k)(k ≪ L)風格,為每個查詢 token 選擇更小集合的鍵/值 token。結果是在非常長的上下文(128K)下大幅降低記憶體/計算,讓長上下文推理的成本實質下降。
  • Mixture-of-Experts (MoE) 主幹與 Multi-head Latent Attention (MLA): V3 系列使用 MoE 以高效率提升容量(名義參數量大,但每個 token 的啟用受限),並結合 MLA 方法以維持品質並控制計算量。

技術規格(精簡)

  • 名義參數範圍:671B – 685B(依變體而定)。
  • 上下文窗口(文件化參考): 在 vLLM/參考配置中為 128,000 tokens(128K)。
  • 注意力: DeepSeek Sparse Attention (DSA) + MLA;在長上下文下降低注意力複雜度。
  • 數值與訓練精度: 提供 BF16 / F32 與壓縮量化格式(F8_E4M3 等)以供分發。
  • 架構家族: 以 MoE(專家混合)為主幹,實現每 token 的計算節省。
  • 輸入/輸出: 標準分詞文字輸入(支援聊天/訊息格式);支援工具呼叫(工具使用 API 原語),同時支援互動式聊天呼叫與透過 API 的程式化補全。
  • 提供的變體: v3.2v3.2-Exp(實驗性,DSA 首次亮相)、v3.2-Speciale(以推理為先,短期僅供 API)。

基準表現

高計算資源的 V3.2-Speciale 在多項推理/數學/程式碼基準上達到與當前高端模型持平或更優,並在特定高難度數學題集上取得頂尖成績。論文本指出在部份推理基準上可與 GPT-5 / Kimi K2 等模型相當,且相較於早期的 DeepSeek R1/V3 基準有明顯提升:

  • AIME: 從 70.0 提升至 87.5(Δ +17.5)。
  • GPQA: 71.5 → 81.0(Δ +9.5)。
  • LCB_v6: 63.5 → 73.3(Δ +9.8)。
  • Aider: 57.0 → 71.6(Δ +14.6)。

與其他模型的比較(高層)

  • 相較於 GPT-5 / Gemini 3 Pro(公開說法): DeepSeek 作者與多家媒體宣稱 Speciale 變體在特定推理與程式任務上可達到持平或更優,同時強調成本效率與開放授權為差異化優勢。
  • 相較於開源模型(Olmo、Nemotron、Moonshot 等): DeepSeek 強調代理式訓練與 DSA 是長上下文效率的關鍵差異點。

代表性使用場景

  • 代理式系統/協同編排: 多工具代理(API、網頁爬蟲、程式碼執行連接器)受益於模型層級的「思考」+ 明確工具呼叫原語。
  • 長文檔推理/分析: 法律文件、大型研究語料、會議逐字稿——長上下文變體(128k tokens)允許在一次呼叫中保留非常大的上下文。
  • 複雜數學與程式碼助理: 根據廠商基準,V3.2-Speciale 主打高級數學推理與大規模程式碼除錯。
  • 對成本敏感的生產部署: DSA + 價格策略旨在降低高上下文工作負載的推理成本。

如何開始使用 DeepSeek v3.2 API

DeepSeek v3.2 在 CometAPI 的定價,較官方價優惠 20%:

輸入 Token$0.22
輸出 Token$0.35

必要步驟

  • 登入 cometapi.com。若尚非我們的使用者,請先註冊
  • 取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token key:sk-xxxxx 並提交。
  • 取得本站的 URL:https://api.cometapi.com/

使用方法

  1. 選擇 “deepseek-v3.2” 端點發送 API 請求並設定請求體。請求方法與請求體可於我們的網站 API 文件獲取。我們的網站也提供 Apifox 測試以供便利。
  2. 將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。
  3. 選擇聊天格式:將你的問題或請求插入 content 欄位——模型將回應該內容。
  4. 處理 API 回應以取得生成的答案。

更多模型