什麼是 DeepSeek v3.2?
DeepSeek v3.2 是 DeepSeek V3 系列中最新的生產版發佈:一個以推理為先的開放權重大型語言模型家族,旨在支援長上下文理解、穩健的代理/工具使用、進階推理、程式與數學。此次發佈包含多個變體(生產版 V3.2 以及高效能的 V3.2-Speciale)。該專案透過一種稱為 DeepSeek Sparse Attention (DSA) 的新型稀疏注意力機制,以及代理/「思考」工作流(“Thinking in Tool-Use”),強調具成本效率的長上下文推理。
主要特性(高層)
- DeepSeek Sparse Attention (DSA): 一種稀疏注意力機制,旨在在長上下文場景中大幅降低計算量,同時保留長距離推理能力。(核心研究主張;用於
V3.2-Exp。) - 代理式思考 + 工具使用整合: V3.2 著重將「思考」嵌入工具使用流程:模型在呼叫工具時可在推理思考模式與非思考(正常)模式間運作,提升多步任務與工具編排中的決策品質。
- 大規模代理資料合成管線: DeepSeek 報告的訓練語料與代理合成管線涵蓋數千個環境與數萬條複雜指令,以提升互動任務的魯棒性。
- DeepSeek Sparse Attention (DSA): DSA 是在 V3.2 系列(首次於
V3.2-Exp)引入的細粒度稀疏注意力方法,將注意力複雜度由天真 O(L²) 降至 O(L·k) 風格(k ≪ L),為每個 query token 選擇較小集合的 key/value token。對於極長上下文(128K),可大幅降低記憶體/計算開銷,實質降低長上下文推理成本。 - Mixture-of-Experts (MoE) 骨幹與 Multi-head Latent Attention (MLA): V3 系列使用 MoE 在效率下提升容量(名義參數量龐大,但每個 token 的啟用受限),並結合 MLA 方法維持品質與控制計算量。
技術規格(簡要)
- 名義參數範圍: 約 671B – 685B(依變體而定)。
- 上下文視窗(文檔參考): 在 vLLM/參考設定中為 128,000 tokens(128K)。
- 注意力機制: DeepSeek Sparse Attention (DSA) + MLA;在長上下文下降低注意力複雜度。
- 數值與訓練精度: 提供 BF16 / F32 與壓縮量化格式(F8_E4M3 等)以供發行。
- 架構家族: MoE(專家混合)骨幹,具每 token 啟用的計算經濟性。
- 輸入/輸出: 標準分詞文字輸入(支援聊天/訊息格式);支援工具呼叫(工具使用 API 原語),同時支援互動式聊天與透過 API 的程式化補全。
- 提供變體:
v3.2、v3.2-Exp(實驗版,DSA 首次引入)、v3.2-Speciale(以推理為先,短期僅限 API)。
基準表現
高算力的 V3.2-Speciale 在多項推理/數學/程式基準上達到與當代高端模型持平或更佳,並在部分頂級數學題集中獲得頂尖成績。預印本強調在選定推理基準上與 GPT-5 / Kimi K2 等模型持平,並相較於早期 DeepSeek R1/V3 基線有明顯改善:
- AIME: 從 70.0 提升至 87.5(Δ +17.5)。
- GPQA: 71.5 → 81.0(Δ +9.5)。
- LCB_v6: 63.5 → 73.3(Δ +9.8)。
- Aider: 57.0 → 71.6(Δ +14.6)。
與其他模型比較(高層)
- 對比 GPT-5 / Gemini 3 Pro(公開聲稱): DeepSeek 作者與多家媒體聲稱 Speciale 變體在部分推理與程式任務上可達到持平或優於對手,同時強調成本效率與開放授權為差異化優勢。
- 對比開放模型(Olmo、Nemotron、Moonshot 等): DeepSeek 強調代理式訓練與 DSA 是長上下文效率的關鍵差異化點。
代表性使用場景
- 代理系統/編排: 多工具代理(API、網頁擷取器、程式執行連接器)受益於模型層級的「思考」+ 明確工具呼叫原語。
- 長文檔推理/分析: 法律文件、大型研究語料、會議逐字稿——長上下文變體(128k tokens)讓你可在單次呼叫中保留超大上下文。
- 複雜數學與程式輔助: 根據廠商基準,
V3.2-Speciale適合進階數學推理與大規模除錯。 - 對成本敏感的生產部署: DSA + 價格策略旨在降低高上下文工作負載的推理成本。
如何開始使用 DeepSeek v3.2 API
DeepSeek v3.2 在 CometAPI 的 API 價格,比官方價便宜 20%:
| Input Tokens | $0.22 |
|---|---|
| Output Tokens | $0.35 |
必要步驟
- 登入 cometapi.com。若尚未成為我們的用戶,請先註冊
- 取得介面的存取憑證 API key。在個人中心的 API token 處點擊 “Add Token”,取得 token 金鑰:sk-xxxxx 並提交。
- 取得此站點的 url: https://api.cometapi.com/
使用方法
- 選擇 “
deepseek-v3.2” 端點發送 API 請求並設定請求體。請求方法與請求體可從我們網站的 API 文檔獲取。我們的網站也提供 Apifox 測試以便使用。 - 將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。
- 選擇 Chat 格式:將你的問題或請求插入 content 欄位——模型將對此做出回應。
- 處理 API 回應以取得生成的答案。