DeepSeek 發布了 實驗 模型稱為 DeepSeek-V3.2-Exp on 2025 年 9 月 29 日,引入了一種新的稀疏注意力機制(DeepSeek Sparse Attention,簡稱 DSA),旨在大幅降低長上下文工作負載的推理成本,同時該公司將 API 價格降低了約一半。本指南介紹了該模型的概念、架構/功能亮點、如何存取和使用 API(附程式碼範例)、與先前的 DeepSeek 模型的比較,以及如何在生產環境中解析和處理其回應。
什麼是 DeepSeek-V3.2-Exp?
DeepSeek-V3.2-Exp 是 DeepSeek V3 軌道的實驗性迭代版本。該版本於 2025 年 9 月下旬發布,定位為「中間」階段,用於驗證針對擴展上下文長度的架構優化,而非原始準確率的重大飛躍。其核心創新點在於: DeepSeek 稀疏注意力 (DSA),一種注意力模式,選擇性地關注長輸入的部分內容,以減少計算和內存成本,同時旨在保持輸出質量與 V3.1-Terminus 相當。
為什麼它在實踐中很重要:
- 長語境任務的成本: DSA 的目標是降低注意力的二次方成本,從而減少超長輸入(例如多重文件檢索、長文本記錄、大型遊戲世界)的計算量。對於典型的長上下文用例,API 使用成本顯著降低。
- 相容性和可訪問性: DeepSeek API 使用與 OpenAI 相容的請求格式,因此許多現有的 OpenAI SDK 工作流程可以快速適應。
DeepSeek V3.2-Exp 的主要功能和架構是什麼?
什麼是 DeepSeek 稀疏注意力 (DSA) 以及它是如何運作的?
DSA 是 細粒度稀疏注意力 該方案旨在選擇性地關注標記,而不是在整個上下文中計算密集注意力。簡而言之:
- 此模型動態地選擇每個層或區塊中需要關注的標記子集,從而減少長輸入長度的 FLOP。
- 此選擇旨在保留推理任務的「重要」背景,利用學習到的選擇策略和路由啟發式方法的組合。
DSA 是 V3.2-Exp 的核心創新,旨在保持輸出品質接近密集注意力模型,同時降低推理成本,尤其是在上下文長度增加的情況下。發行說明和模式頁面強調,訓練配置與 V3.1-Terminus 保持一致,因此基準指標的差異反映的是稀疏注意力機制,而非訓練的整體變化。
V3.2-Exp 還附帶哪些其他架構/功能?
- 混合模式(思考與非思考): DeepSeek 公開了兩個模型 ID:
deepseek-chat(不加思考/快速回覆)和deepseek-reasoner(可以揭示思路鍊或中間推理內容的思考模式)。這些模式讓開發人員可以選擇速度,而不是明確的推理透明度。 - 非常大的上下文視窗: V3.x 系列支援非常大的上下文(V3 系列在當前更新中提供了 DeepSeek 128K 上下文選項),使其適用於多文件工作流程、長日誌和知識密集型代理。
- JSON 輸出與嚴格函數呼叫(測試版): API 支援
response_format可以強制 JSON 輸出的物件(以及嚴格的函數呼叫 beta 版本)。當你需要可預測的機器可解析輸出以進行工具整合時,這會很有幫助。 - 流式和推理令牌: API 支援串流回應,對於推理模型來說,支援不同的推理內容標記(通常在
reasoning_content),它允許您顯示或審核模型的中間步驟。
如何透過 CometAPI 存取和使用 DeepSeek-V3.2-Exp API?
DeepSeek 有意保留了 OpenAI 風格的 API 格式,因此現有的 OpenAI SDK 或相容工具可以透過不同的基礎 URL 重新定位。我建議使用 CometAPI 存取 DeepSeek-V3.2-Exp,因為它價格低廉,並且是一個多模態聚合網關。 DeepSeek 會公開與 V3.2-Exp 行為對應的模型名稱。範例:
DeepSeek-V3.2-Exp-thinking — 推理/思考模式映射到 V3.2-Exp。
DeepSeek-V3.2-Exp-thinking — 非推理/聊天模式對應到 V3.2-Exp。
我如何進行身份驗證以及基本 URL 是什麼?
- 取得 API 金鑰 從 CometAPI 開發者控制台(在其網站上申請)。
- 基本網址: (
https://api.cometapi.comorhttps://api.cometapi.com/v1用於 OpenAI 相容路徑)。 OpenAI 相容性意味著許多 OpenAI SDK 只需進行少量更改即可重新指向 DeepSeek。
我應該使用哪個模型 ID?
DeepSeek-V3.2-Exp-thinking— 思考模式,展現思路/推理內容。在最新發行說明中,兩者均已升級至 V3.2-Exp。DeepSeek-V3.2-Exp-nothinking— 無需思考,反應更快,典型的聊天/完成用法。
範例:簡單的 curl 請求(聊天完成)
curl -s https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $cometapi_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v3.2-exp",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize the attached meeting transcript in 3 bullet points."}
],
"max_tokens": 512,
"stream": false
}'
範例:Python(OpenAI 相容客戶端模式)
此模式在將 OpenAI 用戶端指向 CometAPI 基本 URL(或使用 CometAPI 的 SDK)後生效。以下範例遵循 DeepSeek 的文件樣式:
import os
import requests
API_KEY = os.environ
url = "https://api.deepseek.com/v1/chat/completions"
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
payload = {
"model": "deepseek-v3.2-exp",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Extract action items from the following notes..."}
],
"max_tokens": 800
}
r = requests.post(url, headers=headers, json=payload)
r.raise_for_status()
print(r.json())
無需特殊 SDK 但如果你已經使用 OpenAI 的 SDK,你通常可以重新配置 base_url api_key 並保持相同的呼叫模式。
進階用法:啟用推理或 reasoning_content
如果您需要模型的內部思路鏈(用於審核、提煉或提取中間步驟),請切換到 DeepSeek-V3.2-Exp-thinking。 “ reasoning_content 欄位(以及相關流或令牌)在回應中可用於推理模式;API 文件提供 reasoning_content 作為回應字段,用於檢查最終答案之前生成的 CoT。注意:由於這些令牌是模型輸出的一部分,因此公開這些令牌可能會影響計費。
串流更新和部分更新
- 使用
"stream": true在透過 SSE(伺服器發送事件)接收令牌增量的請求中。 stream_optionsinclude_usage讓您調整使用元資料在串流中出現的方式和時間(有助於增量 UI)。
DeepSeek-V3.2-Exp 與先前的 DeepSeek 模型相比如何?
V3.2-Exp 與 V3.1-Terminus 對比
- 主要區別: V3.2-Exp 引入了稀疏注意力機制,以減少長上下文的計算量,同時保持其餘訓練方案與 V3.1 保持一致。這使得 DeepSeek 能夠更清晰地比較效率提升。 ()
- 基準測試: 公開說明表明,V3.2-Exp 在許多推理/編碼任務上的表現與 V3.1 大致相當,同時在長上下文中明顯更便宜;請注意,特定任務仍然可能出現輕微的回歸,具體取決於注意力稀疏性如何與所需的標記交互相互作用。
V3.2-Exp 與 R1 / 舊版本
- R1 和 V3 系列遵循不同的設計目標(R1 歷來著重於不同的架構權衡和某些分支的多模態容量)。 V3.2-Exp 是 V3 系列的改良版,著重於長上下文和吞吐量。如果您的工作負載主要集中在單輪原始準確率基準上,那麼差異可能不大;如果您在多文檔管線上操作,V3.2-Exp 的成本概況可能更具吸引力。

哪裡可以找到克勞德桑奈特 4.5
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以訪問 DeepSeek V3.2 擴充版 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !
結論
DeepSeek-V3.2-Exp 是一個務實的實驗版本,旨在使長上下文工作更經濟、更可行,同時保持 V3 等級的輸出品質。對於處理長文件、抄本或多文檔推理的團隊來說,它值得嘗試:API 遵循 OpenAI 風格的介面,使整合變得簡單,它不僅突出了 DSA 機制,還帶來了顯著的價格降低,從而改變了大規模構建的經濟計算。與任何實驗模型一樣,全面評估、儀器測試和分階段部署至關重要。
