如何存取 DeepSeek-V3.2-Exp API

CometAPI
AnnaOct 2, 2025
如何存取 DeepSeek-V3.2-Exp API

DeepSeek 發布了 實驗 模型稱為 DeepSeek-V3.2-Exp on 2025 年 9 月 29 日,引入了一種新的稀疏注意力機制(DeepSeek Sparse Attention,簡稱 DSA),旨在大幅降低長上下文工作負載的推理成本,同時該公司將 API 價格降低了約一半。本指南介紹了該模型的概念、架構/功能亮點、如何存取和使用 API(附程式碼範例)、與先前的 DeepSeek 模型的比較,以及如何在生產環境中解析和處理其回應。

什麼是 DeepSeek-V3.2-Exp?

DeepSeek-V3.2-Exp 是 DeepSeek V3 軌道的實驗性迭代版本。該版本於 2025 年 9 月下旬發布,定位為「中間」階段,用於驗證針對擴展上下文長度的架構優化,而非原始準確率的重大飛躍。其核心創新點在於: DeepSeek 稀疏注意力 (DSA),一種注意力模式,選擇性地關注長輸入的部分內容,以減少計算和內存成本,同時旨在保持輸出質量與 V3.1-Terminus 相當。

為什麼它在實踐中很重要:

  • 長語境任務的成本: DSA 的目標是降低注意力的二次方成本,從而減少超長輸入(例如多重文件檢索、長文本記錄、大型遊戲世界)的計算量。對於典型的長上下文用例,API 使用成本顯著降低。
  • 相容性和可訪問性: DeepSeek API 使用與 OpenAI 相容的請求格式,因此許多現有的 OpenAI SDK 工作流程可以快速適應。

DeepSeek V3.2-Exp 的主要功能和架構是什麼?

什麼是 DeepSeek 稀疏注意力 (DSA) 以及它是如何運作的?

DSA 是 細粒度稀疏注意力 該方案旨在選擇性地關注標記,而不是在整個上下文中計算密集注意力。簡而言之:

  • 此模型動態地選擇每個層或區塊中需要關注的標記子集,從而減少長輸入長度的 FLOP。
  • 此選擇旨在保留推理任務的「重要」背景,利用學習到的選擇策略和路由啟發式方法的組合。

DSA 是 V3.2-Exp 的核心創新,旨在保持輸出品質接近密集注意力模型,同時降低推理成本,尤其是在上下文長度增加的情況下。發行說明和模式頁面強調,訓練配置與 V3.1-Terminus 保持一致,因此基準指標的差異反映的是稀疏注意力機制,而非訓練的整體變化。

V3.2-Exp 還附帶哪些其他架構/功能?

  • 混合模式(思考與非思考): DeepSeek 公開了兩個模型 ID: deepseek-chat (不加思考/快速回覆)和 deepseek-reasoner (可以揭示思路鍊或中間推理內容的思考模式)。這些模式讓開發人員可以選擇速度,而不是明確的推理透明度。
  • 非常大的上下文視窗: V3.x 系列支援非常大的上下文(V3 系列在當前更新中提供了 DeepSeek 128K 上下文選項),使其適用於多文件工作流程、長日誌和知識密集型代理。
  • JSON 輸出與嚴格函數呼叫(測試版): API 支援 response_format 可以強制 JSON 輸出的物件(以及嚴格的函數呼叫 beta 版本)。當你需要可預測的機器可解析輸出以進行工具整合時,這會很有幫助。
  • 流式和推理令牌: API 支援串流回應,對於推理模型來說,支援不同的推理內容標記(通常在 reasoning_content),它允許您顯示或審核模型的中間步驟。

如何透過 CometAPI 存取和使用 DeepSeek-V3.2-Exp API?

DeepSeek 有意保留了 OpenAI 風格的 API 格式,因此現有的 OpenAI SDK 或相容工具可以透過不同的基礎 URL 重新定位。我建議使用 CometAPI 存取 DeepSeek-V3.2-Exp,因為它價格低廉,並且是一個多模態聚合網關。 DeepSeek 會公開與 V3.2-Exp 行為對應的模型名稱。範例:

DeepSeek-V3.2-Exp-thinking — 推理/思考模式映射到 V3.2-Exp。

DeepSeek-V3.2-Exp-thinking — 非推理/聊天模式對應到 V3.2-Exp。

我如何進行身份驗證以及基本 URL 是什麼?

  1. 取得 API 金鑰 從 CometAPI 開發者控制台(在其網站上申請)。
  2. 基本網址: (https://api.cometapi.com or https://api.cometapi.com/v1 用於 OpenAI 相容路徑)。 OpenAI 相容性意味著許多 OpenAI SDK 只需進行少量更改即可重新指向 DeepSeek。

我應該使用哪個模型 ID?

  • DeepSeek-V3.2-Exp-thinking— 思考模式,展現思路/推理內容。在最新發行說明中,兩者均已升級至 V3.2-Exp。
  • DeepSeek-V3.2-Exp-nothinking — 無需思考,反應更快,典型的聊天/完成用法。

範例:簡單的 curl 請求(聊天完成)

curl -s https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $cometapi_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v3.2-exp",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Summarize the attached meeting transcript in 3 bullet points."}
    ],
    "max_tokens": 512,
    "stream": false
  }'

範例:Python(OpenAI 相容客戶端模式)

此模式在將 OpenAI 用戶端指向 CometAPI 基本 URL(或使用 CometAPI 的 SDK)後生效。以下範例遵循 DeepSeek 的文件樣式:

import os
import requests

API_KEY = os.environ
url = "https://api.deepseek.com/v1/chat/completions"
headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

payload = {
    "model": "deepseek-v3.2-exp",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Extract action items from the following notes..."}
    ],
    "max_tokens": 800
}

r = requests.post(url, headers=headers, json=payload)
r.raise_for_status()
print(r.json())

無需特殊 SDK 但如果你已經使用 OpenAI 的 SDK,你通常可以重新配置 base_url api_key 並保持相同的呼叫模式。

進階用法:啟用推理或 reasoning_content

如果您需要模型的內部思路鏈(用於審核、提煉或提取中間步驟),請切換到 DeepSeek-V3.2-Exp-thinking。 “ reasoning_content 欄位(以及相關流或令牌)在回應中可用於推理模式;API 文件提供 reasoning_content 作為回應字段,用於檢查最終答案之前生成的 CoT。注意:由於這些令牌是模型輸出的一部分,因此公開這些令牌可能會影響計費。

串流更新和部分更新

  • 使用 "stream": true 在透過 SSE(伺服器發送事件)接收令牌增量的請求中。
  • stream_options include_usage 讓您調整使用元資料在串流中出現的方式和時間(有助於增量 UI)。

DeepSeek-V3.2-Exp 與先前的 DeepSeek 模型相比如何?

V3.2-Exp 與 V3.1-Terminus 對比

  • 主要區別: V3.2-Exp 引入了稀疏注意力機制,以減少長上下文的計算量,同時保持其餘訓練方案與 V3.1 保持一致。這使得 DeepSeek 能夠更清晰地比較效率提升。 ()
  • 基準測試: 公開說明表明,V3.2-Exp 在許多推理/編碼任務上的表現與 V3.1 大致相當,同時在長上下文中明顯更便宜;請注意,特定任務仍然可能出現輕微的回歸,具體取決於注意力稀疏性如何與所需的標記交互相互作用。

V3.2-Exp 與 R1 / 舊版本

  • R1 和 V3 系列遵循不同的設計目標(R1 歷來著重於不同的架構權衡和某些分支的多模態容量)。 V3.2-Exp 是 V3 系列的改良版,著重於長上下文和吞吐量。如果您的工作負載主要集中在單輪原始準確率基準上,那麼差異可能不大;如果您在多文檔管線上操作,V3.2-Exp 的成本概況可能更具吸引力。

如何存取 DeepSeek-V3.2-Exp API


哪裡可以找到克勞德桑奈特 4.5

CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。

開發人員可以訪問 DeepSeek V3.2 擴充版 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。

準備出發了嗎? → 立即註冊 CometAPI !

結論

DeepSeek-V3.2-Exp 是一個務實的實驗版本,旨在使長上下文工作更經濟、更可行,同時保持 V3 等級的輸出品質。對於處理長文件、抄本或多文檔推理的團隊來說,它值得嘗試:API 遵循 OpenAI 風格的介面,使整合變得簡單,它不僅突出了 DSA 機制,還帶來了顯著的價格降低,從而改變了大規模構建的經濟計算。與任何實驗模型一樣,全面評估、儀器測試和分階段部​​署至關重要。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣