什麼是 DeepSeek-Reasoner?
DeepSeek-Reasoner 是 DeepSeek 以推理為優先的模型之推理(或「思考」)模式/API 名稱(目前與 DeepSeek-V3.2 系列對齊)。它旨在在輸出最終答案之前產生明確的思維鏈(CoT)——也就是說,模型會有意生成內部的逐步推理,並透過 API 暴露(或可被暴露),以便調用方檢視或蒸餾。DeepSeek 將 Reasoner 變體定位為其非思考聊天模型的「思考」對應版本,並將其用於多步推理、數學、程式編寫與 Agent 工作流程。
主要功能(面向使用者)
- 明確的思維鏈(CoT)輸出。 API 會返回單獨的
reasoning_content欄位,其中包含模型的內部逐步推理,與最終的content並列。這旨在提升可檢視性與下游 Agent 邏輯的可用性。 - 「思考」與「聊天」模式。
deepseek-reasoner(思考模式)與deepseek-chat(非思考模式)相互區別;兩者均升級至 V3.2 代。 - 大型上下文視窗。 DeepSeek 提供非常長的上下文長度。Reasoner 變體主打長篇推理與 Agent 記憶。
- JSON 輸出/結構化回應。 支援結構化 JSON 輸出,便於程式化使用。
- 聚焦 Agent/Agent 構建者。 V3.2 與 Speciale 變體被明確描述為「為 Agent 而建的以推理為先的模型」。
技術能力
- 輸入:純文字提示、用於工具/Agent 調用的結構化 JSON、檔案或長文檔(透過長上下文);tokens 為標準 NLP tokens。
- 輸出:API 會同時返回
reasoning_content(CoT 文字)與content(最終答案)。API 用戶可透過調整 max_tokens 或回應參數,只請求 CoT 或僅請求最終答案。(實務注意:擷取 CoT 仍可能按模型輸出計費。) - DeepSeek 依循針對推理特化的路線圖迭代:先是基礎大型模型(R1 系列),隨後透過聚焦的後訓練/強化學習(RLHF 風格)與 policy 風格的微調來提升推理深度。團隊也使用蒸餾將推理能力壓縮至更小、可部署的模型。
- V3.2 系列新增了面向工具使用的 agentic 後訓練、混合推理(Think / Non-Think),以及針對更快「思考」迭代的最佳化。
- 推理效率得益於一種稀疏注意力方法(報告稱其為 DeepSeek Sparse Attention — DSA),其將計算聚焦於相關片段,而非在極長序列上做全面的稠密注意力;這降低了處理超長上下文的成本。
如何存取 deepseek-reasoner API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。若您尚未成為我們的用戶,請先註冊。登入您的 CometAPI 控制台。獲取介面存取憑證的 API 金鑰。在個人中心的 API token 點擊「Add Token」,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 deepseek-reasoner API 發送請求
選擇「deepseek-reasoner」端點發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件獲取。我們的網站亦提供 Apifox 測試以便使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基礎 URL 為 Chat 格式。
將您的問題或請求插入 content 欄位——模型將對此作出回應。處理 API 回應以獲得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以獲得生成的答案。處理完成後,API 會回應任務狀態與輸出資料。