DeepSeek 更新:有哪些變更、有什麼新內容,以及為何重要

CometAPI
AnnaFeb 15, 2026
DeepSeek 更新:有哪些變更、有什麼新內容,以及為何重要

2026 年 2 月,中國 AI 新創 DeepSeek 推出其線上應用與網頁介面的重大更新,顯示朝向其下一代模型發佈 DeepSeek V4 的動能。儘管此更新先於完整的 V4 模型推出,但因互動行為的改動、長上下文能力,以及為未來潛力所做的準備性測試,已在用戶與業界觀察者之間引發討論。

DeepSeek 以早期版本——尤以 DeepSeek V3.2DeepSeek–R1 為代表——躍上全球舞臺,兼具高任務表現與具成本效益的可擴展性。尤其是 R1 的發佈,在 2025 年初因撼動全球市場並壓低競爭對手股價表現而備受國際關注,展現出 DeepSeek 的顛覆性潛力。

最近的 DeepSeek 更新究竟改了什麼?

這是哪個版本,改動是什麼?

此次更新影響的是 DeepSeek 線上應用與網頁介面,但重要的是,目前尚未影響 API 模型。根據多方消息:

  • 目前的應用更新可視為一次 長上下文結構測試——讓網頁與 App 使用者可獲得最高達 100 萬代幣的上下文支援。這相較於 DeepSeek V3.2 的 API 所提供的約 ~128 K 上下文窗口是一次大幅躍升
  • 此次升級提升了單次對話或任務的有效記憶,使模型能記住並處理更多資訊。有報告指出,這相當於先前記憶容量的 10×——對於多階段與長時推理而言是一項突破。
  • 就版本命名而言,多數公開訊號顯示此次更新是 V4 前置的技術推進——尚非正式的 DeepSeek V4 發佈,但具有強烈的準備性質。

幕後:變化的驅動因素是什麼?

在幕後,DeepSeek 的 GitHub 儲存庫出現以內部識別碼(“MODEL1”)標記的新增項,顯示出與 V3.2 不同的新模型架構。程式碼結構指向記憶體優化技術、FP8 支援增強,以及對 Nvidia 新一代 GPU 架構的相容性——這些皆是 DeepSeek V4 預期的核心組成。

此外,DeepSeek 發佈了關於 “Engram” 的研究,這是一個記憶查詢模組,重新思考大型語言模型如何管理長上下文與關鍵事實。Engram 似乎定位為下一代的基礎技術——可能為 DeepSeek V4 的擴展記憶能力提供支撐。

使用者反應

本次推出引發了各種回應:

  • 一方面,許多使用者對上下文擴展感到興奮,並看好其在更深入互動與更複雜問題解決上的潛力。
  • 另一方面,相當一部分使用者公開評論語氣與對話風格的改變,形容回覆較不具吸引力、同理性降低,或只是比過去更「冷淡」——並引發社群上的熱議。

這種分歧凸顯了 AI 部署的一個重要現實:技術能力的升級可能以意想不到的方式重塑使用者體驗,因此在正式發佈前需要迭代式的打磨。

此次更新的關鍵特性是什麼?

1. 巨量上下文擴展

在網頁/App 互動中支援最高 100 萬代幣的上下文,使 DeepSeek 成為少數能在單一工作階段中整體且不斷裂地理解長篇轉錄、程式碼庫、法律文件或整本書的模型之一。這對真實場景有巨大影響,涵蓋研究與寫作到企業文件分析。

2. 互動風格變化

此次推出明顯改變了 DeepSeek 的對話語氣。許多使用者注意到更新後的模型互動更傾向中性或「平實」——例如使用泛化的稱呼如「User」而非個人化暱稱,並在深度推理模式下提供更為精煉的回覆。這些風格變化在社群平台上引起討論,一些使用者表達不適或驚訝。

3. 知識截點與更新的上下文

App 背後的知識庫已更新至 2025 年 5 月 的資訊;然而 API 服務仍停留在 V3.2,維持先前的知識截點。這種分離顯示 DeepSeek 在完整的 V4 平臺升級前,正試驗漸進式的改進

4. V4 整合的準備

此次更新的一個明確戰略目標,是在即將到來的 DeepSeek V4 前先行測試基礎設施與使用者體驗。大型上下文支援與記憶變更很可能作為真實世界的壓力測試,幫助開發者在正式部署前評估效能、可靠性與回饋。

此次更新包含哪些新的技術特性,它們如何運作?

使用者反應

本次推出引發了各種回應:

  • 一方面,許多使用者對上下文擴展感到興奮,並看好其在更深入互動與更複雜問題解決上的潛力。
  • 另一方面,相當一部分使用者公開評論語氣與對話風格的改變,形容回覆較不具吸引力、同理性降低,或只是比過去更「冷淡」——並引發社群上的熱議。

這種分歧凸顯了 AI 部署的一個重要現實:技術能力的升級可能以意想不到的方式重塑使用者體驗,因此在正式發佈前需要迭代式的打磨。

Engram:具條件的記憶,用於選擇性召回

Engram 是此次更新中的核心理念。概念上,它是一種嵌入於模型架構內的條件式檢索機制:當輸入包含與已儲存 engram 相關的線索時,網路會檢索預先計算的向量表示,以補充(或在某些情況下替代)代價高昂的推理層。其宣稱的益處有二:減少在靜態知識上的重複計算,並提供一種穩健機制,得以在不重新訓練整個模型的情況下更新或修補事實性記憶。技術摘要與開發者預覽顯示,Engram 旨在同時覆蓋程式碼知識(函式庫、函式簽名)與跨文件的事實性召回。

mHC(manifold-constrained hyperconnections)

如預覽與技術說明所述,mHC 是一種旨在將參數交互約束於有意義子流形的架構策略。此種約束可降低必須計算的成對激活數量,從而提升訓練與推理階段的計算效率。其理論在於:在重要之處(與任務相關的流形)保留表達能力,同時削減其他部分的浪費性計算——實質上以相同硬體榨取更多效用。早期描述技術性強且前景可期,但也帶來實作與驗證方面的問題(見下)。

DeepSeek Sparse Attention(DSA)與百萬代幣上下文

最具體的主張之一是透過稀疏注意力技術與動態觸發邏輯,支援 1M+ 代幣的上下文。若能在生產環境中落地,單次推理即可考量整個程式庫、長篇轉錄或多檔案補丁——對程式碼庫摘要、多檔案重構與長對話代理等任務都是一大助力。預覽資料與供應商基準指出其長上下文的吞吐量,並顯示相較某些競品具有顯著效率提升。目前獨立驗證仍有限。

接下來可以期待什麼——此次更新對 DeepSeek v4 有何啟示?

簡言之:這次公開更新既是功能增強,也是更大型發佈的試車場。業界報導與 DeepSeek 自身時程顯示 v4 迫近(目標為農曆新年檔期),並很可能整合長上下文記憶、類 Engram 的專用記憶架構,以及更強的程式設計與代理能力。

以下是在現有變化訊號與業界預期基礎上的審慎、以證據為依據的推測,說明 DeepSeek v4 可能包含的內容。

期望 1——原生長期記憶與索引檢索

鑑於 App 的百萬代幣實驗以及 V3.2 對代理的明確聚焦,v4 很可能會正式化一個記憶子系統,在跨工作階段持久化索引化的知識(而非僅僅擴大的暫時上下文)。該子系統將結合:

  • 對已儲存嵌入的密集檢索。
  • 高效分塊,以平衡延遲與代幣成本。
  • 連貫層,將檢索到的片段縫合進模型的內部上下文窗口。

若得以實作,將使代理在不需每次重新導入資料的情況下,維持持久的個性、使用者偏好與豐富的專案歷史。

期望 2——專門的程式碼生成與多檔案推理

程式能力是 v4 的優先方向,暗示模型優化與基準提升將鎖定開發者工作流程。可期待原生的多檔案重構能力、改進的單元測試合成,以及具工具感知的程式碼生成,能透過沙盒工具鏈執行、評估並迭代程式碼。這正是長上下文模型所能解鎖的任務。

期望 3——更重視代理安全與驗證

鑑於外界對訓練實務的關注,DeepSeek 很可能會優先強化可稽核性:可重現的訓練記錄、更清晰的來源聲明,以及強化的安全緩解措施,能在多步工具互動中標示幻覺或來源缺口。可期待產品功能讓企業客戶與研究人員看見來源證據。

期望 4——具競爭力的路線圖與合作夥伴生態

v4 的路線圖將被國內外廠商視為市場信號。隨著競爭者加速推出更新(大型玩家著眼效率與行動端部署,利基玩家則加碼開源模型),DeepSeek 必須在開放性與防禦性之間取得平衡。若 v4 以更低成本帶來顯著提升,將加速中國及其他市場向「可負擔且高能力」模型的趨勢——也可能加劇跨境政策審視。

總結:不斷壯大的 AI 力量

最近的 DeepSeek 更新標誌著邁向更廣泛的 AI 智能轉型的一個有意義的步伐。雖然公司尚未全面推出 V4,但這些預覽式增強——尤其在上下文長度與互動重構方面——顯示其致力於推動 LLM 能力向前發展。隨著 V4 逼近,DeepSeek 有望成為塑造大規模、具成本效率且高性能 AI下一階段的核心力量。

Developers can access Deepseek API via CometAPI now。開始前,請在 Playground 探索模型能力,並查閱 API guide 以取得詳細指引。存取前,請確保已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方價格的方案,協助你整合。

Ready to Go?→ Sign up fo Deepseek today !

If you want to know more tips, guides and news on AI follow us on VK、 X 和 Discord

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣