DeepSeek-V4-Flash 的技術規格
| 項目 | 詳細資訊 |
|---|---|
| 模型 | DeepSeek-V4-Flash |
| 提供方 | DeepSeek |
| 系列 | DeepSeek-V4 預覽系列 |
| 架構 | 專家混合 (MoE) |
| 總參數量 | 284B |
| 啟用參數量 | 13B |
| 上下文長度 | 1,000,000 tokens |
| 精度 | FP4 + FP8 混合 |
| 推理模式 | Non-think, Think, Think Max |
| 發布狀態 | 預覽模型 |
| 授權條款 | MIT License |
什麼是 DeepSeek-V4-Flash?
DeepSeek-V4-Flash 是 DeepSeek 在 V4 系列中面向效率的預覽模型。它採用專家混合的語言模型架構,在總體規模下具有相對較小的活躍參數占用,這有助於保持響應迅速,同時仍支援超大的 1M-token 上下文視窗。
DeepSeek-V4-Flash 的主要特性
- 百萬級上下文: 該模型支援 1,000,000-token 的上下文視窗,適用於超長文件、大型程式碼庫以及多步驟的智能體會話。
- 效率優先的 MoE 設計: 總參數量為 284B,但每次請求僅啟用 13B 參數,旨在實現更快、更高效的推理。
- 三種推理模式: Non-think、Think 和 Think Max 可在任務變難時,通過犧牲一定速度換取更深入的推理。
- 強大的長上下文架構: DeepSeek 稱 V4 系列結合了壓縮稀疏注意力與高度壓縮注意力,以提升長上下文效率。
- 具競爭力的程式設計與智能體表現: 模型卡報告在程式與智能體基準上表現出色,包括 HumanEval、SWE Verified、Terminal Bench 2.0 與 BrowseComp。
- 開放權重與本地部署: 發布內容包含模型權重、本地推理指南及 MIT License,使自我託管與實驗更為可行。
DeepSeek-V4-Flash 的基準測試表現
官方模型卡的部分結果顯示,DeepSeek-V4-Flash 在多項核心基準上優於 DeepSeek-V3.2-Base:
| 基準 | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
在推理與智能體相關的表格中,Flash 變體在終端與軟體任務上也取得了不錯的成績,其中 Flash Max 在 Terminal Bench 2.0 上達到 56.9,在 SWE Verified 上達到 79.0;但在最艱難、知識密集與智能體化程度最高的任務上,仍落後於更大型的 Pro 模型。
DeepSeek-V4-Flash 對比 DeepSeek-V4-Pro 與 DeepSeek-V3.2
| 模型 | 最佳適用 | 取捨 |
|---|---|---|
| DeepSeek-V4-Flash | 速度快、長上下文工作、程式輔助與高吞吐量智能體流程 | 在純知識與最複雜的智能體任務上略遜於 Pro |
| DeepSeek-V4-Pro | 最高難度任務、更深層推理與更複雜的智能體流程 | 相較於 Flash 更重,且對效率的取向較低 |
| DeepSeek-V3.2 | 用作對比與遷移規劃的舊基線 | 在官方表格上的基準表現低於 V4-Flash |
DeepSeek-V4-Flash 的典型使用情境
- 針對合約、研究資料包、支援知識庫與內部 Wiki 的長文件分析。
- 需要檢視大型程式碼儲存庫、跨多檔遵循指示並保持上下文持續的程式輔助工具。
- 需要模型進行推理、呼叫工具並反覆迭代且不丟失脈絡的智能體工作流程。
- 受惠於超大上下文視窗與低門檻部署的企業級聊天系統。
- 面向希望在正式上線前評估 DeepSeek-V4 行為的團隊之原型級本地部署。
如何存取並使用 Deepseek v4 Flash API
步驟 1:註冊取得 API Key
登入 cometapi.com。若您尚非我們的使用者,請先註冊。登入您的 CometAPI console。獲取介面的訪問憑證 API key。在個人中心的 API token 處點擊“Add Token”,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 deepseek v4 flash API 發送請求
選擇“deepseek-v4-flash”端點發送 API 請求並設定請求體。請求方法與請求體可在我們網站的 API 文檔中取得。我們也提供 Apifox 測試以便於使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。呼叫位置: Anthropic Messages 格式與 Chat 格式。
將您的問題或請求填入 content 欄位——模型會回應該內容。處理 API 回應以獲取生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以獲取生成的答案。處理完成後,API 會返回任務狀態與輸出資料。可透過標準參數啟用串流、提示快取或長上下文處理等功能。