DeepSeek-V4-Flash 的技術規格
| 項目 | 詳細資訊 |
|---|---|
| 模型 | DeepSeek-V4-Flash |
| 提供方 | DeepSeek |
| 系列 | DeepSeek-V4 preview series |
| 架構 | 專家混合(MoE) |
| 總參數量 | 284B |
| 啟用參數 | 13B |
| 上下文長度 | 1,000,000 tokens |
| 精度 | FP4 + FP8 mixed |
| 推理模式 | Non-think, Think, Think Max |
| 發布狀態 | 預覽模型 |
| 授權條款 | MIT License |
什麼是 DeepSeek-V4-Flash?
DeepSeek-V4-Flash 是 DeepSeek 的 V4 系列中以效率為重點的預覽模型。它採用 Mixture-of-Experts 的語言模型架構,對於其規模而言具有相對較小的活躍參數占用,這有助於在支援超大的 1M-token 上下文視窗的同時保持響應迅速。
DeepSeek-V4-Flash 的主要特性
- 百萬級上下文: 該模型支援 1,000,000-token 的上下文視窗,適用於超長文檔、大型程式碼庫與多步驟的代理會話。
- 效率優先的 MoE 設計: 使用 284B 總參數,但每次請求僅有 13B 參數被啟用,旨在實現更快速且更高效的推論。
- 三種推理模式: Non-think、Think、Think Max,可在任務更困難時,於速度與更深入的推理之間作取捨。
- 強大的長上下文架構: 根據 DeepSeek,V4 系列結合了 Compressed Sparse Attention 與 Heavily Compressed Attention,以提升長上下文的效率。
- 在程式與代理行為方面具競爭力: 模型卡報告在多項程式與代理型基準測試上表現強勁,包括 HumanEval、SWE Verified、Terminal Bench 2.0 與 BrowseComp。
- 開放權重與本地部署: 發布內容包含模型權重、本地推理指南與 MIT License,使自我託管與實驗變得可行。
DeepSeek-V4-Flash 的基準表現
官方模型卡的部分結果顯示,DeepSeek-V4-Flash 在多項核心基準上相較 DeepSeek-V3.2-Base 有所提升:
| 基準 | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
在推理與代理相關的表格中,Flash 變體在終端與軟體任務上也有不錯的表現:Flash Max 在 Terminal Bench 2.0 上達到 56.9、在 SWE Verified 上達到 79.0,但在最困難、知識密集與代理型任務上仍落後於更大型的 Pro 模型。
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| 模型 | 最佳適用 | 權衡 |
|---|---|---|
| DeepSeek-V4-Flash | 快速、長上下文工作、程式助理與高吞吐量代理流程 | 在純知識與最複雜的代理任務上略遜於 Pro |
| DeepSeek-V4-Pro | 最高能力需求的任務、更深入的推理與更困難的代理工作流程 | 比 Flash 更重,且對效率的取向較弱 |
| DeepSeek-V3.2 | 用於比較與遷移規劃的較舊基準 | 在官方表格中的基準表現低於 V4-Flash |
DeepSeek-V4-Flash 的典型使用情境
- 長文檔分析:適用於合約、研究包、支援知識庫與內部 wiki。
- 程式助理:需要檢視大型程式碼庫、跨多個檔案遵循指令,並持續維護上下文。
- 代理工作流程:需要模型進行推理、呼叫工具並反覆迭代且不中斷脈絡。
- 企業級聊天系統:受益於超大上下文視窗與低門檻部署。
- 本地原型部署:適用於在正式上線前評估 DeepSeek-V4 行為的團隊。
如何存取並使用 Deepseek v4 Flash API
步驟 1:註冊並取得 API Key
登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得介面的存取憑證 API key。在個人中心的 API token 處點擊 “Add Token”,取得 token key:sk-xxxxx 並提交。
步驟 2:向 deepseek v4 flash API 發送請求
選擇 “deepseek-v4-flash” 端點發送 API 請求並設定 request body。請求方法與 request body 可從我們網站的 API 文件獲取。我們的網站也提供 Apifox 測試以便於使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。可在哪裡呼叫: Anthropic Messages 格式與 Chat 格式。
在 content 欄位中插入您的問題或請求——模型將對此作出回應。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理後,API 會返回任務狀態與輸出資料。可透過標準參數啟用串流、提示快取或長上下文處理等功能。