DeepSeek 發布 DeepSeek R1-0528:新功能和效能

CometAPI
AnnaMay 29, 2025
DeepSeek 發布 DeepSeek R1-0528:新功能和效能

中國人工智慧新創公司 DeepSeek 今天發布了其旗艦 R1 推理模型的漸進式更新,該模型被指定為 DeepSeek R1-0528,在 Hugging Face 平台上。根據 MIT 許可證發佈於 2025 年 5 月 28 日此次更新基於 1 年 2025 月發布的原始 R1 版本,該版本首次證明了開源語言模型在效能和成本效益方面可以與專有產品相媲美。儘管 R0528-XNUMX 在內部被描述為“小規模試驗升級”,但它在推理複雜性、程式碼合成準確性和模型可靠性方面都有了實質性的增強。

DeepSeek R1 更新亮點

擴展的情境“思考”

利用混合專家 (MoE) 層和優化的注意力機制,R1-0528 可以在長時間輸入的情況下維持更深層的推理鏈,使其非常適合需要延長上下文保留的工作流程 ()。

提高可靠性和一致性

開發人員報告稱,在重複提示中輸出更加穩定,答案品質的差異更小,處理長而上下文豐富的查詢時超時錯誤更少。

增強推理

底層架構仍然 671億個參數利用與原始 deepseek R1 相同的注意力機制,但具有更精細的權重和更長的「思考」能力。

內部評估表明,在邏輯密集型基準測試中取得了可衡量的進步,並且在複雜查詢中實現了更連貫的多步驟推理。

卓越的程式碼生成

LiveCodeBench 基準測試報告顯示,人工智慧輔助編碼取得了明顯進步:R1-0528 現已成為程式碼任務中頂級的中國原始模型,僅次於 OpenAI 的 o4-mini-high、o3-high 和 o4-mini-medium 配置。

在編碼準確率和效率上優於阿里巴巴的Qwen 3和Anthropic的Claude 3.7。


技術性能

指標/基準R1-0528R1(2025 年 XNUMX 月)領先的專有技術
法學碩士綜合成績中位數 69.45〜67.8OpenAI o3/o4-mini(~70-72)
程式碼生成排名中國模特兒第一名;全球排名第 1中國模特兒中排名第2OpenAI o4-mini 和 o3 背後;領先 Grok 3 mini
上下文視窗163 個代幣(≈840 × 原始代幣)81個代幣與 OpenAI o3-high 相當
推理效率37 b 有效參數 / 671 b 總計與其他大型開源

基準平台:

LiveCodeBench: 在程式設計任務上,R1-0528 的位置略低於 OpenAI 的 o4-mini 和 o3,超過了 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。

複合 LLM 聚合體(MMLU、HumanEval、GSM8K、BBH、TruthfulQA): 平均表現為 69.45,使其與 Claude 和 Gemini 產品處於相當的距離(Analytics Vidhya)。

DeepSeek 發布 DeepSeek R1-0528:新功能和效能

記憶與背景:

擴展的上下文視窗支援程式碼庫、長格式文件和多輪對話,同時最大程度地減少連貫性的損失。

開源許可和可訪問性

R1-0528 在 Hugging Face 上發佈時沒有公開模型卡,但其權重和配置文件在 MIT許可證,允許不受限制的商業使用和社區驅動的修改。 DeepSeek 的授權選擇延續了其「開放權重」傳播策略,確保研究機構和新創公司都可以毫無阻礙地整合該模型。


市場影響與競爭格局

DeepSeek 於 1 年 2025 月推出的 R3 打破了人們對尖端人工智慧所需成本和規模的普遍假設,促使美國競爭對手調整定價並推出更輕的型號(例如 OpenAI 的 o1 Mini)。憑藉 R0528-XNUMX,DeepSeek 重新確立了其作為領先開源競爭者的地位,在效能和價格方面與 OpenAI、Google Gemini、阿里巴巴和 Anthropic 競爭。


未來展望

自今年 1 月推出以來,DeepSeek R1 已經引起了主要 AI 參與者的策略性回應——最顯著的影響是 OpenAI 的價格調整和Google的 Gemini 模型路線圖。 R0528-XNUMX 更新預計將加劇競爭壓力,特別是對於那些尋求具有成本效益且高性能的專有 LLM 替代方案的公司而言。同時,美國監管機構對 DeepSeek 的快速發展提出了國家安全擔憂,凸顯了開源人工智慧擴散的地緣政治風險。

入門

CometAPI 提供了一個統一的 REST 接口,在一致的端點下聚合了數百個 AI 模型,並具有內建的 API 金鑰管理、使用配額和計費儀表板。而不需要處理多個供應商 URL 和憑證。

開發人員可以存取最新的 DeepSeek R1 API (型號名稱: deepseek-r1-0528)通過 彗星API.首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已登入CometAPI並取得API key,CometAPI中的價格:

  • 輸入代幣:0.44 美元/百萬個代幣
  • 輸出代幣:1.752 美元/百萬代幣
SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣