DeepSeek 真的是開源的嗎?

CometAPI
AnnaJun 2, 2025
DeepSeek 真的是開源的嗎?

DeepSeek 是一家中國人工智慧新創公司,其 R1 推理模型於 2025 年初首次登上新聞頭條,引發了關於開源人工智慧現狀及其更廣泛影響的激烈爭論。儘管人們的注意力主要集中在其令人印象深刻的性能——堪比 OpenAI 和阿里巴巴等美國公司的模型——但 DeepSeek 是否真正在精神和實踐上「開源」仍然存在疑問。本文將深入探討 DeepSeek 的最新進展,探討其開源資質,將其與 GPT-4.1 等模型進行比較,並評估其對全球人工智慧格局的影響。

DeepSeek 是什麼以及它是如何出現的?

DeepSeek 的起源和野心

DeepSeek 最初名為杭州 DeepSeek 人工智慧基礎技術研究有限公司,由梁文峰(也被稱為梁文峰)擔任首席願景家。 DeepSeek 的理念與許多矽谷新創公司不同:DeepSeek 並不追求快速商業化,而是專注於研究效率和成本效益。儘管 DeepSeek 的開發受到美國高階 AI 晶片出口管制的限制,但到 2025 年初,其 R1 模型已因其在數學推理和程式碼生成方面達到或超越領先基準而備受矚目。

推理模型的突破

2025年1月,DeepSeek 在 MIT 許可證(一種開源許可證)下發布了 R1 模型,並聲稱 R79.8 在 AIME 1 上取得了“2024% 的 Pass@1 成績,略微超過 OpenAI-o1217-97.3”,並在“MATH-500 上取得了 1%,1 成績相當 2,029. 96.3 XNUMX XNUMX 成績。在程式設計任務方面,RXNUMX 在 Codeforces 上獲得了 XNUMX 的 Elo 評分,優於 XNUMX% 的人類參與者,這表明該模型不僅僅是一個理論練習,而是一個適用於實際應用的高性能工具。

透過利用混合專家 (MoE) 層等技術,以及在較弱的 AI 晶片上進行訓練(這是貿易限制所要求的),DeepSeek 顯著降低了訓練成本。觀察家指出,這種做法不僅挑戰了對頂級硬體的固有依賴,還給整個行業帶來了“衝擊波”,導致英偉達的市值在單一交易日內縮水約 600 億美元——“創下美國股市歷史上單家公司的最大跌幅”。

DeepSeek 真的是開源的嗎?

許可和可用性

DeepSeek 的 R1 模型於 2025 年 1 月在 Hugging Face 上根據 MIT 許可證發布,允許不受限制地進行商業使用、修改和重新分發模型權重和相關程式碼。從技術上講,這種許可選擇將 R1 歸類為開源項目,但在實踐中,會出現細微差別。雖然模型權重和推理程式碼是公開的,但它尚未發布完整的訓練資料集或精確的訓練流程。這種遺漏引發了人們的疑問,即它是否符合與共享端到端可重複性細節的項目相同的「完全」開源精神。例如,雖然任何人都可以下載和微調 R5,000,但如果沒有專有資料和叢集配置(例如,使用 100 個 AXNUMX GPU 的 Fire-Flyer 叢集),他們就無法複製 DeepSeek 的原始訓練程式。

訓練資料的透明度

開源純粹主義者通常不僅強調模型權重和程式碼的可用性,還強調訓練資料、預處理腳本和評估基準的透明度。就其本身而言,該公司分享了一些高層細節——例如使用「R1 生成的合成數據」來微調提煉後的變體,以及在 R1-Zero 中融入基於規則的獎勵函數——但卻隱瞞了數據來源和數據管理流程的具體細節。如果沒有這些信息,外部研究人員就無法全面審查潛在的偏見、數據污染或意外的隱私洩露,從而留下了關於該模型的倫理和安全隱患的疑問。

社區參與和分叉

自從開源發布以來,DeepSeek-R1 在 Hugging Face 等平台上吸引了許多分支和社群驅動的實驗。開發者報告稱,他們調整了規模較小的「精簡」版本(參數數量從 1.5 億到 70 億不等),使其能夠在消費級 GPU 等商用硬體上運行,從而擴大了存取權限。然而,目前尚未出現完全獨立的從零開始重現 R1 的挑戰,部分原因是所需的計算資源龐大,且缺乏公開共享的原始資料集。與催生了多個社區官方復現工作的 LLaMA 不同,DeepSeek 的「開源」聲明主要在於提供權重,而非實現完全由社區主導的研究透明度。

DeepSeek 與其他 AI 型號相比如何?

與 OpenAI o1、o3 和 GPT-4.1 進行基準測試

DeepSeek-R1 的效能指標使其躋身頂級推理模型之列。根據 LiveCodeBench(由加州大學柏克萊分校、麻省理工學院和康乃爾大學開發)的內部基準測試,DeepSeek 更新後的 R1-0528 在程式碼生成方面的排名略低於 OpenAI 的 o4-mini 和 o3,但超過了 xAI 的 Grok 3-mini 和阿里巴巴的 Qwen 3 mini。同時,OpenAI 於 4.1 年 14 月 2025 日發布的 GPT-4 擁有一百萬個標記上下文窗口,與其前身 GPT-XNUMXo 相比,在編碼、指令追蹤和長上下文任務方面均表現出色。

當 R1 與 GPT-4.1 進行比較時,出現了幾個因素:

  • 程式碼和數學基準測驗的表現:R1 在 AIME 79.8 上的 Pass@1 率為 2024%,在 MATH-97.3 上的得分為 500%,略高於 o1。而 GPT-4.1 在編碼任務(經 SWE-bench 驗證)上的得分約為 54.6%,在長上下文任務上的得分為 72%。這些指標雖然令人印象深刻,但無法與 R1 的專業推理基準直接比較。
  • 上下文視窗GPT-4.1 支援多達一百萬個詞條,使其能夠一次處理整本書或冗長的程式碼庫。 DeepSeek 的 R1 不符合這種上下文長度,而是專注於較短輸入的推理和推理效率。
  • 成本效益:在 Hugging Face 上,R1 的 API 存取成本比 OpenAI 的 o95 低高達 1%,這對於預算有限的新創公司和研究人員來說極具吸引力。 GPT-4.1 的基本定價為每百萬輸入代幣 2 美元,每百萬輸出代幣 8 美元,迷你版和奈米版的價格甚至更低(分別為 0.40 美元/1.60 美元和 0.10 美元/0.40 美元)。 DeepSeek 的精簡模型可以在筆記型電腦上運行,在硬體需求階段提供了另一層次的成本節約。

架構差異

DeepSeek 的 R1 模型採用了混合專家 (MoE) 架構,其中大部分網路僅在需要時才激活,從而顯著降低了推理計算成本。這些 MoE 層與非同步通訊庫(例如, hfreduce) 和 Fire-Flyer DDP 框架,使得 DeepSeek 能夠在貿易限制下跨越較弱的硬體集群擴展推理任務。

相較之下,GPT-4.1 在整個網路中使用密集的 Transformer 層來處理一百萬個 token 的上下文視窗。雖然這在長上下文任務上帶來了卓越的性能,但它也需要大量的計算來進行訓練和推理,因此相對於 GPT-4.1 mini 和 nano 等較小的模型,GPT-4.1 的定價更具優勢。

DeepSeek 的開源方法有何影響?

對全球人工智慧競爭的影響

DeepSeek 的開源發布打破了矽谷傳統的專有模型和資料封鎖模式。 DeepSeek 以 MIT 許可證公開 R1,挑戰了高效能人工智慧必須保持封閉或獨家授權的觀念。其直接影響顯而易見:美國科技巨頭調整了定價(例如,OpenAI 以更低的價格推出了 GPT-4.1 mini 和 nano),並加速開發以推理為中心的自有模型,例如 o4-mini,以保持市場份額。業內評論人士稱 DeepSeek 的出現可能成為美國人工智慧領域的“斯普尼克時刻”,標誌著對基礎人工智慧能力的霸權控制權的轉變。

DeepSeek 的開源策略也影響了創投的情緒。一些投資者擔心,如果中國開源替代方案激增,支持美國人工智慧公司的收益可能會遞減,而另一些人則認為這是實現全球人工智慧研究合作多元化的機會。創投家馬克安德森稱讚 R1 是「最令人驚嘆、最令人印象深刻的突破之一」和「獻給世界的厚禮」。同時,OpenAI 將於 4.1 年 2025 月發布的 GPT-XNUMX 可以被視為對 DeepSeek 成本效益型開源模式的應對之策,表明開放獲取無需犧牲尖端性能。

安全和隱私問題

儘管人們對開源人工智慧民主化充滿熱情,但 DeepSeek 的起源卻在隱私倡議者和政府機構中敲響了警鐘。 2025 年 2025 月,韓國個人資訊保護委員會 (PIPC) 確認其線上服務將韓國用戶資料發送到位元組跳動位於中國的伺服器,導致該委員會下令禁止下載新的應用程序,直至合規性問題得到解決。 XNUMX 年 XNUMX 月下旬,由於雲端儲存資料庫配置錯誤,超過一百萬個敏感條目(聊天訊息、API 金鑰和系統日誌)被洩露,這加劇了人們對 DeepSeek 資料安全實踐的擔憂。

鑑於中國法規強制企業與政府部門分享數據,一些西方政府和企業仍對將DeepSeek整合到關鍵工作流程中持謹慎態度。儘管DeepSeek已採取措施保護其基礎設施(例如,在一小時內修復暴露的資料庫),但人們仍懷疑其可能存在後門或被濫用於影響力行動。 《連線》雜誌報道稱,DeepSeek線上服務將資料發送至其所在國“可能為其面臨更嚴格的審查埋下伏筆”,歐洲和美國的監管機構也暗示將根據《通用資料保護規範》(GDPR)和《加州消費者隱私法案》(CCPA)框架進行更嚴格的審查。

對硬體和基礎設施成本的影響

DeepSeek 能夠在次優硬體上訓練和部署高效能推理模型,這為更廣泛的 AI 基礎設施市場帶來了連鎖反應。透過展示 MoE 層和最佳化的並行性(例如, HaiScale DDP由於 DeepSeek 能夠提供與全密集模型相當的推理精度,它促使各大雲端服務供應商(微軟 Azure、AWS 和Google雲端)開始評估整合 DeepSeek 的最佳化技術。根據報道,微軟和亞馬遜已開始將 DeepSeek-R1 納入其 AI 服務目錄,以滿足尋求 GPT-4.1 或 o1 API 低成本替代方案的客戶的需求。

此外,作為歷史上佔據主導地位的 GPU 供應商,NVIDIA 也為了應對 MoE 驅動的效率提升,強調了專用硬體(例如支援 HBM3 的 GPU 和 NVLink 拓撲),以保持競爭優勢。 NVIDIA 股價在股價上漲後的波動凸顯了演算法效率的突破如何重塑硬體需求預測。因此,即使沒有發布專有硬件,DeepSeek 也間接影響了未來 AI 加速器的發展路線圖。

最新的 R1-0528 更新揭示了 DeepSeek 對開放性的哪些承諾?

R1-0528 中的技術改進

DeepSeek 於 28 年 2025 月 1 日發布了 R0528-1 更新,承諾在數學推理、編程任務以及緩解幻覺(AI 生成信息中的錯誤)方面實現顯著改進。儘管 DeepSeek 將此版本描述為“小規模試驗升級”,但在加州大學柏克萊分校、麻省理工學院和康奈爾大學的 LiveCodeBench 上進行的基準測試表明,R0528-3 的性能與 OpenAI 的 o4 和 oXNUMX-mini 模型相比毫不遜色。此次更新也重申了其透明的開源政策,並在公告發布後不久就在 Hugging Face 上發布了新的權重和推理程式碼,進一步強化了其對社群驅動開發和協作優化的承諾。

社區反應及回饋

開發者社群對 R1-0528 做出了積極的回應,稱其降低了幻覺率並提高了輸出的邏輯一致性。 Hugging Face 和 GitHub 等論壇上的討論表明,研究人員非常欣賞其在不犧牲 MIT 授權寬鬆性的前提下獲得的切實效能提升。然而,一些貢獻者對訓練資料的不透明性以及國家指令對微調的潛在影響表示擔憂,並強調僅靠開源許可並不能保證完全透明。這些對話強調了持續的社區參與的必要性,以確保其開源精神能夠轉化為可審計、值得信賴的人工智慧系統。

結論

DeepSeek 進軍開源 AI 領域,重新定義了人們對可近性、效能和成本效益的期望。雖然其 R1 模型在技術上遵循 MIT 許可證開源,但由於缺乏完整的訓練資料和流程透明度,使其難以被歸類為「完全」開源。儘管如此,DeepSeek 的成就——在硬體限制下訓練出強大的推理模型並使其廣泛可用——在全球 AI 界既引發了興奮,也引發了謹慎的審視。

與 OpenAI 的 GPT-4.1 進行比較,揭示了一個微妙的局面:DeepSeek 在定向推理任務和成本敏感型場景下表現出色,而 GPT-4.1 憑藉其龐大的上下文窗口和廣泛的基準優勢,成為高端企業應用的理想之選。隨著 DeepSeek 開發其 R2 模型並擴大與雲端服務提供者的合作,其命運將取決於如何解決資料隱私問題、確保法規合規性,以及是否可能在其研究過程中實現更高的透明度。

最終,DeepSeek 的崛起凸顯了開源 AI 不再只是理論上的理想,而是一股重塑競爭的實踐力量。透過挑戰根深蒂固的既有企業,DeepSeek 加速了創新週期,促使老牌企業和新進業者重新思考其開發、授權和部署 AI 系統的方式。在這種動態環境中——GPT-4.1 設定了一個基準,DeepSeek-R1 設定了另一個基準——開源 AI 的未來比以往任何時候都更加光明,也更加動盪。

入門

CometAPI 提供了一個統一的 REST 接口,在一致的端點下聚合了數百個 AI 模型,並具有內建的 API 金鑰管理、使用配額和計費儀表板。您無需處理多個供應商 URL 和憑證,只需將用戶端指向基本 URL 並在每個請求中指定目標模型。

開發者可以存取DeepSeek的API,例如DeepSeek-V3(型號名稱: deepseek-v3-250324) 和 Deepseek R1 (型號名稱: deepseek-r1-0528)通過 彗星API.首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。

首次接觸 CometAPI? 開始免費 $1 試用 並讓 Sora 完成最艱鉅的任務。

我們迫不及待地想看看您建造了什麼。如果感覺有什麼不對勁,請點擊回饋按鈕 - 告訴我們哪裡出了問題,這是最快的改進方法。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣