DeepSeek R1 使用綜合指南

CometAPI
AnnaMay 13, 2025
DeepSeek R1 使用綜合指南

在快速發展的人工智慧領域,DeepSeek R1 已經成為一個強大的競爭者,憑藉其開源可訪問性和先進的推理能力向老牌企業發起挑戰。 R1由中國人工智慧公司DeepSeek開發,因其性能、成本效益和跨平台適應性而備受關注。本文深入探討了 DeepSeek R1 的複雜性,並深入了解了其功能、應用以及有效利用的最佳實踐。

什麼是 DeepSeek R1?

DeepSeek R1 是 DeepSeek 於 2025 年 671 月推出的大型語言模型 (LLM)。它擁有 1 億個參數,旨在出色地完成需要複雜推理的任務,例如數學、編碼和多語言理解。值得注意的是,DeepSeek R2,000 僅使用 800 塊 Nvidia HXNUMX 晶片開發,突顯了其經濟高效的工程方法。 號

產品特色

  • 開源可訪問性:DeepSeek R1 向公眾免費開放,讓開發人員和研究人員可以探索和自訂其功能。號
  • 思考鏈推理:此模型採用「思路鏈」方法,模擬推理過程,提升複雜任務的準確性。號
  • 多功能能力:DeepSeek R1 在各種任務中表現出色,包括解決數學問題、編寫和調試程式碼、生成類似人類的文字以及分析複雜查詢。號
  • 平台可用性:使用者可以透過其 Web 介面、行動應用程式或 API 存取 DeepSeek R1,從而方便地整合到各種應用程式中。

2025 年 1 月的「RXNUMX 刷新」如何進一步改進該模型?

四月初的更新將上下文長度提升至 200k 個標記,並添加了一個新的「Reflexion」系統提示,指示模型在回應之前運行內部評估過程。發佈到 YouTube 教學的初步社群測試顯示,AGIEval 推理套件的效能提高了 9 個百分點,而推理延遲則下降了 12%。

如何開始使用 DeepSeek R1

DeepSeek R1 可透過多個平台存取:

  • Web界面:使用者可以透過DeepSeek的官方網站與模型互動。號
  • 移動應用:DeepSeek 聊天機器人可在智慧型手機應用程式上使用,提供隨時隨地的存取。 號
  • API集成:開發人員可以使用其 API 將 DeepSeek R1 整合到自訂應用程式中。此外,OpenRouter 等平台為 DeepSeek R1 提供免費的 API 訪問,使用戶無需大量硬體投資即可使用該模型。

“我可以在瀏覽器中使用 DeepSeek R1 嗎?”

是的——DeepSeek 運營著 免費網路聊天 在 app.deepseek.com。建立帳戶後,您每天將收到 100 萬個“思考代幣”,在北京時間午夜補充,大約可以覆蓋 75 次平均長度的聊天。三月的更新還新增了「快速工具」側邊欄,只需單擊即可產生 SQL、Python 程式碼片段和求職信。

實質操作步驟

  1. 立即註冊 使用電子郵件或微信。
  2. 選擇語言 (英文、中文或多語言自動)。
  3. 選擇系統模板—「通用」、「開發人員」或「數學導師」。
  4. 輸入您的提示;按 Shift-Enter 鍵可進行多行輸入。
  5. 檢查推理軌跡 透過切換「想法」—一種獨特的教學功能,可以揭示模型的中間鏈(只有您可見)。

我可以在手機上使用 DeepSeek R1 嗎?

1 年 2025 月,DeepSeek 應用程式在 Apple 的生產力類別中攀升至第一名。行動用戶介面與桌面版相同,但包含最多 20 頁的 PDF 的離線「迷你 LLM」摘要,利用 1.1-B 參數兄弟模型的裝置量化。

硬體效率

值得注意的是,DeepSeek R1 可以在搭載 M3 Ultra 晶片的 Apple Mac Studio 上完全在記憶體中運行,功耗不到 200W。這種設定對傳統的多 GPU 配置提出了挑戰,為處理大型語言模型提供了更節能的替代方案。

深尋R1

如何從程式碼中呼叫 DeepSeek R1?

“DeepSeek R1 API 與 OpenAI 相容嗎?”

大多數是的。 DeepSeek 有意反映了 OpenAI 聊天完成模式,因此現有 SDK(Python、Node、Curl)在您更改後仍可工作 base_url 並提供 DeepSeek 金鑰。

pythonimport openai
openai.api_base = "https://api.deepseek.com/v1"
openai.api_key  = "YOUR_DSK_KEY"
resp = openai.ChatCompletion.create(
  model="deepseek-r1",
  messages=[
      {"role":"system","content":"You are a data scientist."},
      {"role":"user","content":"Explain gradient boosting in 1 paragraph."}
  ]
)
print(resp.choices.message.content)

主要三角洲:

獨特之處DeepSeek R1OpenAI GPT‑4T
最大代幣數(25月XNUMX日)200萬128萬
呼叫 JSON 規範的工具相同相同
SSE 和 gRPC上證所
價格(投入/產出)每百萬代幣 0.50 美元 / 2.18 美元$ 10 / 30美元

彗星API

CometAPI 提供超過 500 種 AI 模型,包括用於聊天、映像、程式碼等的開源和專用多模式模型。其主要優勢在於簡化傳統上複雜的人工智慧整合過程。有了它,您可以透過單一、統一的訂閱存取 Claude、OpenAI、Deepseek 和 Gemini 等領先的 AI 工具。您可以使用 CometAPI 中的 API 來創作音樂和藝術品、生成影片以及建立自己的工作流程

彗星API 提供遠低於官方價格的價格,幫助您整合 DeepSeek R1 API,註冊登入後您將在帳戶中獲得1美元!歡迎註冊體驗CometAPI,CometAPI按使用量付費,DeepSeek R1 API CometAPI 中的(模型名稱:deepseek-ai/deepseek-r1;deepseek-reasoner;deepseek-r1)定價結構如下:

  • 輸入代幣:0.184 美元/百萬代幣
  • 輸出代幣:1.936 美元/百萬代幣

Comet API中的模型資訊請參見 API 文件.

如何微調或擴展 DeepSeek R1?

“我需要什麼數據和硬體?”

因為 R1 被釋放為 8 位和 4 位量化檢查點,您可以在單一 RTX 4090(24 GB)上使用 LoRA 轉接器和 QLoRA 量化進行微調。 DataCamp 教學在 42 分鐘內示範了醫學思路鏈的微調。

推薦管道:

  1. 轉換為 QLoRA 通過 bitsandbytes 4 位。
  2. 合併 GPTQ‑LoRA 經過推理訓練後。
  3. 評估 在您的下游任務上(例如,PubMedQA)。

“如何在微調過程中保持推理品質?”

使用 思路提煉:包含隱藏的“ 」字段在監督訓練期間有效,但在運行時將其刪除。DeepSeek 自己的研究論文報告稱,使用此技術時,性能僅下降 1%。

哪些 Prompt-Engineer 技巧最適合 R1?

結構化提示

是的。 Vercel AI SDK 指南中的測試表明,項目符號結構的系統提示加上明確的 角色任務格式樣式 指令使幻覺減少 17%。

模板範例

vbnetYou are . TASK: . 
FORMAT: return Markdown with sections: Overview, Evidence, Conclusion. 
STYLE: Formal, cite sources.

“我如何強制進行多步驟推理?”

啟動內建 反射 模式透過新增:

arduino<internal_tool="reflection" temperature=0.0 />

然後,R1 寫入內部便箋簿,對其進行評估,並僅輸出最終答案——在思路鏈任務中產生優異的表現,而無需向外部透露推理。

安全和道德考慮

安全考慮?

DeepSeek 推出了 開源審核層 (deepseek-moderation-v1)涵蓋仇恨、性侵犯和程式碼版權侵犯。您可以在本機上運行它或呼叫託管端點。

授權合規性

除了標準的開源屬性之外,R1 的許可證 需要發布準確性和偏見審計 適用於每月用戶數超過 1 萬的部署。

總結:

DeepSeek R1 混合 開放授權、競爭性推理和開發人員友好的互通性 這降低了獲得高級法學碩士學位的門檻。無論您只是需要一個免費的聊天助手、一個 GPT-4 的 API 插入式交換,還是一個可微調的垂直應用程式基礎,R1 都提供了一個引人注目的選擇——尤其是在美國以外,因為那裡到中國伺服器的延遲極小。

透過遵循上述實際操作步驟(建立帳戶、交換基本 URL、使用 QLoRA 進行微調以及強制審核),您可以將最先進的推理引入到您今天的專案中,同時保持成本可預測。 DeepSeek 更新的快速節奏表明即將取得進一步的進展,因此請收藏引用的資源並繼續進行實驗。

SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣