使用 DeepSeek R1 的全面指南

CometAPI
AnnaMay 2, 2025
使用 DeepSeek R1 的全面指南

在快速演进的人工智能版图中,DeepSeek R1 以强劲姿态崛起,凭借其开源可及性与先进的推理能力,向既有玩家发起挑战。由中国 AI 公司 DeepSeek 开发的 R1,因其性能、成本效率以及跨平台适配性而备受关注。本文将深入解析 DeepSeek R1,介绍其特性、应用场景与高效使用的最佳实践。

什么是 DeepSeek R1?

DeepSeek R1 是 DeepSeek 于 2025 年 1 月推出的大型语言模型(LLM)。它拥有 6710 亿参数,专为需要复杂推理的任务设计,如数学、编程和多语理解。值得注意的是,DeepSeek R1 仅使用了 2,000 块 Nvidia H800 芯片完成开发,凸显其成本高效的工程路径。​

关键特性

  • 开源可及性:DeepSeek R1 向公众免费开放,允许开发者与研究者探索并定制其能力。​
  • 思维链推理:该模型采用“chain of thought”方法,模拟推理过程,在复杂任务中提升准确性。​
  • 多功能能力:DeepSeek R1 擅长多类任务,包括解题、编写与调试代码、生成类人文本以及分析复杂查询。​
  • 平台可用性:用户可通过其网页端、移动端或 API 访问 DeepSeek R1,便于在各类应用中集成。

2025 年 4 月的“R1‑Refresh”如何进一步改进了模型?

4 月上旬的更新将上下文长度提升至 200k tokens,并新增名为“Reflexion”的系统提示,指示模型在答复前先进行一次内部评估。社区在 YouTube 教程中发布的初步测试显示,AGIEval 推理套件成绩提升了 9 分,同时推理时延下降 12%。

如何开始使用 DeepSeek R1

DeepSeek R1 可通过多种平台访问:​

  • 网页界面:用户可通过 DeepSeek 官方网站与模型交互。​
  • 移动应用:DeepSeek 聊天机器人已提供智能手机应用,便于随时使用。​
  • API 集成:开发者可使用其 API 将 DeepSeek R1 集成到自定义应用中。此外,OpenRouter 等平台提供对 DeepSeek R1 的免费 API 访问,使用户无需投入大量硬件即可使用该模型。

“我可以直接在浏览器里使用 DeepSeek R1 吗?”

可以——DeepSeek 在 app.deepseek.com 提供免费网页聊天。创建账户后,你每天将获得 100k “thinking tokens”,于北京时间午夜补充,约可覆盖 75 次平均长度对话。3 月更新还新增了“Quick‑Tool”侧边栏,一键生成 SQL、Python 片段和求职信。

上手步骤

  1. 使用邮箱或 WeChat 注册。
  2. 选择语言(English、Chinese 或 multilingual auto)。
  3. 选择系统模板——“General‑Purpose”、“Developer” 或 “Math Tutor”。
  4. 输入你的提示;按 Shift+Enter 换行。
  5. 通过切换“Thoughts”查看推理轨迹——这一独特的教学特性会展示模型的中间链条(仅你可见)。

我能在手机上直接使用 DeepSeek R1 吗?

DeepSeek 应用在 2025 年 3 月登上 Apple 生产力类别榜首。移动端界面与桌面端一致,但额外包含 PDF 最多 20 页的离线“mini‑LLM”摘要功能,利用一款 11 亿参数的同系模型在设备端量化运行。

硬件效率

值得一提的是,DeepSeek R1 可在搭载 M3 Ultra 芯片的 Apple Mac Studio 上完全以内存运行,功耗低于 200W。该方案对传统多 GPU 配置形成挑战,为处理大型语言模型提供了一种更节能的替代方案。

DeepSeek R1

我如何在代码中调用 DeepSeek R1?

“DeepSeek R1 的 API 与 OpenAI 的兼容吗?”

基本是。DeepSeek 有意对齐 OpenAI 的 chat completions 架构,因此现有 SDK(Python、Node、Curl)只需更改 base_url 并提供 DeepSeek 密钥即可使用。

pythonimport openai
openai.api_base = "https://api.deepseek.com/v1"
openai.api_key  = "YOUR_DSK_KEY"
resp = openai.ChatCompletion.create(
  model="deepseek-r1",
  messages=[
      {"role":"system","content":"You are a data scientist."},
      {"role":"user","content":"Explain gradient boosting in 1 paragraph."}
  ]
)
print(resp.choices.message.content)

主要差异:

FeatureDeepSeek R1OpenAI GPT‑4T
Max tokens (apr‑25)200k128k
Tool calling JSON specidenticalidentical
StreamingSSE & gRPCSSE
Price (input/output)$0.50 / $2.18 per M tokens$10 / $30

CometAPI

CometAPI 提供 500 多个 AI 模型的访问,包括用于聊天、图像、代码等的开源与专业多模态模型。其核心优势在于简化传统复杂的 AI 集成流程。通过它,你可以用统一订阅访问诸如 Claude、OpenAI、Deepseek 和 Gemini 等领先 AI 工具。你可以使用 CometAPI 的 API 来创作音乐与艺术作品、生成视频并构建自己的工作流。

CometAPI 以远低于官方价格的方式,帮助你集成 [DeepSeek R1 API](https://www.cometapi.com/gemini-2-5-pro-api/),注册并登录后你将获得 $1 账户余额!欢迎注册体验 CometAPI。CometAPI 按量计费,[DeepSeek R1 API](https://www.cometapi.com/gemini-2-5-pro-api/)(模型名:deepseek-ai/deepseek-r1; deepseek-reasoner;deepseek-r1)在 CometAPI 的定价如下:

  • Input Tokens: $0.184 / M tokens
  • Output Tokens: $1.936/ M tokens

Comet API 中的模型信息请参见 API doc

我如何微调或扩展 DeepSeek R1?

“我需要哪些数据与硬件?”

由于 R1 以 8 位与 4 位量化检查点发布,你可以在单张 RTX 4090(24GB)上通过 LoRA 适配器与 QLoRA 量化进行微调。一篇 DataCamp 教程展示了 42 分钟完成医学思维链微调的案例。

推荐流程:

  1. 通过 bitsandbytes 4 位将其转换为 QLoRA。
  2. 训练后合并 GPTQ‑LoRA 以用于推理。
  3. 在你的下游任务上进行评估(如 PubMedQA)。

“微调时如何保持推理质量?”

使用思维链蒸馏:在监督训练时包含一个隐藏的“<scratchpad>”字段,但在运行时将其剥离。DeepSeek 的研究论文报告称采用该技术仅有 1% 的性能下降。

对 R1 最有效的提示工程技巧有哪些?

结构化提示

可以。Vercel AI SDK 指南中的测试显示,采用项目符号结构的系统提示并辅以明确的角色‑任务‑格式‑风格指令,可将幻觉降低 17%。

模板示例

vbnetYou are . TASK: . 
FORMAT: return Markdown with sections: Overview, Evidence, Conclusion. 
STYLE: Formal, cite sources.

“如何强制进行多步推理?”

通过在前面添加以下内容来激活内置的 Reflexion 模式:

arduino<internal_tool="reflection" temperature=0.0 />

随后,R1 会先写入内部草稿、对其进行自我评估,然后仅输出最终答案——在不暴露推理过程的前提下,在思维链任务上获得更优表现。

安全与伦理考量

安全考量?

DeepSeek 提供开源的内容审核层(deepseek-moderation-v1),涵盖仇恨、性相关与代码版权违规等类别。你可以在本地运行,或调用其托管端点。

许可证合规

除遵循标准的开源署名外,R1 的许可证要求对月活超过 100 万用户的部署发布准确性与偏见审计报告。

结论:

DeepSeek R1 融合了开源许可、强竞争力的推理能力与对开发者友好的互操作性,降低了采用先进 LLM 的门槛。无论你需要免费聊天助手、可替换 GPT‑4 的 API,还是用于垂直领域的可微调基础模型,R1 都是具有吸引力的选择——尤其是在美国以外、连接中国服务器的延迟极低的地区。

按照上述实操指南——创建账户、切换 base URL、使用 QLoRA 微调并启用内容审核——你即可在项目中引入最先进的推理能力并保持可预测的成本。DeepSeek 的快速更新节奏意味着进一步的提升指日可待,请收藏所引用的资源并持续探索。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣