使用 DeepSeek R1 的全面指南

在快速演进的人工智能版图中，DeepSeek R1 以强劲姿态崛起，凭借其开源可及性与先进的推理能力，向既有玩家发起挑战。由中国 AI 公司 DeepSeek 开发的 R1，因其性能、成本效率以及跨平台适配性而备受关注。本文将深入解析 DeepSeek R1，介绍其特性、应用场景与高效使用的最佳实践。

什么是 DeepSeek R1？

DeepSeek R1 是 DeepSeek 于 2025 年 1 月推出的大型语言模型（LLM）。它拥有 6710 亿参数，专为需要复杂推理的任务设计，如数学、编程和多语理解。值得注意的是，DeepSeek R1 仅使用了 2,000 块 Nvidia H800 芯片完成开发，凸显其成本高效的工程路径。

关键特性

开源可及性：DeepSeek R1 向公众免费开放，允许开发者与研究者探索并定制其能力。
思维链推理：该模型采用“chain of thought”方法，模拟推理过程，在复杂任务中提升准确性。
多功能能力：DeepSeek R1 擅长多类任务，包括解题、编写与调试代码、生成类人文本以及分析复杂查询。
平台可用性：用户可通过其网页端、移动端或 API 访问 DeepSeek R1，便于在各类应用中集成。

2025 年 4 月的“R1‑Refresh”如何进一步改进了模型？

4 月上旬的更新将上下文长度提升至 200k tokens，并新增名为“Reflexion”的系统提示，指示模型在答复前先进行一次内部评估。社区在 YouTube 教程中发布的初步测试显示，AGIEval 推理套件成绩提升了 9 分，同时推理时延下降 12%。

如何开始使用 DeepSeek R1

DeepSeek R1 可通过多种平台访问：

网页界面：用户可通过 DeepSeek 官方网站与模型交互。
移动应用：DeepSeek 聊天机器人已提供智能手机应用，便于随时使用。
API 集成：开发者可使用其 API 将 DeepSeek R1 集成到自定义应用中。此外，OpenRouter 等平台提供对 DeepSeek R1 的免费 API 访问，使用户无需投入大量硬件即可使用该模型。

“我可以直接在浏览器里使用 DeepSeek R1 吗？”

可以——DeepSeek 在 app.deepseek.com 提供免费网页聊天。创建账户后，你每天将获得 100k “thinking tokens”，于北京时间午夜补充，约可覆盖 75 次平均长度对话。3 月更新还新增了“Quick‑Tool”侧边栏，一键生成 SQL、Python 片段和求职信。

上手步骤

使用邮箱或 WeChat 注册。
选择语言（English、Chinese 或 multilingual auto）。
选择系统模板——“General‑Purpose”、“Developer” 或 “Math Tutor”。
输入你的提示；按 Shift+Enter 换行。
通过切换“Thoughts”查看推理轨迹——这一独特的教学特性会展示模型的中间链条（仅你可见）。

我能在手机上直接使用 DeepSeek R1 吗？

DeepSeek 应用在 2025 年 3 月登上 Apple 生产力类别榜首。移动端界面与桌面端一致，但额外包含 PDF 最多 20 页的离线“mini‑LLM”摘要功能，利用一款 11 亿参数的同系模型在设备端量化运行。

硬件效率

值得一提的是，DeepSeek R1 可在搭载 M3 Ultra 芯片的 Apple Mac Studio 上完全以内存运行，功耗低于 200W。该方案对传统多 GPU 配置形成挑战，为处理大型语言模型提供了一种更节能的替代方案。

DeepSeek R1

我如何在代码中调用 DeepSeek R1？

“DeepSeek R1 的 API 与 OpenAI 的兼容吗？”

基本是。DeepSeek 有意对齐 OpenAI 的 chat completions 架构，因此现有 SDK（Python、Node、Curl）只需更改 base_url 并提供 DeepSeek 密钥即可使用。

pythonimport openai
openai.api_base = "https://api.deepseek.com/v1"
openai.api_key  = "YOUR_DSK_KEY"
resp = openai.ChatCompletion.create(
  model="deepseek-r1",
  messages=[
      {"role":"system","content":"You are a data scientist."},
      {"role":"user","content":"Explain gradient boosting in 1 paragraph."}
  ]
)
print(resp.choices.message.content)

主要差异：

Feature	DeepSeek R1	OpenAI GPT‑4T
Max tokens (apr‑25)	200k	128k
Tool calling JSON spec	identical	identical
Streaming	SSE & gRPC	SSE
Price (input/output)	$0.50 / $2.18 per M tokens	$10 / $30

CometAPI

CometAPI 提供 500 多个 AI 模型的访问，包括用于聊天、图像、代码等的开源与专业多模态模型。其核心优势在于简化传统复杂的 AI 集成流程。通过它，你可以用统一订阅访问诸如 Claude、OpenAI、Deepseek 和 Gemini 等领先 AI 工具。你可以使用 CometAPI 的 API 来创作音乐与艺术作品、生成视频并构建自己的工作流。

CometAPI 以远低于官方价格的方式，帮助你集成 [DeepSeek R1 API](https://www.cometapi.com/gemini-2-5-pro-api/)，注册并登录后你将获得 $1 账户余额！欢迎注册体验 CometAPI。CometAPI 按量计费，[DeepSeek R1 API](https://www.cometapi.com/gemini-2-5-pro-api/)（模型名：deepseek-ai/deepseek-r1; deepseek-reasoner;deepseek-r1）在 CometAPI 的定价如下：

Input Tokens: $0.184 / M tokens
Output Tokens: $1.936/ M tokens

Comet API 中的模型信息请参见 API doc。

我如何微调或扩展 DeepSeek R1？

“我需要哪些数据与硬件？”

由于 R1 以 8 位与 4 位量化检查点发布，你可以在单张 RTX 4090（24GB）上通过 LoRA 适配器与 QLoRA 量化进行微调。一篇 DataCamp 教程展示了 42 分钟完成医学思维链微调的案例。

推荐流程：

通过 bitsandbytes 4 位将其转换为 QLoRA。
训练后合并 GPTQ‑LoRA 以用于推理。
在你的下游任务上进行评估（如 PubMedQA）。

“微调时如何保持推理质量？”

使用思维链蒸馏：在监督训练时包含一个隐藏的“<scratchpad>”字段，但在运行时将其剥离。DeepSeek 的研究论文报告称采用该技术仅有 1% 的性能下降。

对 R1 最有效的提示工程技巧有哪些？

结构化提示

可以。Vercel AI SDK 指南中的测试显示，采用项目符号结构的系统提示并辅以明确的角色‑任务‑格式‑风格指令，可将幻觉降低 17%。

模板示例

vbnetYou are . TASK: . 
FORMAT: return Markdown with sections: Overview, Evidence, Conclusion. 
STYLE: Formal, cite sources.

“如何强制进行多步推理？”

通过在前面添加以下内容来激活内置的 Reflexion 模式：

arduino<internal_tool="reflection" temperature=0.0 />

随后，R1 会先写入内部草稿、对其进行自我评估，然后仅输出最终答案——在不暴露推理过程的前提下，在思维链任务上获得更优表现。

安全与伦理考量

安全考量？

DeepSeek 提供开源的内容审核层（deepseek-moderation-v1），涵盖仇恨、性相关与代码版权违规等类别。你可以在本地运行，或调用其托管端点。

许可证合规

除遵循标准的开源署名外，R1 的许可证要求对月活超过 100 万用户的部署发布准确性与偏见审计报告。

结论：

DeepSeek R1 融合了开源许可、强竞争力的推理能力与对开发者友好的互操作性，降低了采用先进 LLM 的门槛。无论你需要免费聊天助手、可替换 GPT‑4 的 API，还是用于垂直领域的可微调基础模型，R1 都是具有吸引力的选择——尤其是在美国以外、连接中国服务器的延迟极低的地区。

按照上述实操指南——创建账户、切换 base URL、使用 QLoRA 微调并启用内容审核——你即可在项目中引入最先进的推理能力并保持可预测的成本。DeepSeek 的快速更新节奏意味着进一步的提升指日可待，请收藏所引用的资源并持续探索。