Guía completa para usar DeepSeek R1

En el cambiante panorama de la inteligencia artificial, DeepSeek R1 se ha consolidado como un competidor formidable, desafiando a los actores consolidados gracias a su accesibilidad de código abierto y sus avanzadas capacidades de razonamiento. Desarrollado por la empresa china de IA DeepSeek, R1 ha destacado por su rendimiento, rentabilidad y adaptabilidad en diversas plataformas. Este artículo profundiza en las complejidades de DeepSeek R1, ofreciendo información sobre sus características, aplicaciones y mejores prácticas para un uso eficaz.

¿Qué es DeepSeek R1?

DeepSeek R1 es un modelo de lenguaje grande (LLM) presentado por DeepSeek en enero de 2025. Cuenta con 671 mil millones de parámetros y está diseñado para destacar en tareas que requieren razonamiento complejo, como matemáticas, programación y comprensión multilingüe. Cabe destacar que DeepSeek R1 se desarrolló utilizando solo 2,000 chips Nvidia H800, lo que destaca su enfoque de ingeniería rentable.

Características clave

Accesibilidad de código abierto:DeepSeek R1 está disponible gratuitamente para el público, lo que permite a los desarrolladores e investigadores explorar y personalizar sus capacidades.
Razonamiento en cadena de pensamiento:El modelo emplea una metodología de “cadena de pensamiento”, simulando un proceso de razonamiento que mejora la precisión en tareas complejas.
Capacidades multifuncionalesDeepSeek R1 se destaca en diversas tareas, incluida la resolución de problemas matemáticos, la escritura y depuración de código, la generación de texto similar a un humano y el análisis de consultas complejas.
Disponibilidad de la plataforma:Los usuarios pueden acceder a DeepSeek R1 a través de su interfaz web, aplicación móvil o API, lo que facilita la integración en diversas aplicaciones.

¿Cómo ha mejorado aún más el modelo la actualización “R2025‑Refresh” de abril de 1?

Una actualización a principios de abril aumentó la longitud del contexto a 200 9 tokens e incorporó un nuevo mensaje del sistema, «Reflexión», que indica al modelo que ejecute una evaluación interna antes de responder. Las pruebas preliminares de la comunidad, publicadas en tutoriales de YouTube, muestran un aumento de 12 puntos en el conjunto de razonamiento AGIEval, mientras que la latencia de inferencia se redujo un XNUMX %.

Cómo empezar a usar DeepSeek R1

Se puede acceder a DeepSeek R1 a través de múltiples plataformas:

Interfaz web:Los usuarios pueden interactuar con el modelo a través del sitio web oficial de DeepSeek.
Aplicaciones para móviles:El chatbot DeepSeek está disponible en aplicaciones para teléfonos inteligentes, lo que proporciona acceso desde cualquier lugar.
Integración APILos desarrolladores pueden integrar DeepSeek R1 en aplicaciones personalizadas mediante su API. Además, plataformas como OpenRouter ofrecen acceso gratuito a la API de DeepSeek R1, lo que permite a los usuarios utilizar el modelo sin realizar inversiones significativas en hardware.

“¿Puedo usar DeepSeek R1 en mi navegador?”

Sí, DeepSeek opera una chat web gratuito En app.deepseek.com. Tras crear una cuenta, recibirás 100 75 tokens de pensamiento diarios, que se reponen a medianoche (hora de Pekín), lo que cubre aproximadamente XNUMX chats de duración media. La actualización de marzo también añadió una barra lateral de herramientas rápidas para generar fragmentos de código SQL y Python, y cartas de presentación con un solo clic.

Pasos prácticos

Regístrate usando correo electrónico o WeChat.
Elige idioma (Inglés, chino o multilingüe automático).
Elija una plantilla de sistema—“Propósito general”, “Desarrollador” o “Tutor de matemáticas”.
Ingrese su mensaje; shift‑enter para varias líneas.
Inspeccionar el rastro de razonamiento activando “Pensamientos”, una función didáctica única que expone la cadena intermedia del modelo (visible sólo para usted).

¿Puedo utilizar DeepSeek R1 en mi móvil?

La aplicación DeepSeek ascendió al puesto número 1 en la categoría de productividad de Apple en marzo de 2025. La interfaz de usuario móvil refleja la de escritorio, pero incluye un resumen "mini-LLM" sin conexión para archivos PDF de hasta 20 páginas, aprovechando la cuantificación en el dispositivo de un modelo hermano de parámetro 1.1-B.

Eficiencia del hardware

Sorprendentemente, DeepSeek R1 puede ejecutarse completamente en memoria en el Mac Studio de Apple con el chip M3 Ultra, consumiendo menos de 200 W de potencia. Esta configuración desafía las configuraciones multi-GPU tradicionales, ofreciendo una alternativa más eficiente energéticamente para gestionar modelos de lenguaje grandes.

Búsqueda profunda R1

¿Cómo llamo a DeepSeek R1 desde el código?

“¿Es la API DeepSeek R1 compatible con OpenAI?”

En su mayoría sí. DeepSeek refleja intencionalmente la Esquema de finalización de chat de OpenAI, por lo que los SDK existentes (Python, Node, Curl) funcionan después de cambiar base_url y proporcionar una clave DeepSeek.

pythonimport openai
openai.api_base = "https://api.deepseek.com/v1"
openai.api_key  = "YOUR_DSK_KEY"
resp = openai.ChatCompletion.create(
  model="deepseek-r1",
  messages=[
      {"role":"system","content":"You are a data scientist."},
      {"role":"user","content":"Explain gradient boosting in 1 paragraph."}
  ]
)
print(resp.choices.message.content)

Los principales deltas:

Característica	Búsqueda profunda R1	OpenAI GPT‑4T
Máximo de tokens (25 de abril)	200 mil	128 mil
Herramienta que llama a la especificación JSON	idéntico	idéntico
Streaming	SSE y gRPC	SSE
Precio (entrada/salida)	$0.50 / $2.18 por M tokens	$ 10 / $ 30

CometAPI

CometAPI proporciona acceso a más de 500 modelos de IA, incluyendo modelos multimodales de código abierto y especializados para chat, imágenes, código y más. Su principal ventaja radica en simplificar el proceso, tradicionalmente complejo, de integración de IA. Con CometAPI, se puede acceder a herramientas de IA líderes como Claude, OpenAI, Deepseek y Gemini mediante una única suscripción unificada. Puedes usar la API de CometAPI para crear música y material gráfico, generar vídeos y crear tus propios flujos de trabajo.

CometAPI Ofrecemos un precio mucho más bajo que el precio oficial para ayudarte a integrarte API de DeepSeek R1¡Recibirás $1 en tu cuenta después de registrarte e iniciar sesión! Bienvenido a registrarte y a experimentar CometAPI. CometAPI paga por uso.API de DeepSeek R1 (nombre del modelo: deepseek-ai/deepseek-r1; deepseek-reasoner;deepseek-r1) en CometAPI Los precios se estructuran de la siguiente manera:

Tokens de entrada: $0.184/M tokens
Tokens de salida: $1.936/M tokens

Para obtener información del modelo en Comet API, consulte Documento API.

¿Cómo puedo ajustar o ampliar DeepSeek R1?

“¿Qué datos y hardware necesito?”

Porque R1 se libera como Puntos de control cuantificados de 8 y 4 bitsPuedes realizar ajustes precisos en una sola RTX 4090 (24 GB) con adaptadores LoRA y cuantificación QLoRA. Un tutorial de DataCamp muestra un ajuste preciso en cadena de pensamiento médico en 42 minutos.

Tubería recomendada:

Convertir a QLoRA vía bitsandbytes 4 bits.
Fusionar GPTQ‑LoRA después del entrenamiento para la inferencia.
Evaluar en su tarea posterior (por ejemplo, PubMedQA).

“¿Cómo conservo la calidad del razonamiento durante el ajuste fino?”

Use destilación de la cadena de pensamiento:incluye un “ oculto El campo se elimina durante el entrenamiento supervisado, pero se elimina en tiempo de ejecución. El propio artículo de investigación de DeepSeek reporta solo una degradación del 1 % al usar esta técnica.

¿Qué trucos de ingeniería de indicaciones funcionan mejor con R1?

Indicaciones estructuradas

Sí. Las pruebas en la guía del SDK de IA de Vercel muestran que las indicaciones del sistema estructuradas con viñetas más explícitas rol‑tarea‑formato‑estilo Las directivas reducen las alucinaciones en un 17%.

Ejemplo de plantilla

vbnetYou are . TASK: . 
FORMAT: return Markdown with sections: Overview, Evidence, Conclusion. 
STYLE: Formal, cite sources.

“¿Cómo puedo forzar el razonamiento de varios pasos?”

Activar la función integrada Reflexión modo anteponiendo:

arduino<internal_tool="reflection" temperature=0.0 />

Luego, R1 escribe un borrador interno, lo evalúa y solo genera la respuesta final, lo que produce un rendimiento superior en tareas de cadena de pensamiento sin revelar el razonamiento externamente.

Consideraciones éticas y de seguridad

¿Consideraciones de seguridad?

DeepSeek envía un capa de moderación de código abierto (deepseek-moderation-v1) que cubre infracciones de odio, sexuales y de derechos de autor. Puedes ejecutarlo localmente o llamar al endpoint alojado.

Cumplimiento de la licencia

Más allá de las atribuciones estándar de código abierto, la licencia de R1 requiere publicar una auditoría de precisión y sesgo para implementaciones que superen 1 millón de usuarios mensuales.

Conclusión:

DeepSeek R1 combina licencias abiertas, razonamiento competitivo e interoperabilidad amigable para los desarrolladores Esto reduce la barrera para la adopción avanzada de LLM. Ya sea que solo necesite un asistente de chat gratuito, un intercambio directo de API para GPT-4 o una base optimizada para aplicaciones verticales, R1 ofrece una opción atractiva, especialmente fuera de EE. UU., donde la latencia con los servidores chinos es mínima.

Siguiendo los pasos prácticos anteriores (crear una cuenta, intercambiar URL base, optimizar con QLoRA y aplicar moderación), puede implementar un razonamiento de vanguardia en sus proyectos hoy mismo, manteniendo los costos predecibles. La rápida cadencia de actualizaciones de DeepSeek sugiere que se esperan más avances, así que guarde los recursos citados en sus favoritos y siga experimentando.