¿Qué es DeepSeek-Reasoner?
DeepSeek-Reasoner es el nombre del modo/API de razonamiento (o “pensamiento”) para los modelos de DeepSeek con prioridad en el razonamiento (actualmente alineados con la familia DeepSeek-V3.2). Está diseñado para producir una cadena de pensamiento (CoT) explícita antes de emitir una respuesta final; es decir, el modelo genera intencionadamente un razonamiento interno paso a paso que se expone (o puede exponerse) a través de la API para que quienes la llaman puedan inspeccionarlo o destilarlo. DeepSeek posiciona la variante reasoner como la contraparte “pensante” de su modelo de chat no pensante y la orienta a razonamiento de múltiples pasos, matemáticas, programación y flujos de trabajo de agentes.
Funciones principales (de cara al usuario)
- Salida explícita de cadena de pensamiento (CoT). La API devuelve un campo
reasoning_contentseparado que contiene el razonamiento interno paso a paso del modelo junto con elcontentfinal. Esto está diseñado para la inspección y la lógica de agentes posteriores. - Modos “Thinking” vs “Chat”.
deepseek-reasoner(modo de pensamiento) es distinto dedeepseek-chat(modo no pensante); ambos fueron actualizados a la generación V3.2. - Ventanas de contexto grandes. DeepSeek expone longitudes de contexto muy grandes. Las variantes Reasoner se comercializan para razonamiento extenso y memoria de agentes.
- Salida JSON/respuestas estructuradas. Compatibilidad con salidas JSON estructuradas útiles para consumo programático.
- Enfoque en agentes/constructores de agentes. V3.2 y la variante Speciale se describen explícitamente como “modelos con prioridad en el razonamiento construidos para agentes”.
Capacidades técnicas
- Entradas: prompts de texto plano, JSON estructurado para invocaciones de herramientas/agentes, archivos o documentos largos (mediante contexto largo); los tokens son tokens NLP estándar.
- Salidas: la API devuelve tanto
reasoning_content(texto CoT) comocontent(respuesta final). Los clientes de la API pueden solicitar solo CoT o solo la respuesta final ajustando max_tokens o parámetros de respuesta. (Nota práctica: extraer CoT puede seguir siendo facturable como salida del modelo.) - DeepSeek ha iterado mediante una hoja de ruta especializada en razonamiento: modelos grandes base (familia R1) seguidos de posentrenamiento/aprendizaje por refuerzo (estilo RLHF) y ajuste fino de estilo de políticas para mejorar la profundidad del razonamiento. El equipo también utiliza destilación para comprimir la capacidad de razonamiento en modelos más pequeños y desplegables.
- La serie V3.2 añade posentrenamiento orientado a agentes para el uso de herramientas, inferencia híbrida (Think / Non-Think) y optimizaciones para iteraciones de “pensamiento” más rápidas.
- La eficiencia de la inferencia se ve favorecida por un método de atención dispersa (informes lo denominan DeepSeek Sparse Attention — DSA) que concentra el cómputo en segmentos relevantes en lugar de atención densa completa a través de secuencias muy largas; esto reduce el costo para contextos muy largos.
Cómo acceder a la API de deepseek-reasoner
Paso 1: Regístrate para obtener la clave de API
Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Accede a tu Consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave de token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de deepseek-reasoner
Selecciona el endpoint “deepseek-reasoner” para enviar la solicitud de API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona prueba en Apifox para tu conveniencia. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. La URL base está en formato Chat.
Inserta tu pregunta o solicitud en el campo content —es a lo que responderá el modelo—. Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener la respuesta observada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.