O que é o DeepSeek-Reasoner?
DeepSeek-Reasoner é o modo/nome de API de raciocínio (ou “pensamento”) para os modelos da DeepSeek orientados ao raciocínio (atualmente alinhados à família DeepSeek-V3.2). Ele foi projetado para produzir uma cadeia de raciocínio (CoT) explícita antes de emitir a resposta final — isto é, o modelo gera deliberadamente um raciocínio interno passo a passo que é exposto (ou pode ser exposto) pela API para que os chamadores possam inspecioná-lo ou destilá-lo. A DeepSeek posiciona a variante reasoner como a contraparte “pensante” do seu modelo de chat não pensante e a promove para raciocínio de múltiplas etapas, matemática, programação e fluxos de trabalho de agentes.
Principais recursos (voltados ao usuário)
- Saída explícita de Cadeia de Raciocínio (CoT). A API retorna um campo separado
reasoning_contentcontendo o raciocínio interno passo a passo do modelo junto com ocontentfinal. Isso foi projetado para inspeção e para a lógica de agentes a jusante. - Modos “Thinking” vs “Chat”.
deepseek-reasoner(modo pensante) é distinto dedeepseek-chat(modo não pensante); ambos foram atualizados para a geração V3.2. - Janelas de contexto amplas. A DeepSeek expõe comprimentos de contexto muito grandes. As variantes Reasoner são promovidas para raciocínio de longa duração e memória de agentes.
- Saída JSON / respostas estruturadas. Suporte a saídas JSON estruturadas, úteis para consumo programático.
- Foco em agentes/construtores de agentes. A V3.2 e a variante Speciale são descritas explicitamente como “modelos orientados ao raciocínio, concebidos para agentes”.
Capacidades técnicas
- Entradas: prompts em texto simples, JSON estruturado para chamadas de ferramentas/agentes, arquivos ou documentos longos (via contexto longo); os tokens são tokens padrão de PLN.
- Saídas: a API retorna tanto
reasoning_content(texto CoT) quantocontent(resposta final). Os clientes da API podem solicitar apenas o CoT ou apenas a resposta final ajustando max_tokens ou os parâmetros de resposta. (Observação prática: extrair o CoT pode ainda ser cobrado como saída do modelo.) - A DeepSeek evoluiu por meio de um roteiro especializado em raciocínio: modelos grandes base (família R1) seguidos de pós-treinamento focado / aprendizado por reforço (estilo RLHF) e ajuste fino orientado a políticas para melhorar a profundidade do raciocínio. A equipe também usa destilação para comprimir a capacidade de raciocínio em modelos menores e implantáveis.
- A série V3.2 acrescenta pós-treinamento orientado a agentes para uso de ferramentas, inferência híbrida (Think / Non-Think) e otimizações para iterações de “pensamento” mais rápidas.
- A eficiência de inferência é auxiliada por um método de atenção esparsa (relatos o chamam de DeepSeek Sparse Attention — DSA) que concentra o cálculo nos trechos relevantes em vez de atenção densa completa em sequências muito longas; isso reduz o custo para contextos muito longos.
Como acessar a API deepseek-reasoner
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API deepseek-reasoner
Selecione o endpoint “deepseek-reasoner” para enviar a solicitação de API e defina o corpo da solicitação. O método e o corpo da solicitação são obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real do CometAPI na sua conta. A URL base está no formato Chat.
Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.