DeepSeek V3.2 Exp é um experimental iteração construída na linhagem V3.1 “Terminus” e concebida como um trampolim para a arquitetura de próxima geração do DeepSeek. Concentra-se em eficiência (menor custo de treinamento/inferência) para contexto longo cargas de trabalho, visando preservar a qualidade de saída da classe V3. A empresa o posicionou como um intermediário lançamento que visa validar novas ideias de atenção e roteamento, em vez de um salto geracional completo.
Características chave
- Atenção Esparsa DeepSeek (DSA): um mecanismo de atenção seletiva que calcula a atenção sobre um subconjunto de tokens para reduzir o custo computacional em contextos longos.
- Dois modos de ponto final:
deepseek-chat(não pensar/bater papo) edeepseek-reasoner(gera Cadeia de Pensamento antes das respostas). - Tipo de liberação: Lançamento público experimental/“intermediário” (fórum de desenvolvedores + Hugging Face).
- menor computação, melhor tratamento de contexto longo, treinamento/inferência mais rápidos e custos de saída de API substancialmente reduzidos (a empresa anunciou um corte de preço de API de ~50%+ para este modelo).
Detalhes técnicos
Atenção Esparsa DeepSeek (DSA). O DeepSeek V3.2 Exp integra um mecanismo de atenção esparsa que atende seletivamente a um subconjunto de tokens anteriores (em vez de autoatenção densa completa). As notas de lançamento e a página do modelo enfatizam que a configuração de treinamento foi deliberadamente alinhada com o V3.1-Terminus para isolar o impacto do mecanismo esparso. Esse alinhamento permite que o DeepSeek reivindique pontuações de benchmark semelhantes, ao mesmo tempo em que reduz a computação e a inferência.
Desempenho de referência

Limitações e riscos
- Estado experimental: pelo nome e pela mensagem do DeepSeek o lançamento é experimental — bom para testes e implantação com custo reduzido, mas não necessariamente um substituto imediato para todas as cargas de trabalho de produção.
- Regressões estreitas: pequenas quedas de desempenho em alguns raciocínio- benchmarks pesados foram relatados; os desenvolvedores devem validar seu conjunto de tarefas específico antes de mudar.
Os casos de uso
- Aplicativos de longo contexto sensíveis ao custo: pesquisa de documentos, sumarização de documentos longos, jurídicos ou científicos, recuperação de múltiplos documentos - geração aumentada onde o contexto longo é importante.
- Chatbots em escala: serviços de chat para consumidores ou empresas que priorizam a taxa de transferência e o preço por token.
- Ferramentas e automação: assistentes de código, chamadas de ferramentas estruturadas em JSON e fluxos de trabalho multi-turno onde o custo reduzido por token ajuda na economia.
Comparação com modelos pares
- DeepSeek V3 / R1 (versões anteriores do DeepSeek): DeepSeek V3.2 Exp é iterativo — mantém os pontos fortes do MoE do V3, mas prioriza a escassez em prol da eficiência em vez de aumentos de capacidade bruta.
- Claude Antrópico: Claude se concentra em alinhamento de segurança e instruções; DeepSeek posiciona DeepSeek V3.2 Exp para vencer em custo + rendimento de longo contexto se a paridade se mantiver. As organizações que escolherem entre elas negociarão ferramentas de alinhamento/segurança (Claude) contra custo/rendimento de longo contexto (DeepSeek).
- Classe OpenAI GPT (família GPT-4): As ofertas do GPT enfatizam amplas proteções de segurança e integrações de ecossistemas em larga escala; o DeepSeek tenta competir em acessibilidade e escalonamento de sequência longa em vez de uma paridade de recursos um-para-um em cada métrica de segurança/guardrail.
Como ligar DeepSeek V3.2 Exp API da CometAPI
Versão do modelo:
deepseek-v3.2-exp |
DeepSeek-V3.2-Exp-nothinking |
DeepSeek-V3.2-Exp-thinking |
DeepSeek V3.2 Exp Preços da API no CometAPI, 20% de desconto sobre o preço oficial:
- Tokens de entrada: $0.22/ M tokens
- Tokens de saída: US$ 0.35/M tokens
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
- Obtenha a URL deste site: https://api.cometapi.com/
Use o método
- Selecione a opção "
deepseek-v3.2-exp” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência. - Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- Processe a resposta da API para obter a resposta gerada.
A CometAPI oferece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes:
- URL base: https://api.cometapi.com/v1/messages
- Nomes de modelo: ""
deepseek-v3.2-exp"ou "DeepSeek-V3.2-Exp-nothinking","DeepSeek-V3.2-Exp-thinking" - Autenticação: Token portador via
Authorization: Bearer YOUR_CometAPI_API_KEYcabeçalho - Tipo de conteúdo:
application/json.
Veja também DeepSeekV3.1
