Em maio de 2025, a Anthropic revelou o Claude Sonnet 4 juntamente com seu modelo irmão, o Claude Opus 4, marcando um marco importante na evolução da família Claude de modelos de linguagem de grande porte. Com base nos pontos fortes de seu antecessor, o Claude Sonnet 3.7, o Sonnet 4 apresenta um conjunto de melhorias que visam profundidade de raciocínio, proficiência em codificação e integração perfeita de ferramentas. Ao equilibrar alto desempenho com eficiência prática, o Sonnet 4 visa atender a um amplo espectro de usuários — desde desenvolvedores individuais e equipes de pesquisa até clientes corporativos que exigem assistentes de IA confiáveis para tarefas complexas e de alto volume. Este artigo sintetiza os últimos anúncios, divulgações de cartões de sistema e análises de terceiros para fornecer uma visão geral abrangente de "O que é o Claude Sonnet 4?".
O que é o Soneto 4 de Claude?
O Claude Sonnet 4 é a mais nova iteração do modelo "Sonnet" da Anthropic, projetado como um assistente de IA versátil e de uso geral que oferece modos de raciocínio padrão e híbrido. Como sucessor do Claude Sonnet 3.7, ele oferece codificação aprimorada, resolução de problemas complexos e precisão nas respostas, mantendo a relação custo-benefício para uma ampla gama de tarefas.
Origem e Nomenclatura
A série “Claude”, nomeada em homenagem ao pioneiro da teoria da informação Claude Shannon, reflete o foco da Anthropic em transparência, segurança e desenvolvimento ético de IA. Dentro desta série, os modelos “Sonnet” historicamente oferecem um equilíbrio: mais capazes do que os modelos “Haiku”, mais rápidos e leves, porém mais econômicos e eficientes do que as variantes “Opus” mais potentes.
Capacidades de núcleo
- Raciocínio Híbrido: Os usuários podem alternar entre um modo padrão “rápido” para respostas rápidas e um modo de “pensamento estendido” que dedica mais computação ao raciocínio em várias etapas e ao uso de ferramentas.
- Suporte de codificação aprimorado: O Sonnet 4 apresenta desempenho aprimorado em tarefas de codificação, desde o preenchimento automático de linhas de código até a depuração de algoritmos complexos.
- Compreensão de contexto longo: Com suporte para dezenas de milhares de tokens (e até 1 milhão de tokens em implantações corporativas), ele pode analisar e gerar respostas para documentos, contratos ou conjuntos de dados longos.
- Segurança e Alinhamento: Desenvolvido sob a estrutura de IA Constitucional da Anthropic, o Sonnet 4 foi projetado para minimizar resultados prejudiciais e aderir a diretrizes éticas, reduzindo o raciocínio abreviado em aproximadamente 65% em comparação aos modelos anteriores.
Como o Claude Sonnet 4 se destaca dentro da família Claude 4?
Dentro da linha Claude 4, que inclui Haiku (o mais rápido), Sonnet (balanceado) e Opus (o mais potente), o Sonnet 4 é voltado para usuários que exigem uma combinação robusta de capacidade e eficiência sem o custo premium do nível Opus.
Modos híbridos: velocidade vs. profundidade
- Modo padrão: Prioriza a latência, ideal para chatbots, rascunhos de e-mails ou resumos de texto.
- Modo de pensamento estendido: Aloca mais computação para etapas de raciocínio interno, resumindo cadeias de "pensamento" mais longas para maior transparência. Notavelmente, apenas ~5% das cadeias de pensamento estendidas excedem o limite de sumarização, garantindo insights concisos na maioria das vezes.
Eficiência e custo-benefício
- Preço do token: Com preço de US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, o Sonnet 4 oferece aproximadamente um quinto do custo do Opus 4, ao mesmo tempo em que oferece raciocínio aprimorado em relação ao Sonnet 3.7.
- Pegada de recursos: Otimizado para inferência de CPU, permitindo implantação em ambientes onde os recursos de GPU são limitados ou caros.
Uso Integrado de Ferramentas e Execução Paralela
Outra grande melhoria é a capacidade do Sonnet 4 de intercalar seu raciocínio interno com invocações de ferramentas externas — como busca na web, ambientes de execução de código ou bancos de dados proprietários — em uma única consulta. Esse recurso de "pensamento estendido com uso de ferramentas" permite a execução simultânea de múltiplas ferramentas, possibilitando fluxos de trabalho complexos, como verificação de fatos em fontes de dados ativas, busca de documentos externos ou orquestração de chamadas de API. Os desenvolvedores relatam que a integração de ferramentas se tornou até 220% mais confiável em comparação com o Sonnet 3.7, aumentando significativamente a utilidade prática para tarefas automatizadas de codificação e análise de dados.
Melhorias na janela de memória e contexto
O Sonnet 4 herda uma janela de contexto expandida que pode lidar com centenas de milhares de tokens em implantações corporativas, facilitando a análise de documentos extensos, entradas multimodais e conversas multi-turno sem perda de coerência. Além disso, o Sonnet 4 apresenta uma "memória de curto prazo" aprimorada durante toda a sessão, retendo detalhes críticos entre as trocas e permitindo interações mais fluidas. Essas melhorias de memória são particularmente valiosas para casos de uso que exigem continuidade, como redigir artigos de pesquisa, conduzir análises jurídicas ou gerenciar diálogos de suporte ao cliente.
Quais benchmarks demonstram o desempenho do Claude Sonnet 4?
A Anthropic submeteu o Sonnet 4 a uma série de avaliações públicas e internas, demonstrando sua força tanto em capacidade quanto em segurança.
Benchmarks de codificação e raciocínio
- MBPP (Geração de Código Python): O Soneto 4 atinge taxas de aprovação substancialmente mais altas que o Soneto 3.7 no conjunto de problemas “difíceis” (0.824 vs. ~0.75), demonstrando seu raciocínio algorítmico aprimorado.
- Banco GRANDE Rígido: Em tarefas linguísticas complexas que exigem lógica e conhecimento de mundo, o Sonnet 4 obtém pontuação acima de 0.82, superando seu antecessor em mais de 4% e diminuindo a diferença com o Opus 4.
Avaliações de Segurança e Alinhamento
- Referência de Viés para Resposta a Perguntas (BBQ): O Soneto 4 registra uma pontuação de viés de 0.61% (vs. 0.21% para o Opus 4) com precisão de 99.4%, refletindo forte mitigação de respostas discriminatórias.
- Pacote de segurança cibernética:Em testes especializados de “cyber-harness” e “crypto”, o Sonnet 4 iguala ou excede o desempenho do Sonnet 3.7, demonstrando sua capacidade de raciocinar sobre segurança de rede e protocolos criptográficos sem se envolver em comportamento prejudicial.

Como os usuários podem acessar o Claude Sonnet 4?
A Anthropic e seus parceiros de nuvem disponibilizaram amplamente o Claude Sonnet 4 por meio de vários canais, atendendo tanto usuários gratuitos quanto clientes corporativos.
Canais de acesso
- API antrópica: Acesso direto à API com endpoints RESTful, suportando payloads JSON e respostas de streaming.
- Interface Claude.ai: Um playground online que oferece interface de bate-papo, resumo de documentos e edição de código. Usuários gratuitos têm acesso ao Sonnet 4 (com limites de taxa), enquanto os planos pagos desbloqueiam o pensamento estendido e o Opus 4.
- Rocha Amazônica: Disponível como parte do serviço Foundation Models gerenciado da Amazon, permitindo a integração com serviços da AWS, como Lambda e SageMaker.
- IA do Google Cloud Vertex: O Sonnet 4 pode ser invocado por meio da API unificada da Vertex, integrando-se ao armazenamento do Google Cloud e aos pipelines de análise de dados.
- Copiloto do GitHub: Agora em versão prévia pública, o Sonnet 4 potencializa as sugestões do Copilot para conclusão de código e pesquisa no editor, sucedendo o Sonnet 3.7 e oferecendo uma mistura equilibrada de capacidade e velocidade.
- CometAPI: A CometAPI fornece uma interface REST unificada que agrega centenas de modelos de IA — em um endpoint consistente, com gerenciamento de chaves de API integrado, cotas de uso e painéis de faturamento. Os desenvolvedores podem acessar a API Claude Sonnet 4 por meio da CometAPI. A CometAPI também adicionou
cometapi-sonnet-4-20250514ecometapi-sonnet-4-20250514-thinkingespecificamente para uso no Cursor.
Planos de preços
| Planejamento | Soneto 4 Acesso | Acesso Opus 4 | Pensamento Estendido |
| Free | Modo padrão, uso limitado | Não incluído | Não |
| Pró (US$ 20/mês) | Soneto 4 padrão + modo estendido | Somente modo padrão do Opus 4 | Sim |
| Equipe/Empresa | Soneto irrestrito e Opus 4 | SLAs aprimorados, instâncias dedicadas | Sim |
Preço do token: entrada do Sonnet 4 a US$ 3/milhões, saída a US$ 15/milhões; entrada do Opus 4 a US$ 15/milhões, saída a US$ 75/milhões. Faturamento por token em camadas com descontos por volume; o uso do Sonnet 4 está disponível para assinantes de API gratuitos e pagos (nível gratuito limitado a 5 milhões de tokens por mês).
Quais casos de uso podem se beneficiar do Claude Sonnet 4?
Fluxos de trabalho do desenvolvedor e geração de código
As métricas de codificação robustas do Sonnet 4 o tornam um assistente ideal para tarefas como geração de boilerplate, refatoração de código, scaffolds de testes automatizados e documentação inline. Seu pensamento estendido com o uso de ferramentas permite buscar e analisar repositórios de código externos, realizar linting em tempo real e integrar-se com pipelines de CI/CD — otimizando os ciclos de vida de desenvolvimento e reduzindo a troca de contexto para engenheiros.
Criação de conteúdo e tarefas de alto contexto
Além da codificação, o Claude Sonnet 4 se destaca na compreensão de alto contexto, necessária para a elaboração de relatórios técnicos, memorandos jurídicos e resumos de pesquisa. Sua ampla janela de contexto permite a ingestão de documentos completos — como white papers ou documentos regulatórios — seguidos de perguntas e respostas precisas, resumos ou traduções. As equipes de marketing podem utilizar o Sonnet 4 para gerar conteúdo otimizado para SEO, enquanto o suporte ao cliente pode automatizar a triagem de tickets e a geração de respostas com supervisão mínima.
Combinando preço acessível, raciocínio híbrido e fortes garantias de segurança, o Claude Sonnet 4 está pronto para atender a uma gama diversificada de usuários — de desenvolvedores individuais a grandes empresas — que buscam um assistente de IA confiável para codificação, análise e criação de conteúdo. Sua posição dentro da família Claude 4 garante que os usuários possam selecionar o equilíbrio ideal entre potência e eficiência, enquanto atualizações contínuas prometem que o Sonnet 4 se tornará ainda mais poderoso nos próximos meses.
Começando a jornada
Os desenvolvedores podem acessar Claude Soneto 4 API (modelo: claude-sonnet-4-20250514 ; claude-sonnet-4-20250514-thinking). Para começar, explore as capacidades do modelo no Playground e consulte o Guia de API para obter instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave da API. O CometAPI também adicionou cometapi-sonnet-4-20250514 e cometapi-sonnet-4-20250514-thinking especificamente para uso no Cursor.
Novo no CometAPI? Comece um teste gratuito de $ 1 e libere o Soneto 4 em suas tarefas mais difíceis.
Mal podemos esperar para ver o que você vai construir. Se algo parecer estranho, clique no botão de feedback — nos contar o que deu errado é a maneira mais rápida de melhorar.
