Claude Haiku 4.5 é um modelo de linguagem de classe menor, otimizado para finalidades específicas, da Anthropic, lançado em meados de outubro de 2025. Ele se posiciona como uma opção rápida e de baixo custo na linha Claude que preserva forte capacidade em tarefas como programação, orquestração de agentes e fluxos de trabalho interativos de “uso de computador”, ao mesmo tempo que permite throughput muito maior e menor custo unitário para implantações empresariais.
Principais recursos
- Velocidade e eficiência de custo: o Haiku 4.5 é descrito como mais de duas vezes mais rápido que o Sonnet 4 e cerca de um terço do custo do Sonnet 4 (e muito mais barato que o Opus), tornando-o atraente para uso em escala.
- Raciocínio estendido: primeiro modelo Haiku a suportar raciocínio estendido (pensamento resumido/intercalado, orçamentos de raciocínio configuráveis) para um raciocínio multi-etapas mais profundo, equilibrando a latência.
- Ferramentas e uso de computador: suporte completo às ferramentas do Claude (bash, execução de código, editor de texto, busca na web e automação de uso de computador). Projetado para fluxos de trabalho baseados em agentes e arquiteturas de subagentes.
- Janela de contexto grande: janela de contexto de 200k tokens (com opções de 1M de contexto disponíveis em modelos maiores como beta para outras classes de modelos).
Detalhes técnicos
- Dados de treinamento e cutoff: o Haiku 4.5 foi treinado em uma combinação proprietária de dados públicos e licenciados, com data de corte de treinamento por volta de fevereiro de 2025.
- Raciocínio estendido (um modo híbrido de raciocínio) é suportado para que o modelo troque latência por raciocínio mais profundo quando solicitado.
- Janela de contexto no lançamento é de 200,000 tokens, e o modelo é explicitamente ciente do contexto (ele rastreia quanto da janela foi usado).
- Desempenho / throughput: relatos iniciais da comunidade e testes da Anthropic citam OTPS muito alto (tokens de saída/seg) e velocidades anedóticas em torno de ~200+ tokens/seg em alguns testes internos/iniciais — muito mais rápido que muitos modelos intermediários comparáveis.
Desempenho em benchmarks
SWE-Bench (programação): o Haiku 4.5 obteve ~73,3% no SWE-Bench Verified — um resultado que a Anthropic destaca como colocando o Haiku 4.5 entre os melhores modelos de codificação do mundo em sua classe.
Terminal / linha de comando / testes de ferramentas: a Anthropic reportou ~41% no Terminal-Bench (focado em linha de comando) e resultados comparáveis ao Sonnet 4 e a vários modelos de faixa intermediária concorrentes em muitos benchmarks de uso de ferramentas.
Seguimento de instruções e texto para slides: exemplos internos da Anthropic afirmam que o Haiku 4.5 superou modelos anteriores em algumas tarefas de seguimento de instruções (por exemplo, geração de texto para slides: 65% vs 44% para um modelo premium anterior no benchmark deles).
Automação/Agentes em cenários reais: avaliações de terceiros e primeiros adotantes relatam taxas de sucesso competitivas em tarefas automatizadas de UI/agentes (por exemplo, benchmarks ao estilo OSWorld ou de agentes reportando ≈50% de sucesso em automações complexas em alguns testes), mostrando utilidade para fluxos de trabalho em escala, embora com modos de falha não triviais.
Limitações e notas de segurança
- Não é um modelo de fronteira: a Anthropic classifica explicitamente o Haiku 4.5 como não avançando a fronteira; ele é otimizado para eficiência, em vez de levar o estado da arte ao limite. (Anthropic)
- Comportamento ocasional em tópicos sensíveis: em alguns prompts científicos/relacionados à biossegurança, o Haiku 4.5 às vezes retorna informações de alto nível com ressalvas, em vez de recusas estritas; a Anthropic sinaliza isso como uma área de melhoria contínua.
- Raciocínio estendido pode alterar o comportamento (às vezes aumenta a assimetria nas respostas).
Casos de uso recomendados
- Programação orientada a agentes e orquestração multiagente: subagentes rápidos, refatoração iterativa de código, autotestes e geração de patches. (Boa opção.)
- Fluxos em tempo real e alto volume com clientes: assistentes de chat, automação interna onde o custo por solicitação importa. (Boa opção.)
- Fluxos com ferramentas e controle de computador: automação de tarefas GUI/CLI, fluxos de documentos e cadeias de ferramentas em que baixa latência ajuda. (Boa opção.)
- Não recomendado (sem controles): funções autônomas que exigem design de sequências científicas em nível de fronteira ou tarefas de biossegurança de alta confiabilidade. (Tenha cautela.)
Como acessar a API do Claude Haiku 4.5
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a chave de API de credencial de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Claude Haiku 4.5
Selecione o endpoint “claude-haiku-4-5-20251001” para enviar a solicitação à API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação da API do nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Anthropic Messages e Chat.
Insira sua pergunta ou solicitação no campo content — é isso que o modelo responderá . Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.