Claude Haiku 4.5 é um modelo de linguagem de classe menor, otimizado para finalidade específica, da Anthropic, lançado em meados de outubro de 2025. Ele se posiciona como uma opção rápida e de baixo custo na linha Claude, preservando forte capacidade em tarefas como programação, orquestração de agentes e fluxos de trabalho interativos de “uso do computador”, ao mesmo tempo que permite muito maior throughput e menor custo unitário para implantações empresariais.
Principais recursos
- Velocidade e eficiência de custo: O Haiku 4.5 é descrito como mais de duas vezes mais rápido que o Sonnet 4 e com cerca de um terço do custo do Sonnet 4 (e muito mais barato que o Opus), tornando-o atraente para uso em escala.
- Raciocínio estendido: Primeiro modelo Haiku a oferecer suporte a raciocínio estendido (pensamento resumido/intercalado, orçamentos de raciocínio configuráveis) para um raciocínio multietapas mais profundo, equilibrando a latência.
- Ferramentas e uso do computador: Suporte completo às ferramentas do Claude (bash, execução de código, editor de texto, pesquisa na web e automação de uso do computador). Projetado para fluxos de trabalho agentivos e arquiteturas de subagentes.
- Janela de contexto ampla: janela de contexto de 200k tokens (com opções de 1M de contexto disponíveis em modelos maiores como beta para outras classes de modelos).
Detalhes técnicos
- Dados de treinamento e corte: O Haiku 4.5 foi treinado em uma combinação proprietária de dados públicos e licenciados, com corte de treinamento por volta de fevereiro de 2025.
- Raciocínio estendido (um modo híbrido de raciocínio) é suportado, permitindo ao modelo trocar latência por raciocínio mais profundo quando solicitado.
- Janela de contexto no lançamento é de 200,000 tokens, e o modelo é explicitamente consciente do contexto (ele acompanha quanto da janela foi utilizada).
- Desempenho/throughput: Relatos iniciais da comunidade e testes da Anthropic mencionam OTPS muito alto (tokens de saída/seg) e velocidades anedóticas em torno de ~200+ tokens/seg em alguns testes internos/iniciais — bem mais rápido do que muitos modelos intermediários comparáveis.
Desempenho em benchmarks
SWE-Bench (programação): O Haiku 4.5 obteve ~73.3% no SWE-Bench Verified — um resultado que a Anthropic destaca como colocando o Haiku 4.5 entre os melhores modelos de programação do mundo em sua classe.
Testes de terminal/linha de comando/ferramentas: A Anthropic reportou ~41% no Terminal-Bench (focado em linha de comando) e resultados comparáveis ao Sonnet 4 e a vários modelos de ponta intermediários concorrentes em muitos benchmarks de uso de ferramentas.
Seguimento de instruções e texto de slides: exemplos internos da Anthropic afirmam que o Haiku 4.5 superou modelos anteriores em algumas tarefas de seguimento de instruções (por exemplo, geração de texto para slides: 65% vs 44% para um modelo premium anterior em seu benchmark).
Automação/Agentes em situações reais: avaliações de terceiros e adotantes iniciais relatam taxas de sucesso competitivas em tarefas automatizadas de UI/agentes (por exemplo, benchmarks no estilo OSWorld ou de agentes relatando ≈50% de sucesso em automações complexas em alguns testes), mostrando utilidade para fluxos de trabalho em escala, embora com modos de falha não triviais.
Limitações e notas de segurança
- Não é um modelo de fronteira: A Anthropic classifica explicitamente o Haiku 4.5 como não avançando a fronteira; ele é otimizado para eficiência em vez de empurrar o estado da arte absoluto. (Anthropic)
- Comportamento ocasional em tópicos sensíveis: em alguns prompts científicos/relacionados à biossegurança, o Haiku 4.5 às vezes retorna informações de alto nível com ressalvas em vez de recusas estritas; a Anthropic aponta isso como uma área em melhoria contínua.
- O raciocínio estendido pode alterar o comportamento (às vezes aumenta a assimetria nas respostas).
Casos de uso recomendados
- Programação agentiva e orquestração multiagente: subagentes rápidos, refatoração iterativa de código, autotestes e geração de patches. (Boa opção.)
- Fluxos de trabalho de clientes em tempo real e alto volume: assistentes de chat, automação interna onde o custo por solicitação importa. (Boa opção.)
- Fluxos de trabalho com ferramentas e controle do computador: automação de tarefas GUI/CLI, fluxos de documentos e cadeias de ferramentas em que a baixa latência ajuda. (Boa opção.)
- Não recomendado (sem controles): funções autônomas que exigem design de sequências científicas de nível de fronteira ou tarefas de biossegurança de alta garantia. (Tenha cautela.)
Como acessar a API do Claude Haiku 4.5
Etapa 1: Cadastre-se para obter a chave da API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu CometAPI console. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Claude Haiku 4.5
Selecione o endpoint “claude-haiku-4-5-20251001” para enviar a solicitação à API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação da API em nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. O URL base é Anthropic Messages e Chat.
Insira sua pergunta ou solicitação no campo content — é isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.