Claude Haiku 4.5 est un modèle de langage de classe plus compacte, optimisé pour des usages spécifiques par Anthropic, publié à la mi-octobre 2025. Il est positionné comme une option rapide et peu coûteuse dans la gamme Claude, tout en préservant de fortes capacités sur des tâches comme le codage, l’orchestration d’agents et les flux de travail interactifs d’« utilisation de l’ordinateur », et en permettant un débit bien plus élevé ainsi qu’un coût unitaire inférieur pour les déploiements en entreprise.
Fonctionnalités clés
- Vitesse et rentabilité : Haiku 4.5 est présenté comme plus de deux fois plus rapide que Sonnet 4 et environ un tiers du coût de Sonnet 4 (et bien moins cher qu’Opus), ce qui le rend attractif pour un usage à grande échelle.
- Raisonnement étendu : Premier modèle Haiku à prendre en charge le raisonnement étendu (pensée résumée/entrelacée, budgets de réflexion configurables) pour un raisonnement multi‑étapes plus profond tout en équilibrant la latence.
- Outils et utilisation de l’ordinateur : Prise en charge complète des outils Claude (bash, exécution de code, éditeur de texte, recherche web et automatisation de l’utilisation de l’ordinateur). Conçu pour des flux de travail agentiques et des architectures de sous‑agents.
- Grande fenêtre de contexte : 200k tokens de fenêtre de contexte (avec des options 1M disponibles sur des modèles plus grands en bêta pour d’autres classes de modèles).
Détails techniques
- Données d’entraînement et date de coupure : Haiku 4.5 a été entraîné sur un mélange propriétaire de données publiques et sous licence, avec une date de coupure autour de février 2025.
- Le raisonnement étendu (un mode de raisonnement hybride) est pris en charge pour permettre d’échanger latence et profondeur de raisonnement lorsque c’est demandé.
- La fenêtre de contexte au lancement est de 200,000 tokens, et le modèle est explicitement sensibilisé au contexte (il suit la part de fenêtre déjà utilisée).
- Performances/débit : Les premiers retours de la communauté et les tests d’Anthropic mentionnent un OTPS (output tokens/sec) très élevé, avec des vitesses anecdotiques d’environ ~200+ tokens/sec dans certains tests internes/précoces — bien plus rapides que de nombreux modèles de milieu de gamme comparables.
Performances sur benchmarks
SWE-Bench (codage) : Haiku 4.5 a obtenu ~73.3 % sur SWE-Bench Verified — un résultat qu’Anthropic met en avant comme plaçant Haiku 4.5 parmi les meilleurs modèles de codage de sa catégorie.
Terminal / ligne de commande / tests d’outils : Anthropic a rapporté ~41 % sur Terminal-Bench (orienté ligne de commande) et des résultats comparables à Sonnet 4 et à plusieurs modèles frontaliers de milieu de gamme concurrents sur de nombreux benchmarks d’utilisation d’outils.
Suivi d’instructions et texte de diapositives : des exemples internes d’Anthropic indiquent que Haiku 4.5 a surpassé des modèles précédents sur certaines tâches de suivi d’instructions (par ex., génération de texte de diapositives : 65 % contre 44 % pour un modèle premium antérieur dans leur benchmark).
Automatisation réelle / tâches d’agents : des évaluations tierces et des premiers utilisateurs signalent des taux de réussite compétitifs sur des tâches automatisées d’interface utilisateur/de type agent (par exemple, des benchmarks de type OSWorld signalant ≈50 % de succès sur des automatisations complexes lors de certains tests), montrant une utilité pour des flux de travail à l’échelle, bien que des modes d’échec non négligeables subsistent.
Limites et notes de sécurité
- Pas un modèle de pointe : Anthropic classe explicitement Haiku 4.5 comme non avant-gardiste ; il est optimisé pour l’efficacité plutôt que pour repousser l’état de l’art. (Anthropic)
- Comportements occasionnels sur sujets sensibles : sur certaines requêtes scientifiques/relatives à la biosécurité, Haiku 4.5 renvoie parfois des informations de haut niveau avec des mises en garde plutôt que des refus stricts ; Anthropic signale cela comme un axe d’amélioration en cours.
- Le raisonnement étendu peut modifier le comportement (il augmente parfois l’asymétrie des réponses).
Cas d’usage recommandés
- Codage agentique et orchestration multi‑agents : sous‑agents rapides, refactorisation itérative, autotests et génération de correctifs. (Bon choix.)
- Flux clients en temps réel et à grand volume : assistants de chat, automatisation interne où le coût par requête compte. (Bon choix.)
- Flux de travail outillés et contrôle de l’ordinateur : automatisation GUI/CLI, workflows documentaires et chaînes d’outils où la faible latence est utile. (Bon choix.)
- Non recommandé (sans contrôles) : rôles autonomes nécessitant une conception de séquences scientifiques de niveau frontier ou des tâches de biosécurité à haute assurance. (À manier avec précaution.)
Comment accéder à l’API Claude Haiku 4.5
Étape 1 : Inscrivez-vous pour obtenir une clé API
Connectez-vous sur cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous enregistrer. Connectez-vous à votre console CometAPI. Obtenez la clé API d’identification de l’interface. Cliquez sur « Add Token » dans la section des jetons API du centre personnel, récupérez la clé de jeton : sk-xxxxx et validez.
Étape 2 : Envoyez des requêtes à l’API Claude Haiku 4.5
Sélectionnez le point de terminaison “claude-haiku-4-5-20251001” pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont indiqués dans la documentation API de notre site. Notre site propose également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle issue de votre compte. L’URL de base est Anthropic Messages et Chat.
Insérez votre question ou votre demande dans le champ content — c’est ce à quoi le modèle répondra. Traitez la réponse de l’API pour obtenir la sortie générée.
Étape 3 : Récupérez et vérifiez les résultats
Traitez la réponse de l’API pour obtenir la sortie générée. Après traitement, l’API répond avec l’état de la tâche et les données de sortie.