Claude Haiku 4.5 est un modèle de langage de classe compacte, optimisé pour un usage ciblé, d’Anthropic, lancé à la mi-octobre 2025. Il est positionné comme une option rapide et peu coûteuse dans la gamme Claude, tout en conservant de solides capacités sur des tâches comme la programmation, l’orchestration d’agents et des workflows interactifs d’« utilisation de l’ordinateur », tout en permettant un débit bien plus élevé et un coût unitaire inférieur pour les déploiements en entreprise.
Fonctionnalités clés
- Vitesse et rentabilité : Haiku 4.5 est décrit comme plus de deux fois plus rapide que Sonnet 4 et coûtant environ un tiers de Sonnet 4 (et bien moins cher qu’Opus), ce qui le rend attractif pour des usages à grande échelle.
- Réflexion étendue : Premier modèle Haiku à prendre en charge la réflexion étendue (pensée résumée / intercalée, budgets de réflexion configurables) pour un raisonnement multi‑étapes plus profond tout en équilibrant la latence.
- Outils et utilisation de l’ordinateur : Prise en charge complète des outils Claude (bash, exécution de code, éditeur de texte, recherche web et automatisation de l’utilisation de l’ordinateur). Conçu pour des workflows agentiques et des architectures de sous‑agents.
- Grande fenêtre de contexte : 200k jetons de fenêtre de contexte (avec des options 1M disponibles sur des modèles plus grands en bêta pour d’autres classes de modèles).
Détails techniques
- Données d’entraînement et date de coupure : Haiku 4.5 a été entraîné sur un mélange propriétaire de données publiques et sous licence avec une date de coupure autour de février 2025.
- Réflexion étendue (un mode de raisonnement hybride) est prise en charge afin que le modèle puisse échanger latence contre un raisonnement plus profond sur demande.
- Fenêtre de contexte au lancement : 200,000 jetons, et le modèle est explicitement sensible au contexte (il suit la part de la fenêtre déjà utilisée).
- Performances / débit : Les premiers retours de la communauté et les tests d’Anthropic mentionnent un OTPS (output tokens/sec) très élevé et des vitesses anecdotiques autour de ~200+ jetons/sec dans certains tests internes/préliminaires — bien plus rapide que de nombreux modèles de milieu de gamme comparables.
Performances sur benchmarks
SWE-Bench (programmation) : Haiku 4.5 a obtenu ~73.3 % sur SWE-Bench Verified — un résultat qu’Anthropic met en avant comme plaçant Haiku 4.5 parmi les meilleurs modèles de programmation de sa catégorie.
Terminal / ligne de commande / tests d’outils : Anthropic a rapporté ~41 % sur Terminal-Bench (axé ligne de commande) et des résultats comparables à Sonnet 4 et à plusieurs modèles concurrents de milieu de gamme de dernière génération sur de nombreux benchmarks d’utilisation d’outils.
Suivi d’instructions et texte de diapositives : des exemples internes d’Anthropic indiquent que Haiku 4.5 a surpassé les modèles précédents sur certaines tâches de suivi d’instructions (par ex., génération de texte de diapositives : 65 % vs 44 % pour un précédent modèle premium dans leur benchmark).
Automatisation en conditions réelles / tâches d’agent : des évaluations tierces et des premiers utilisateurs rapportent des taux de réussite compétitifs sur des tâches d’automatisation d’UI/d’agent (par exemple, des benchmarks de type OSWorld ou d’agent rapportant ≈50 % de réussite sur des automatisations complexes dans certains tests), montrant une utilité pour des workflows à l’échelle, bien que des modes d’échec non triviaux existent.
Limites et notes de sécurité
- N’est pas un modèle d’avant-garde : Anthropic classe explicitement Haiku 4.5 comme n’étant pas à l’avant-garde ; il est optimisé pour l’efficacité plutôt que pour repousser l’état de l’art absolu. (Anthropic)
- Comportement occasionnel sur sujets sensibles : dans certaines requêtes scientifiques / liées à la biosécurité, Haiku 4.5 renvoie parfois des informations de haut niveau assorties de mises en garde plutôt que des refus stricts ; Anthropic signale que c’est un domaine en amélioration continue.
- La réflexion étendue peut modifier le comportement (elle augmente parfois l’asymétrie des réponses).
Cas d’utilisation recommandés
- Programmation agentique et orchestration multi‑agents : sous‑agents rapides, refactorisation itérative du code, autotests et génération de correctifs. (Bon choix.)
- Workflows client en temps réel et à fort volume : assistants de chat, automatisation interne où le coût par requête compte. (Bon choix.)
- Workflows outillés et contrôle de l’ordinateur : automatisation de tâches GUI/CLI, workflows documentaires et chaînes d’outils où la faible latence est utile. (Bon choix.)
- Non recommandé (sans contrôles) : rôles autonomes nécessitant une conception de séquences scientifiques de niveau de pointe ou des tâches de biosécurité à haute assurance. (À utiliser avec prudence.)
Comment accéder à l’API Claude Haiku 4.5
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Récupérez la clé API d’accès de l’interface. Cliquez sur « Add Token » au niveau de l’API token dans le centre personnel, obtenez la token key : sk-xxxxx et validez.
Étape 2 : Envoyer des requêtes à l’API Claude Haiku 4.5
Sélectionnez l’« claude-haiku-4-5-20251001 » endpoint pour envoyer la requête API et définir le corps de requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site. Notre site propose également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. La base url est Anthropic Messages et Chat.
Insérez votre question ou requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API renvoie l’état de la tâche et les données de sortie.