Claude Haiku 4.5 è un modello linguistico di classe più piccola, ottimizzato per uno scopo specifico, di Anthropic, rilasciato a metà ottobre 2025. È posizionato come un’opzione veloce ed economica nella gamma Claude che conserva una forte capacità in attività come coding, orchestrazione di agenti e flussi di lavoro interattivi di “uso del computer”, consentendo al contempo una produttività molto più elevata e un costo unitario inferiore per le distribuzioni enterprise.
Caratteristiche principali
- Velocità ed efficienza dei costi: Haiku 4.5 è descritto come più di due volte più veloce di Sonnet 4 e circa un terzo del costo di Sonnet 4 (e molto più economico di Opus), rendendolo attraente per utilizzi su larga scala.
- Pensiero esteso: Primo modello Haiku a supportare il pensiero esteso (pensiero riassunto/intercalato, budget di pensiero configurabili) per un ragionamento multi-step più profondo, bilanciando la latenza.
- Strumenti e uso del computer: Supporto completo per gli strumenti Claude (bash, esecuzione di codice, editor di testo, ricerca web e automazione dell’uso del computer). Progettato per flussi di lavoro agentici e architetture a sotto-agenti.
- Ampia finestra di contesto: finestra di contesto da 200k token (con opzioni 1M di contesto disponibili su modelli più grandi come beta per altre classi di modelli).
Dettagli tecnici
- Dati di addestramento e cutoff: Haiku 4.5 è stato addestrato su un mix proprietario di dati pubblici e con licenza con un cutoff di addestramento intorno a febbraio 2025.
- È supportato il pensiero esteso (una modalità di ragionamento ibrida) affinché il modello possa scambiare latenza con ragionamento più profondo quando richiesto.
- Finestra di contesto al rilascio pari a 200,000 token, e il modello è esplicitamente sensibile al contesto (tiene traccia di quanta parte della finestra è stata utilizzata).
- Prestazioni / throughput: prime segnalazioni della community e test Anthropic citano OTPS molto elevati (token di output/sec) e velocità aneddotiche di ~200+ token/sec in alcuni test interni/iniziali — molto più veloci di molti modelli di fascia media comparabili.
Prestazioni nei benchmark
SWE-Bench (coding): Haiku 4.5 ha ottenuto ~73.3% su SWE-Bench Verified — un risultato che Anthropic evidenzia come collocare Haiku 4.5 tra i migliori modelli di coding al mondo nella sua classe.
Terminal / command-line / test sugli strumenti: Anthropic ha riportato ~41% su Terminal-Bench (incentrato sulla riga di comando) e risultati comparabili a Sonnet 4 e a diversi modelli concorrenti di frontiera di fascia media su molti benchmark di uso degli strumenti.
Seguire istruzioni e testo per slide: esempi interni di Anthropic affermano che Haiku 4.5 ha superato i modelli precedenti in alcuni compiti di follow-the-instruction (ad es., generazione di testo per slide: 65% vs 44% per un precedente modello premium nel loro benchmark).
Automazione nel mondo reale / compiti per agenti: valutazioni di terze parti e primi adottanti riportano tassi di successo competitivi su attività automatizzate UI/agent (ad esempio, benchmark in stile OSWorld o per agenti con ≈50% di successo in compiti complessi), dimostrando utilità per flussi di lavoro su scala, sebbene con modalità di errore non banali.
Limitazioni e note sulla sicurezza
- Non è un modello di frontiera: Anthropic classifica esplicitamente Haiku 4.5 come non avanzamento dello stato dell’arte; è ottimizzato per l’efficienza piuttosto che per spingere lo stato dell’arte assoluto. (Anthropic)
- Comportamento occasionale su argomenti sensibili: in alcuni prompt scientifici / di biosicurezza, Haiku 4.5 talvolta restituisce informazioni ad alto livello con avvertenze anziché rifiuti rigorosi; Anthropic segnala questo come un’area in miglioramento continuo.
- Il pensiero esteso può cambiare il comportamento (a volte aumenta l’asimmetria nelle risposte).
Casi d’uso consigliati
- Coding agentico e orchestrazione multi-agente: sotto-agenti veloci, refactor iterativo del codice, autotest e generazione di patch. (Buona scelta.)
- Workflow clienti in tempo reale e ad alto volume: assistenti di chat, automazione interna dove il costo per richiesta è importante. (Buona scelta.)
- Workflow abilitati agli strumenti e controllo del computer: automazione di attività GUI/CLI, workflow documentali e catene di strumenti in cui la bassa latenza aiuta. (Buona scelta.)
- Non consigliato (senza controlli): ruoli autonomi che richiedono progettazione di sequenze scientifiche a livello di frontiera o compiti di biosicurezza ad alta affidabilità. (Procedere con cautela.)
Come accedere all’API di Claude Haiku 4.5
Step 1: Registrati per ottenere la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua CometAPI console. Ottieni la chiave API di credenziale di accesso dell’interfaccia. Clicca “Add Token” nel token API nel centro personale, ottieni la chiave token: sk-xxxxx e invia.
Step 2: Invia richieste all’API Claude Haiku 4.5
Seleziona l’endpoint “claude-haiku-4-5-20251001” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono ottenuti dalla documentazione API sul nostro sito. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva dal tuo account. L’URL base è Anthropic Messages e Chat.
Inserisci la tua domanda o richiesta nel campo content — è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere la risposta generata.
Step 3: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere la risposta generata. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.