Claude Haiku 4.5 è un modello linguistico di classe più piccola, ottimizzato per scopi specifici, di Anthropic, rilasciato a metà ottobre 2025. È posizionato come un'opzione veloce, a basso costo nella gamma Claude che mantiene solide capacità in attività come programmazione, orchestrazione di agenti e workflow interattivi di “uso del computer”, consentendo al contempo un throughput molto più elevato e un costo unitario inferiore per le distribuzioni enterprise.
Caratteristiche principali
- Velocità ed efficienza dei costi: Haiku 4.5 è descritto come oltre il doppio più veloce di Sonnet 4 e a circa un terzo del costo di Sonnet 4 (e molto più economico di Opus), rendendolo interessante per usi su scala.
- Ragionamento esteso: Primo modello Haiku a supportare il ragionamento esteso (pensiero riassunto/intercalato, budget di ragionamento configurabili) per un ragionamento multi‑passo più profondo bilanciando la latenza.
- Strumenti e uso del computer: Supporto completo per gli strumenti Claude (bash, esecuzione di codice, editor di testo, ricerca web e automazione dell'uso del computer). Progettato per workflow agentici e architetture a sotto‑agenti.
- Ampia finestra di contesto: finestra di contesto da 200k token (con opzioni di contesto da 1M disponibili sui modelli più grandi come beta per altre classi di modelli).
Dettagli tecnici
- Dati di training e cutoff: Haiku 4.5 è stato addestrato su un mix proprietario di dati pubblici e con licenza con un cutoff di addestramento intorno a febbraio 2025.
- Il ragionamento esteso (una modalità di ragionamento ibrida) è supportato, così il modello può scambiare latenza con un ragionamento più profondo quando richiesto.
- La finestra di contesto al rilascio è di 200,000 token, e il modello è esplicitamente consapevole del contesto (tiene traccia di quanta parte della finestra è stata utilizzata).
- Prestazioni / throughput: prime segnalazioni della community e test di Anthropic citano OTPS molto elevati (token di output/sec) e velocità aneddotiche intorno a ~200+ token/sec in alcuni test interni/iniziali — molto più veloci di molti modelli comparabili di fascia media.
Prestazioni nei benchmark
SWE-Bench (coding): Haiku 4.5 ha ottenuto ~73.3% su SWE-Bench Verified — un risultato che Anthropic evidenzia come tale da collocare Haiku 4.5 tra i migliori modelli di programmazione al mondo nella sua classe.
Terminale / riga di comando / test degli strumenti: Anthropic ha riportato ~41% su Terminal-Bench (incentrato sulla riga di comando) e risultati comparabili a Sonnet 4 e a diversi modelli concorrenti di frontiera di fascia media su molti benchmark di uso degli strumenti.
Seguire istruzioni e testo per slide: esempi interni di Anthropic affermano che Haiku 4.5 ha superato i modelli precedenti in alcune attività di comprensione delle istruzioni (ad es., generazione di testo per slide: 65% vs 44% per un precedente modello premium nel loro benchmark).
Automazione reale / attività di agenti: valutazioni di terze parti e early adopter riportano tassi di successo competitivi su attività automatizzate di UI/agent (ad esempio, benchmark in stile OSWorld o di agent che riportano ≈50% di successo su automazioni complesse in alcuni test), mostrando utilità per flussi su larga scala, sebbene con modalità di errore non banali.
Limitazioni e note sulla sicurezza
- Non è un modello di frontiera: Anthropic classifica esplicitamente Haiku 4.5 come non orientato ad avanzare la frontiera; è ottimizzato per l'efficienza piuttosto che per spingere lo stato dell'arte assoluto. (Anthropic)
- Comportamento occasionale su argomenti sensibili: in alcuni prompt relativi a temi scientifici/biosicurezza, Haiku 4.5 talvolta restituisce informazioni di alto livello con riserve invece di rifiuti rigorosi; Anthropic segnala ciò come un'area in continuo miglioramento.
- Il ragionamento esteso può cambiare il comportamento (talvolta aumenta l'asimmetria nelle risposte).
Casi d'uso consigliati
- Sviluppo agentico e orchestrazione multi‑agente: sotto‑agenti veloci, rifattorizzazione iterativa del codice, test automatici e generazione di patch. (Buona scelta.)
- Flussi di lavoro per i clienti in tempo reale e ad alto volume: assistenti chat, automazioni interne in cui il costo per richiesta conta. (Buona scelta.)
- Workflow abilitati da strumenti e controllo del computer: automazione di attività GUI/CLI, flussi documentali e catene di strumenti in cui la bassa latenza è utile. (Buona scelta.)
- Non consigliato (senza controlli): ruoli autonomi che richiedono progettazione di sequenze scientifiche a livello di frontiera o attività di biosicurezza ad alta affidabilità. (Usare cautela.)
Come accedere all'API di Claude Haiku 4.5
Passaggio 1: registrati e ottieni la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua CometAPI console. Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su “Add Token” alla voce API token nel centro personale, ottieni la chiave token: sk-xxxxx e invia.
Passaggio 2: invia richieste all'API di Claude Haiku 4.5
Seleziona l'endpoint “claude-haiku-4-5-20251001” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono ottenuti dalla documentazione API del nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua effettiva chiave CometAPI del tuo account. L'URL di base è Anthropic Messages e Chat.
Inserisci la tua domanda o richiesta nel campo content—è a questo che il modello risponderà. Elabora la risposta dell'API per ottenere la risposta generata.
Passaggio 3: recupera e verifica i risultati
Elabora la risposta dell'API per ottenere la risposta generata. Dopo l'elaborazione, l'API risponde con lo stato dell'attività e i dati di output.