Claude Haiku 4.5 ist ein zweckoptimiertes Sprachmodell der kleineren Klasse von Anthropic, veröffentlicht Mitte Oktober 2025. Es ist als schnelle, kostengünstige Option innerhalb der Claude-Produktreihe positioniert, die starke Fähigkeiten bei Aufgaben wie Programmieren, Agenten-Orchestrierung und interaktiven „Computer-Use“-Workflows beibehält und zugleich deutlich höheren Durchsatz und geringere Stückkosten für Unternehmenseinsätze ermöglicht.
Zentrale Funktionen
- Geschwindigkeit & Kosteneffizienz: Haiku 4.5 ist mehr als doppelt so schnell wie Sonnet 4 und etwa ein Drittel so teuer wie Sonnet 4 (und deutlich günstiger als Opus), was es für skalierte Nutzung attraktiv macht.
- Extended Thinking: Erstes Haiku-Modell mit Unterstützung für Extended Thinking (zusammengefasste/verschachtelte Gedanken, konfigurierbare Denk-Budgets) für tiefere mehrstufige Schlussfolgerungen bei gleichzeitigem Ausbalancieren der Latenz.
- Tools & Computer Use: Vollständige Unterstützung für Claude-Tools (bash, Codeausführung, Texteditor, Websuche und Automatisierung der Computerbedienung). Entwickelt für Agenten-Workflows und Sub-Agenten-Architekturen.
- Großes Kontextfenster: 200k Token Kontextfenster (mit 1M-Kontext-Optionen als Beta für größere Modellklassen).
Technische Details
- Trainingsdaten & Cutoff: Haiku 4.5 wurde auf einem proprietären Mix aus öffentlichen und lizenzierten Daten trainiert, mit einem Training-Cutoff um Februar 2025.
- Extended Thinking (ein hybrider Reasoning-Modus) wird unterstützt, sodass das Modell auf Wunsch Latenz gegen tiefere Schlussfolgerungen eintauschen kann.
- Kontextfenster bei Veröffentlichung beträgt 200.000 Token, und das Modell ist ausdrücklich kontextbewusst (es verfolgt, wie viel des Fensters bereits genutzt wurde).
- Leistung / Durchsatz: Frühe Community-Berichte und Tests von Anthropic nennen sehr hohe OTPS (Ausgabe-Token/Sek.) und anekdotische Geschwindigkeiten von ~200+ Token/Sek. in einigen internen/frühen Tests — deutlich schneller als viele vergleichbare Mid-Tier-Modelle.
Benchmark-Leistung
SWE-Bench (Programmieren): Haiku 4.5 erzielte ~73.3% auf SWE-Bench Verified — ein Ergebnis, das Anthropic als Platzierung von Haiku 4.5 unter den weltweit besten Modellen seiner Klasse für Programmieraufgaben hervorhebt.
Terminal-/Kommandozeilen-/Tool-Tests: Anthropic berichtete ~41% auf Terminal-Bench (schwerpunktmäßig Kommandozeile) und vergleichbare Ergebnisse zu Sonnet 4 sowie mehreren konkurrierenden Mid-Range-Frontier-Modellen auf vielen Tool-Use-Benchmarks.
Befolgen von Anweisungen & Folientext: Interne Beispiele von Anthropic behaupten, dass Haiku 4.5 bei einigen Aufgaben zum Befolgen von Anweisungen besser abschnitt (z. B. Folientext-Generierung: 65% vs 44% für ein früheres Premium-Modell in deren Benchmark).
Automatisierung in der Praxis / Agenten-Aufgaben: Drittanbieter-Evaluierungen und frühe Anwender berichten von konkurrenzfähigen Erfolgsraten bei automatisierten UI-/Agenten-Aufgaben (beispielsweise OSWorld-ähnliche oder Agenten-Benchmarks mit ≈50% Erfolg bei komplexer Automatisierung in einigen Tests), was die Nützlichkeit für skalierte Workflows zeigt, wenn auch mit nichttrivialen Fehlermodi.
Einschränkungen & Sicherheitshinweise
- Kein Frontier-Modell: Anthropic klassifiziert Haiku 4.5 ausdrücklich als nicht frontier-advancing; es ist auf Effizienz optimiert, nicht darauf, den absoluten Stand der Technik voranzutreiben. (Anthropic)
- Gelegentliches Verhalten bei sensiblen Themen: Bei einigen wissenschaftlichen/biologischen Sicherheits-Prompts liefert Haiku 4.5 mitunter hochlevelige Informationen mit Vorbehalten statt strikter Ablehnungen; Anthropic markiert dies als einen Bereich laufender Verbesserungen.
- Extended Thinking kann das Verhalten verändern (mitunter erhöht es die Asymmetrie in Antworten).
Empfohlene Anwendungsfälle
- Agentisches Programmieren & Multi-Agenten-Orchestrierung: schnelle Sub-Agenten, iterative Code-Refactorings, Autotests und Patch-Generierung. (Gut geeignet.)
- Echtzeit-, Hochvolumen-Kunden-Workflows: Chat-Assistenten, interne Automatisierung, bei denen die Kosten pro Anfrage zählen. (Gut geeignet.)
- Tool-gestützte Workflows & Computersteuerung: Automatisierung von GUI/CLI-Aufgaben, Dokument-Workflows und Toolchains, bei denen geringe Latenz hilft. (Gut geeignet.)
- Nicht empfohlen (ohne Kontrollen): eigenständige Rollen, die wissenschaftliches Sequenz-Design auf Frontier-Niveau oder Aufgaben mit hohen Biosicherheitsanforderungen erfordern. (Vorsicht walten lassen.)
Zugriff auf die Claude Haiku 4.5 API
Schritt 1: Für API-Schlüssel registrieren
Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI console an. Holen Sie sich den Zugangs-API-Schlüssel der Schnittstelle. Klicken Sie bei den API-Token im persönlichen Bereich auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.
Schritt 2: Anfragen an die Claude Haiku 4.5 API senden
Wählen Sie den Endpunkt “claude-haiku-4-5-20251001”, um die API-Anfrage zu senden, und setzen Sie den Request-Body. Die Anfragemethode und der Request-Body sind unserer Website-API-Dokumentation zu entnehmen. Unsere Website bietet außerdem Apifox-Tests zu Ihrer Bequemlichkeit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Die Basis-URL ist Anthropic Messages und Chat.
Fügen Sie Ihre Frage oder Anfrage in das Content-Feld ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.
Schritt 3: Ergebnisse abrufen und verifizieren
Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Task-Status und den Ausgabedaten.