Claude Haiku 4.5 to zoptymalizowany pod konkretny cel, mniejszej klasy model językowy firmy Anthropic, wydany w połowie października 2025 roku. Jest pozycjonowany jako szybka i niskokosztowa opcja w rodzinie Claude, która zachowuje wysokie możliwości w zadaniach takich jak programowanie, orkiestracja agentów oraz interaktywne przepływy pracy typu „computer-use”, jednocześnie umożliwiając znacznie wyższą przepustowość i niższy koszt jednostkowy we wdrożeniach korporacyjnych.
Kluczowe cechy
- Szybkość i efektywność kosztowa: Haiku 4.5 jest opisywany jako ponad dwa razy szybszy niż Sonnet 4 i kosztujący około jednej trzeciej ceny Sonnet 4 (oraz znacznie mniej niż Opus), co czyni go atrakcyjnym wyborem przy użyciu na dużą skalę.
- Extended thinking: pierwszy model Haiku obsługujący extended thinking (podsumowane / przeplatane rozumowanie, konfigurowalne budżety myślenia) do głębszego wieloetapowego rozumowania przy jednoczesnym zachowaniu równowagi między jakością a opóźnieniem.
- Narzędzia i computer use: Pełna obsługa narzędzi Claude (bash, wykonywanie kodu, edytor tekstu, wyszukiwanie w sieci oraz automatyzacja computer-use). Zaprojektowany z myślą o przepływach pracy agentowych i architekturach z podagentami.
- Duże okno kontekstowe: okno kontekstowe o rozmiarze 200 tys. tokenów (z opcjami kontekstu 1M dostępnymi w wersji beta na większych modelach innych klas).
Szczegóły techniczne
- Dane treningowe i cutoff: Haiku 4.5 został wytrenowany na autorskiej mieszance danych publicznych i licencjonowanych, z granicą danych treningowych około lutego 2025 roku.
- Obsługiwany jest tryb extended thinking (hybrydowy tryb rozumowania), dzięki czemu model może wymieniać niższe opóźnienie na głębsze rozumowanie, gdy jest to wymagane.
- Okno kontekstowe w momencie wydania wynosi 200 000 tokenów, a model jest jawnie świadomy kontekstu (śledzi, jaka część okna została już wykorzystana).
- Wydajność / przepustowość: Wczesne raporty społeczności i testy Anthropic wskazują na bardzo wysokie OTPS (output tokens/sec) oraz anegdotyczne prędkości rzędu ~200+ tokenów/s w niektórych testach wewnętrznych / wczesnych — znacznie szybciej niż wiele porównywalnych modeli średniej klasy.
Wyniki benchmarków
SWE-Bench (programowanie): Haiku 4.5 uzyskał ~73,3% w SWE-Bench Verified — wynik, który Anthropic podkreśla jako plasujący Haiku 4.5 wśród najlepszych na świecie modeli do programowania w swojej klasie.
Testy terminala / wiersza poleceń / narzędzi: Anthropic podał wynik ~41% w Terminal-Bench (skoncentrowanym na wierszu poleceń) oraz wyniki porównywalne z Sonnet 4 i kilkoma konkurencyjnymi modelami frontier średniej klasy w wielu benchmarkach użycia narzędzi.
Wykonywanie instrukcji i tekst slajdów: wewnętrzne przykłady Anthropic wskazują, że Haiku 4.5 przewyższył wcześniejsze modele w niektórych zadaniach wykonywania instrukcji (np. generowanie tekstu slajdów: 65% vs 44% względem wcześniejszego modelu premium w ich benchmarku).
Rzeczywiste zadania automatyzacji / zadania agentowe: oceny zewnętrzne i relacje wczesnych użytkowników wskazują na konkurencyjne wskaźniki skuteczności w zautomatyzowanych zadaniach UI/agentowych (na przykład benchmarki w stylu OSWorld lub benchmarki agentowe raportujące ≈50% skuteczności w złożonej automatyzacji w niektórych testach), co pokazuje użyteczność w skalowanych przepływach pracy, choć z istotnymi trybami awarii.
Ograniczenia i uwagi dotyczące bezpieczeństwa
- To nie jest model frontier: Anthropic wyraźnie klasyfikuje Haiku 4.5 jako model niewyznaczający nowej granicy możliwości; został zoptymalizowany pod kątem wydajności, a nie pod kątem przesuwania absolutnego stanu wiedzy. (Anthropic)
- Sporadyczne zachowanie przy tematach wrażliwych: w niektórych promptach naukowych / związanych z bio-bezpieczeństwem Haiku 4.5 czasami zwraca ogólne informacje wysokiego poziomu wraz z zastrzeżeniami, zamiast stanowczych odmów; Anthropic wskazuje to jako obszar nadal ulepszany.
- Extended thinking może zmieniać zachowanie (czasami zwiększa asymetrię odpowiedzi).
Zalecane przypadki użycia
- Programowanie agentowe i orkiestracja wielu agentów: szybcy podagenci, iteracyjny refaktoring kodu, autotesty i generowanie poprawek. (Dobre dopasowanie.)
- Przepływy pracy dla klientów w czasie rzeczywistym i przy dużym wolumenie: asystenci czatowi, automatyzacja wewnętrzna, gdzie znaczenie ma koszt na żądanie. (Dobre dopasowanie.)
- Przepływy pracy z użyciem narzędzi i sterowaniem komputerem: automatyzacja zadań GUI/CLI, przepływy dokumentów i łańcuchy narzędzi, gdzie niskie opóźnienie pomaga. (Dobre dopasowanie.)
- Niezalecane (bez odpowiednich zabezpieczeń): samodzielne role wymagające projektowania sekwencji naukowych na poziomie frontier lub zadań biosecurity wymagających wysokiego poziomu pewności. (Zachowaj ostrożność.)
Jak uzyskać dostęp do API Claude Haiku 4.5
Krok 1: Zarejestruj się, aby uzyskać klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu, czyli klucz API interfejsu. Kliknij „Add Token” w sekcji tokenów API w centrum osobistym, uzyskaj klucz tokenu: sk-xxxxx i zatwierdź.
Krok 2: Wysyłaj żądania do API Claude Haiku 4.5
Wybierz endpoint „claude-haiku-4-5-20251001”, aby wysłać żądanie API, i ustaw treść żądania. Metoda żądania i treść żądania są dostępne w dokumentacji API na naszej stronie internetowej. Nasza strona internetowa udostępnia również testy Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta. Bazowy URL to Anthropic Messages oraz Chat.
Wstaw swoje pytanie lub żądanie do pola content — to na nie model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania oraz dane wyjściowe.