Claude Haiku 4.5 adalah model bahasa kelas kecil yang dioptimalkan untuk tujuan tertentu dari Anthropic, dirilis pada pertengahan Oktober 2025. Model ini diposisikan sebagai opsi cepat, berbiaya rendah dalam jajaran Claude yang tetap mempertahankan kemampuan kuat pada tugas seperti pengodean, orkestrasi agen, dan alur kerja interaktif “penggunaan komputer” sekaligus memungkinkan throughput jauh lebih tinggi dan biaya per unit lebih rendah untuk penerapan di perusahaan.
Fitur utama
- Kecepatan & efisiensi biaya: Haiku 4.5 digambarkan lebih dari dua kali lebih cepat daripada Sonnet 4 dan sekitar sepertiga biaya Sonnet 4 (dan jauh lebih murah daripada Opus), sehingga menarik untuk penggunaan berskala.
- Pemikiran diperluas: Model Haiku pertama yang mendukung pemikiran diperluas (pemikiran yang diringkas / berselang-seling, anggaran pemikiran yang dapat dikonfigurasi) untuk penalaran multi-langkah yang lebih dalam sambil menyeimbangkan latensi.
- Alat & penggunaan komputer: Dukungan penuh untuk alat Claude (bash, eksekusi kode, editor teks, penelusuran web, dan otomasi penggunaan komputer). Dirancang untuk alur kerja berbasis agen dan arsitektur sub-agen.
- Jendela konteks besar: Jendela konteks 200k token (dengan opsi konteks 1M tersedia pada model yang lebih besar sebagai beta untuk kelas model lain).
Detail teknis
- Data pelatihan & cutoff: Haiku 4.5 dilatih pada campuran proprietari dari data publik dan berlisensi dengan batas waktu pelatihan sekitar Februari 2025.
- Pemikiran diperluas (mode penalaran hibrida) didukung sehingga model dapat menukar latensi dengan penalaran yang lebih mendalam saat diminta.
- Jendela konteks saat rilis adalah 200,000 token, dan model secara eksplisit sadar konteks (melacak seberapa banyak jendela telah digunakan).
- Performa / throughput: Laporan komunitas awal dan pengujian Anthropic menyebut OTPS sangat tinggi (output tokens/sec) dan kecepatan anekdotal sekitar ~200+ token/detik dalam beberapa pengujian internal/awal — jauh lebih cepat daripada banyak model kelas menengah sebanding.
Performa benchmark
SWE-Bench (pengodean): Haiku 4.5 meraih skor ~73.3% pada SWE-Bench Verified — hasil yang disorot Anthropic sebagai menempatkan Haiku 4.5 di antara model pengodean terbaik di kelasnya.
Terminal / command-line / pengujian alat: Anthropic melaporkan ~41% pada Terminal-Bench (berfokus pada command-line) dan hasil yang sebanding dengan Sonnet 4 serta beberapa model frontier kelas menengah pesaing pada banyak benchmark penggunaan alat.
Mengikuti instruksi & teks slide: contoh internal Anthropic menyatakan Haiku 4.5 melampaui model sebelumnya pada beberapa tugas mengikuti instruksi (misalnya, pembuatan teks slide: 65% vs 44% untuk model premium sebelumnya dalam benchmark mereka).
Otomasi dunia nyata / tugas agen: evaluasi pihak ketiga dan pengguna awal melaporkan tingkat keberhasilan kompetitif pada tugas UI/agen otomatis (misalnya, benchmark bergaya OSWorld atau benchmark agen yang melaporkan ≈50% keberhasilan pada otomasi kompleks dalam beberapa pengujian), menunjukkan kegunaan untuk alur kerja berskala meski dengan mode kegagalan yang nontrivial.
Keterbatasan & catatan keselamatan
- Bukan model frontier: Anthropic secara eksplisit mengklasifikasikan Haiku 4.5 sebagai tidak mendorong frontier; model ini dioptimalkan untuk efisiensi alih-alih mendorong state of the art secara mutlak. (Anthropic)
- Perilaku sesekali pada topik sensitif: dalam beberapa prompt ilmiah / terkait bio-keamanan, Haiku 4.5 kadang mengembalikan informasi tingkat tinggi dengan catatan alih-alih penolakan tegas; Anthropic menandai itu sebagai area yang sedang ditingkatkan.
- Pemikiran diperluas dapat mengubah perilaku (kadang meningkatkan asimetri dalam respons).
Kasus penggunaan yang direkomendasikan
- Pengodean berbasis agen & orkestrasi multi-agen: sub-agen cepat, refaktorasi kode iteratif, uji otomatis dan pembuatan patch. (Sangat cocok.)
- Alur kerja pelanggan real-time dan ber-volume tinggi: asisten chat, otomasi internal di mana biaya per permintaan penting. (Sangat cocok.)
- Alur kerja berkemampuan alat & kontrol komputer: otomatisasi tugas GUI/CLI, alur dokumen dan rantai alat di mana latensi rendah membantu. (Sangat cocok.)
- Tidak direkomendasikan (tanpa kontrol): peran mandiri yang memerlukan desain urutan ilmiah tingkat frontier atau tugas biosekuriti jaminan tinggi. (Gunakan kehati-hatian.)
Cara mengakses API Claude Haiku 4.5
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kredensial akses kunci API dari antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim permintaan ke API Claude Haiku 4.5
Pilih endpoint “claude-haiku-4-5-20251001” untuk mengirim permintaan API dan setel badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah Anthropic Messages dan Chat.
Masukkan pertanyaan atau permintaan Anda ke dalam bidang content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan verifikasi hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.