Claude Haiku 4.5 là một mô hình ngôn ngữ hạng nhỏ được tối ưu theo mục đích từ Anthropic, phát hành vào giữa tháng 10 năm 2025. Mô hình này được định vị như một lựa chọn nhanh, chi phí thấp trong dòng Claude, đồng thời vẫn giữ năng lực mạnh ở các tác vụ như lập trình, điều phối tác nhân và các quy trình “sử dụng máy tính” tương tác, giúp tăng thông lượng và giảm chi phí đơn vị cho triển khai ở quy mô doanh nghiệp.
Các tính năng chính
- Tốc độ & hiệu quả chi phí: Haiku 4.5 được mô tả là nhanh hơn trên 2 lần so với Sonnet 4 và khoảng một phần ba chi phí của Sonnet 4 (và rẻ hơn nhiều so với Opus), phù hợp cho nhu cầu mở rộng.
- Tư duy mở rộng: Mẫu Haiku đầu tiên hỗ trợ tư duy mở rộng (tư duy tóm tắt/đan xen, ngân sách tư duy có thể cấu hình) để tăng cường suy luận đa bước trong khi cân bằng độ trễ.
- Công cụ & sử dụng máy tính: Hỗ trợ đầy đủ các công cụ Claude (bash, thực thi mã, trình soạn thảo văn bản, tìm kiếm web và tự động hóa thao tác máy tính). Thiết kế cho quy trình hướng tác nhân và kiến trúc tác nhân phụ.
- Cửa sổ ngữ cảnh lớn: 200k token (với tùy chọn 1M ngữ cảnh khả dụng trên các mô hình lớn hơn như bản beta cho các lớp mô hình khác).
Chi tiết kỹ thuật
- Dữ liệu huấn luyện & mốc cắt: Haiku 4.5 được huấn luyện trên tổ hợp dữ liệu độc quyền gồm dữ liệu công khai và có giấy phép, với mốc cắt huấn luyện khoảng tháng 2 năm 2025.
- Tư duy mở rộng (một chế độ suy luận lai) được hỗ trợ để mô hình có thể đánh đổi độ trễ lấy suy luận sâu hơn khi được yêu cầu.
- Cửa sổ ngữ cảnh khi phát hành là 200,000 tokens, và mô hình được thiết kế nhận thức ngữ cảnh (theo dõi mức sử dụng cửa sổ).
- Hiệu năng / thông lượng: Báo cáo cộng đồng ban đầu và thử nghiệm của Anthropic ghi nhận OTPS rất cao (output tokens/sec) và tốc độ thực tế khoảng ~200+ tokens/sec trong một số thử nghiệm nội bộ/giai đoạn sớm — nhanh hơn nhiều so với nhiều mô hình tầm trung tương đương.
Hiệu năng benchmark
SWE-Bench (lập trình): Haiku 4.5 đạt ~73.3% trên SWE-Bench Verified — Anthropic nhấn mạnh kết quả này đặt Haiku 4.5 vào nhóm các mô hình lập trình tốt nhất trong phân khúc của nó.
Terminal / dòng lệnh / kiểm thử công cụ: Anthropic báo cáo ~41% trên Terminal-Bench (tập trung vào dòng lệnh) và kết quả tương đương Sonnet 4 cũng như một số mô hình tầm trung cạnh tranh khác trên nhiều benchmark sử dụng công cụ.
Tuân thủ chỉ dẫn & văn bản slide: ví dụ nội bộ của Anthropic cho thấy Haiku 4.5 vượt các mô hình trước đó ở một số tác vụ tuân thủ chỉ dẫn (ví dụ, tạo văn bản slide: 65% so với 44% cho một mô hình cao cấp trước đó trong benchmark của họ).
Tự động hóa thực tế / tác vụ tác nhân: đánh giá bên thứ ba và những người dùng sớm báo cáo tỷ lệ thành công cạnh tranh trên các tác vụ UI/tác nhân tự động (ví dụ, benchmark kiểu OSWorld hoặc tác nhân báo cáo ≈50% thành công trên các tự động hóa phức tạp trong một số thử nghiệm), cho thấy hữu ích cho quy mô lớn dù vẫn có các dạng lỗi không nhỏ.
Hạn chế & ghi chú an toàn
- Không phải mô hình frontier: Anthropic phân loại rõ Haiku 4.5 là không thúc đẩy frontier; mô hình này được tối ưu cho hiệu quả thay vì đẩy giới hạn trình độ cao nhất. (Anthropic)
- Hành vi đôi khi với chủ đề nhạy cảm: trong một số lời nhắc khoa học/sinh học an toàn, Haiku 4.5 đôi khi trả về thông tin cấp cao kèm lưu ý thay vì từ chối dứt khoát; Anthropic xem đây là hạng mục đang tiếp tục cải thiện.
- Tư duy mở rộng có thể thay đổi hành vi (đôi khi làm tăng tính bất đối xứng trong phản hồi).
Trường hợp sử dụng khuyến nghị
- Lập trình hướng tác nhân & điều phối đa tác nhân: tác nhân phụ nhanh, tái cấu trúc mã lặp, tự kiểm thử và tạo bản vá. (Phù hợp.)
- Quy trình khách hàng theo thời gian thực, khối lượng lớn: trợ lý trò chuyện, tự động hóa nội bộ nơi chi phí mỗi yêu cầu quan trọng. (Phù hợp.)
- Quy trình dùng công cụ & điều khiển máy tính: tự động hóa tác vụ GUI/CLI, quy trình tài liệu và chuỗi công cụ nơi độ trễ thấp có lợi. (Phù hợp.)
- Không khuyến nghị (khi không có kiểm soát): vai trò độc lập yêu cầu thiết kế trình tự khoa học cấp độ frontier hoặc tác vụ an ninh sinh học có độ đảm bảo cao. (Cần thận trọng.)
Cách truy cập Claude Haiku 4.5 API
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới Claude Haiku 4.5 API
Chọn endpoint “claude-haiku-4-5-20251001” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn thuận tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Anthropic Messages và Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.