Claude Haiku 4.5 là một mô hình ngôn ngữ hạng nhỏ được tối ưu theo mục đích từ Anthropic, ra mắt vào giữa tháng 10 năm 2025. Sản phẩm được định vị như một lựa chọn nhanh, chi phí thấp trong dòng Claude, vẫn giữ năng lực mạnh ở các tác vụ như lập trình, điều phối agent và các quy trình làm việc “sử dụng máy tính” tương tác, đồng thời cho phép thông lượng cao hơn nhiều và chi phí đơn vị thấp hơn cho triển khai doanh nghiệp.
Tính năng chính
- Tốc độ và hiệu quả chi phí: Haiku 4.5 được mô tả là nhanh hơn hơn gấp đôi so với Sonnet 4 và chi phí khoảng một phần ba của Sonnet 4 (và rẻ hơn nhiều so với Opus), khiến nó hấp dẫn cho nhu cầu mở rộng quy mô.
- Tư duy mở rộng: Mẫu Haiku đầu tiên hỗ trợ tư duy mở rộng (tư duy tóm tắt/đan xen, ngân sách suy luận có thể cấu hình) cho suy luận đa bước sâu hơn đồng thời cân bằng độ trễ.
- Công cụ & sử dụng máy tính: Hỗ trợ đầy đủ các công cụ của Claude (bash, thực thi mã, trình soạn thảo văn bản, tìm kiếm web và tự động hóa thao tác máy tính). Thiết kế cho quy trình làm việc hướng tác nhân và kiến trúc tác nhân con.
- Cửa sổ ngữ cảnh lớn: Cửa sổ ngữ cảnh 200k token (tùy chọn 1M ngữ cảnh khả dụng trên các mô hình lớn hơn ở chế độ beta cho các lớp mô hình khác).
Thông số kỹ thuật
- Dữ liệu huấn luyện & mốc cắt: Haiku 4.5 được huấn luyện trên tập hợp độc quyền gồm dữ liệu công khai và dữ liệu có giấy phép, với mốc cắt huấn luyện vào khoảng tháng 2 năm 2025.
- Tư duy mở rộng (một chế độ suy luận lai) được hỗ trợ để mô hình có thể đánh đổi độ trễ lấy khả năng suy luận sâu hơn khi được yêu cầu.
- Cửa sổ ngữ cảnh khi phát hành là 200.000 tokens, và mô hình được nhận biết ngữ cảnh rõ ràng (theo dõi mức sử dụng của cửa sổ).
- Hiệu năng / thông lượng: Báo cáo ban đầu từ cộng đồng và thử nghiệm của Anthropic cho thấy OTPS rất cao (output tokens/giây) và tốc độ thực tế khoảng ~200+ tokens/giây trong một số thử nghiệm nội bộ/giai đoạn đầu — nhanh hơn nhiều so với nhiều mô hình tầm trung tương đương.
Hiệu năng benchmark
SWE-Bench (lập trình): Haiku 4.5 đạt ~73.3% trên SWE-Bench Verified — kết quả được Anthropic nhấn mạnh là đưa Haiku 4.5 vào nhóm các mô hình lập trình tốt nhất thế giới trong phân khúc của nó.
Bài kiểm tra Terminal / dòng lệnh / công cụ: Anthropic báo cáo ~41% trên Terminal-Bench (tập trung vào dòng lệnh) và kết quả tương đương Sonnet 4 cùng một số mô hình biên tầm trung cạnh tranh khác trên nhiều benchmark sử dụng công cụ.
Tuân thủ hướng dẫn & văn bản slide: ví dụ nội bộ của Anthropic cho thấy Haiku 4.5 vượt trội so với các mô hình trước đây trên một số tác vụ tuân thủ hướng dẫn (ví dụ, tạo văn bản slide: 65% vs 44% cho một mô hình cao cấp trước đó trong benchmark của họ).
Tự động hóa thực tế / tác vụ agent: đánh giá của bên thứ ba và người dùng sớm báo cáo tỷ lệ thành công cạnh tranh trên các tác vụ UI/agent tự động (ví dụ, kiểu OSWorld hoặc các benchmark agent báo cáo ≈50% thành công trên tự động hóa phức tạp trong một số thử nghiệm), cho thấy hữu ích cho quy trình làm việc ở quy mô lớn dù vẫn có các chế độ lỗi đáng kể.
Hạn chế & ghi chú an toàn
- Không phải mô hình tiên phong: Anthropic phân loại rõ ràng Haiku 4.5 là không thuộc nhóm tiên phong; mô hình được tối ưu cho hiệu quả hơn là đẩy giới hạn trình độ công nghệ. (Anthropic)
- Hành vi đôi khi nhạy cảm với chủ đề: trong một số đề bài khoa học/liên quan an toàn sinh học, Haiku 4.5 đôi khi trả về thông tin cấp cao kèm lưu ý thay vì từ chối nghiêm ngặt; Anthropic coi đây là khu vực đang tiếp tục cải thiện.
- Tư duy mở rộng có thể thay đổi hành vi (đôi khi tăng tính bất đối xứng trong phản hồi).
Trường hợp sử dụng được khuyến nghị
- Lập trình theo tác nhân & điều phối đa tác nhân: tác nhân con nhanh, tái cấu trúc mã lặp, kiểm thử tự động và tạo bản vá. (Phù hợp.)
- Quy trình khách hàng thời gian thực, khối lượng lớn: trợ lý trò chuyện, tự động hóa nội bộ nơi chi phí mỗi yêu cầu quan trọng. (Phù hợp.)
- Quy trình có công cụ & điều khiển máy tính: tự động hóa tác vụ GUI/CLI, quy trình tài liệu và chuỗi công cụ nơi độ trễ thấp hữu ích. (Phù hợp.)
- Không khuyến nghị (nếu thiếu kiểm soát): vai trò độc lập đòi hỏi thiết kế chuỗi khoa học ở mức tiên phong hoặc tác vụ an ninh sinh học đòi hỏi độ tin cậy cao. (Cần thận trọng.)
Cách truy cập API Claude Haiku 4.5
Bước 1: Đăng ký lấy khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API thông tin xác thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API Claude Haiku 4.5
Chọn endpoint “claude-haiku-4-5-20251001” để gửi yêu cầu API và thiết lập thân yêu cầu. Phương thức yêu cầu và thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. URL cơ sở là Anthropic Messages và Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung — đây là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo ra.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.