Mô hìnhGiáDoanh nghiệp
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Công ty
Về chúng tôiDoanh nghiệp
Tài nguyên
Mô hình AIBlogNhật ký thay đổiHỗ trợ
Điều khoản Dịch vụChính sách Bảo mật
© 2026 CometAPI · All rights reserved
Home/Models/Anthropic/Claude Haiku 4.5
C

Claude Haiku 4.5

Đầu vào:$0.8/M
Đầu ra:$4/M
Bối cảnh:200K
Đầu ra tối đa:8K
Mô hình nhanh nhất, tiết kiệm chi phí nhất.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Claude Haiku 4.5 là một mô hình ngôn ngữ hạng nhỏ được tối ưu theo mục đích từ Anthropic, phát hành vào giữa tháng 10 năm 2025. Mô hình này được định vị như một lựa chọn nhanh, chi phí thấp trong dòng Claude, đồng thời vẫn giữ năng lực mạnh ở các tác vụ như lập trình, điều phối tác nhân và các quy trình “sử dụng máy tính” tương tác, giúp tăng thông lượng và giảm chi phí đơn vị cho triển khai ở quy mô doanh nghiệp.

Các tính năng chính

  • Tốc độ & hiệu quả chi phí: Haiku 4.5 được mô tả là nhanh hơn trên 2 lần so với Sonnet 4 và khoảng một phần ba chi phí của Sonnet 4 (và rẻ hơn nhiều so với Opus), phù hợp cho nhu cầu mở rộng.
  • Tư duy mở rộng: Mẫu Haiku đầu tiên hỗ trợ tư duy mở rộng (tư duy tóm tắt/đan xen, ngân sách tư duy có thể cấu hình) để tăng cường suy luận đa bước trong khi cân bằng độ trễ.
  • Công cụ & sử dụng máy tính: Hỗ trợ đầy đủ các công cụ Claude (bash, thực thi mã, trình soạn thảo văn bản, tìm kiếm web và tự động hóa thao tác máy tính). Thiết kế cho quy trình hướng tác nhân và kiến trúc tác nhân phụ.
  • Cửa sổ ngữ cảnh lớn: 200k token (với tùy chọn 1M ngữ cảnh khả dụng trên các mô hình lớn hơn như bản beta cho các lớp mô hình khác).

Chi tiết kỹ thuật

  • Dữ liệu huấn luyện & mốc cắt: Haiku 4.5 được huấn luyện trên tổ hợp dữ liệu độc quyền gồm dữ liệu công khai và có giấy phép, với mốc cắt huấn luyện khoảng tháng 2 năm 2025.
  • Tư duy mở rộng (một chế độ suy luận lai) được hỗ trợ để mô hình có thể đánh đổi độ trễ lấy suy luận sâu hơn khi được yêu cầu.
  • Cửa sổ ngữ cảnh khi phát hành là 200,000 tokens, và mô hình được thiết kế nhận thức ngữ cảnh (theo dõi mức sử dụng cửa sổ).
  • Hiệu năng / thông lượng: Báo cáo cộng đồng ban đầu và thử nghiệm của Anthropic ghi nhận OTPS rất cao (output tokens/sec) và tốc độ thực tế khoảng ~200+ tokens/sec trong một số thử nghiệm nội bộ/giai đoạn sớm — nhanh hơn nhiều so với nhiều mô hình tầm trung tương đương.

Hiệu năng benchmark

SWE-Bench (lập trình): Haiku 4.5 đạt ~73.3% trên SWE-Bench Verified — Anthropic nhấn mạnh kết quả này đặt Haiku 4.5 vào nhóm các mô hình lập trình tốt nhất trong phân khúc của nó.

Terminal / dòng lệnh / kiểm thử công cụ: Anthropic báo cáo ~41% trên Terminal-Bench (tập trung vào dòng lệnh) và kết quả tương đương Sonnet 4 cũng như một số mô hình tầm trung cạnh tranh khác trên nhiều benchmark sử dụng công cụ.

Tuân thủ chỉ dẫn & văn bản slide: ví dụ nội bộ của Anthropic cho thấy Haiku 4.5 vượt các mô hình trước đó ở một số tác vụ tuân thủ chỉ dẫn (ví dụ, tạo văn bản slide: 65% so với 44% cho một mô hình cao cấp trước đó trong benchmark của họ).

Tự động hóa thực tế / tác vụ tác nhân: đánh giá bên thứ ba và những người dùng sớm báo cáo tỷ lệ thành công cạnh tranh trên các tác vụ UI/tác nhân tự động (ví dụ, benchmark kiểu OSWorld hoặc tác nhân báo cáo ≈50% thành công trên các tự động hóa phức tạp trong một số thử nghiệm), cho thấy hữu ích cho quy mô lớn dù vẫn có các dạng lỗi không nhỏ.

Hạn chế & ghi chú an toàn

  • Không phải mô hình frontier: Anthropic phân loại rõ Haiku 4.5 là không thúc đẩy frontier; mô hình này được tối ưu cho hiệu quả thay vì đẩy giới hạn trình độ cao nhất. (Anthropic)
  • Hành vi đôi khi với chủ đề nhạy cảm: trong một số lời nhắc khoa học/sinh học an toàn, Haiku 4.5 đôi khi trả về thông tin cấp cao kèm lưu ý thay vì từ chối dứt khoát; Anthropic xem đây là hạng mục đang tiếp tục cải thiện.
  • Tư duy mở rộng có thể thay đổi hành vi (đôi khi làm tăng tính bất đối xứng trong phản hồi).

Trường hợp sử dụng khuyến nghị

  • Lập trình hướng tác nhân & điều phối đa tác nhân: tác nhân phụ nhanh, tái cấu trúc mã lặp, tự kiểm thử và tạo bản vá. (Phù hợp.)
  • Quy trình khách hàng theo thời gian thực, khối lượng lớn: trợ lý trò chuyện, tự động hóa nội bộ nơi chi phí mỗi yêu cầu quan trọng. (Phù hợp.)
  • Quy trình dùng công cụ & điều khiển máy tính: tự động hóa tác vụ GUI/CLI, quy trình tài liệu và chuỗi công cụ nơi độ trễ thấp có lợi. (Phù hợp.)
  • Không khuyến nghị (khi không có kiểm soát): vai trò độc lập yêu cầu thiết kế trình tự khoa học cấp độ frontier hoặc tác vụ an ninh sinh học có độ đảm bảo cao. (Cần thận trọng.)

Cách truy cập Claude Haiku 4.5 API

Bước 1: Đăng ký khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

khóa cometapi

Bước 2: Gửi yêu cầu tới Claude Haiku 4.5 API

Chọn endpoint “claude-haiku-4-5-20251001” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn thuận tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Anthropic Messages và Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Câu Hỏi Thường Gặp

How does Claude Haiku 4.5 compare to Claude Sonnet 4 in coding performance?

Claude Haiku 4.5 đạt mức hiệu năng tương đương Sonnet 4 về lập trình, sử dụng máy tính và các tác vụ của tác nhân, đồng thời chạy nhanh hơn 4-5x với chi phí chỉ bằng một phần nhỏ. Nó đạt 73,3% trên SWE-bench Verified.

Is Claude Haiku 4.5 fast enough for real-time customer service agents?

Có, Haiku 4.5 được tối ưu cho các ứng dụng nhạy cảm với độ trễ. Nó đưa ra phản hồi gần như tức thì, lý tưởng cho nhân viên dịch vụ khách hàng, chatbot và các trải nghiệm tương tác nơi thời gian phản hồi là tối quan trọng.

Can Claude Haiku 4.5 power sub-agents in multi-agent coding systems?

Có, Haiku 4.5 vượt trội ở khả năng thực thi song song và điều phối các tác nhân phụ, cho phép các hệ thống đa tác nhân xử lý các tái cấu trúc phức tạp, chuyển đổi và xây dựng tính năng lớn với chất lượng và tốc độ.

When should I use Claude Haiku 4.5 instead of Claude Sonnet 4.5?

Hãy chọn Haiku 4.5 cho các hoạt động khối lượng lớn, các sản phẩm gói miễn phí và các tác nhân phụ song song, nơi tốc độ và chi phí là quan trọng nhất. Dùng Sonnet 4.5 cho các suy luận phức tạp đòi hỏi năng lực trí tuệ hàng đầu.

Does Claude Haiku 4.5 support computer use and browser automation?

Có, Haiku 4.5 mang lại hiệu năng mạnh mẽ trong các tác vụ sử dụng máy tính, khiến nó phù hợp với các quy trình tự động hóa dựa trên trình duyệt cần ưu tiên tốc độ hơn độ chính xác tối đa.

Giá cả cho Claude Haiku 4.5

Khám phá mức giá cạnh tranh cho Claude Haiku 4.5, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Claude Haiku 4.5 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.8/M
Đầu ra:$4/M
Đầu vào:$1/M
Đầu ra:$5/M
-20%

Mã mẫu và API cho Claude Haiku 4.5

Claude Haiku 4.5 là một mô hình ngôn ngữ thuộc phân khúc nhỏ hơn, được tối ưu hóa theo mục đích từ Anthropic, phát hành vào giữa tháng 10 năm 2025. Mô hình này được định vị là một lựa chọn nhanh, chi phí thấp trong dòng Claude, vẫn duy trì năng lực mạnh mẽ cho các tác vụ như lập trình, điều phối tác tử và các quy trình làm việc tương tác kiểu “computer-use”, đồng thời cho phép thông lượng cao hơn nhiều và chi phí trên mỗi đơn vị thấp hơn cho các triển khai doanh nghiệp.
POST
/v1/messages
POST
/v1/chat/completions
Python
JavaScript
Curl
import anthropic
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

message = anthropic.Anthropic(
    base_url=BASE_URL,
    api_key=COMETAPI_KEY,
)
messages = message.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(messages.content[0].text)

Python Code Example

import anthropic
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

message = anthropic.Anthropic(
    base_url=BASE_URL,
    api_key=COMETAPI_KEY,
)
messages = message.messages.create(
    model="claude-haiku-4-5-20251001",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello, Claude"}],
)
print(messages.content[0].text)

JavaScript Code Example

import Anthropic from "@anthropic-ai/sdk";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com";

const anthropic = new Anthropic({
  apiKey: api_key,
  baseURL: base_url,
});

const message = await anthropic.messages.create({
  model: "claude-haiku-4-5-20251001",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Hello, Claude" }],
});
console.log(message.content[0].text);

Curl Code Example

curl https://api.cometapi.com/v1/messages \
     --header "Authorization: $COMETAPI_KEY" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-haiku-4-5-20251001",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Hello, Claude"}
    ]
}'

Các phiên bản của Claude Haiku 4.5

Lý do Claude Haiku 4.5 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
Phiên bảnMô tả
claude-haiku-4-5-20251001
cometapi-haiku-4-5-20251001phiên bản đặc biệt của cursor