Claude Opus 4.5 là gì
Claude Opus 4.5 là mẫu LLM (“Opus”-class) mới nhất của Anthropic trong gia đình Claude 4.5, được xây dựng cho lập luận phức tạp, kỹ nghệ phần mềm chuyên nghiệp và các quy trình tác nhân tự động chạy dài. Anthropic định vị Opus 4.5 là lựa chọn hạng cao cấp cân bằng giữa năng lực tối đa với hiệu năng thực tế và mức giá dễ tiếp cận hơn so với các bản Opus trước. Bản phát hành này hoàn thiện họ Claude 4.5 cùng với Sonnet 4.5 và Haiku 4.5.
Gia đình/định danh mô hình: Claude Opus 4.5 (tên API Anthropic ghi là claude-opus-4-5-20251101).
Tính năng cốt lõi của Claude Opus 4.5
- Mục đích / thế mạnh chính: Kỹ nghệ phần mềm chuyên nghiệp, tác nhân nâng cao, mô hình hóa bảng tính/tài chính, quy trình đa lượt mở rộng và “computer use” (tương tác với GUI, bảng tính, trình duyệt).
- Tham số Effort: Tham số yêu cầu mới (low / medium / high) cho phép đánh đổi compute/token lấy độ sâu lập luận. Hữu ích để cân chỉnh độ trễ/chi phí với mức độ chi tiết của câu trả lời.
- Tăng cường computer use & thị giác: Hành động zoom mới và cải thiện khả năng quan sát màn hình/Giao diện người dùng giúp mô hình đọc được chi tiết UI và hình ảnh tinh vi trước khi thực hiện hành động.
- Liên tục tư duy: “Thinking block preservation” — Opus 4.5 bảo toàn các khối suy luận trước đó để duy trì tính liên tục trong các phiên dài.
Thông số kỹ thuật của Claude Opus 4.5
Định danh mô hình: claude-opus-4-5-20251101 (thường dùng trong gọi API).
Cửa sổ ngữ cảnh & giới hạn token: đầu vào 200.000 token / đầu ra 64.000 token
Phương thức (modalities): hỗ trợ văn bản, mã nguồn, hình ảnh và tài liệu ở đầu vào; đầu ra là văn bản (có cấu trúc và không cấu trúc). Tích hợp đối tác bổ sung tính năng (dự đoán theo lô, gọi hàm, bộ nhớ đệm prompt).
Hiệu năng benchmark & kết quả thực nghiệm
Anthropic và nhiều nguồn độc lập đã công bố/báo cáo kết quả benchmark và hành vi kiểm thử cho Opus 4.5. Dưới đây là các con số và tuyên bố đáng chú ý:
- SWE-bench (benchmark kỹ nghệ phần mềm) — SWE-bench ≈ 80,9% theo đánh giá do Anthropic báo cáo. Opus 4.5 dẫn đầu ở 7/8 ngôn ngữ lập trình trên bài kiểm tra SWE-bench Multilingual của Anthropic.
- Độ bền tác nhân trong thực tế — cải thiện vận hành tác nhân liên tục và xử lý tốt hơn các quy trình đa bước và điều phối công cụ.
- Aider Polyglot: +10,6% so với Sonnet 4.5 trên tác vụ mã hóa phức tạp. Anthropic
- Terminal Bench: +15% so với Sonnet 4.5 trong quy trình terminal/mã nguồn đa bước.
- Vending-Bench (lập kế hoạch tầm xa): cải thiện 29% so với Sonnet 4.5 trên các tác vụ tác nhân tầm xa.
- Mã hóa tự động: Anthropic báo cáo hiệu năng ổn định trong các phiên mã hóa tự động kéo dài 30 phút (so với các mô hình trước đây suy giảm sớm hơn).
Trường hợp sử dụng điển hình và ưu tiên
- Kỹ nghệ phần mềm phức tạp & script dài — sinh mã, gỡ lỗi, tái cấu trúc nhiều tệp và tác nhân mã hóa tự động.
- Tác nhân tự động và điều phối công cụ — xâu chuỗi gọi API, duyệt web, tự động hóa bảng tính và quy trình đa bước dài nơi trạng thái cần được duy trì qua nhiều lượt.
- Tổng hợp tài liệu lớn & nghiên cứu — bản ghi pháp lý, báo cáo dài, viết nhiều chương và tóm tắt trên tập liệu rất lớn nhờ ngữ cảnh mở rộng và cơ chế nén.
- Tự động hóa doanh nghiệp — công cụ nội bộ, trích xuất dữ liệu từ tệp/bảng tính và tác nhân vận hành quy trình kinh doanh liên tục.
Claude Opus 4.5 vs Gemini 3.0 Pro vs GPT 5.1
| Khía cạnh | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| Tên mô hình | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| Điểm mạnh chính | Độ tin cậy tác nhân tầm xa, hiệu quả token, lập trình & điều phối đa tác nhân, tập trung an toàn. | Lập luận tiên phong, hiệu năng đa phương thức, điểm dẫn đầu bảng xếp hạng (LMArena, GPQA, MathArena); tích hợp rộng với hệ sinh thái Google. | Lập luận thích ứng, trải nghiệm nhà phát triển, bộ nhớ đệm prompt mở rộng (24h), tương tác nhanh và bộ công cụ lập trình. |
| Giá tham chiếu (đầu vào/đầu ra trên 1M token) | $5 / $25 (Anthropic nêu cho Opus 4.5). — giá preview cho doanh nghiệp. | Các bậc preview được báo cáo ≈ $2 / $12 hoặc bậc cao hơn (thay đổi theo khu vực / gói). | $1,25 / $10 (giá API GPT-5.1 do OpenAI công bố). |
| Ngữ cảnh / cửa sổ & bộ nhớ | Tập trung nén ngữ cảnh, tính năng bộ nhớ, và phiên dài hiệu quả; tinh chỉnh cho các lần chạy đa tác nhân. | Cửa sổ ngữ cảnh rất lớn được báo cáo (1M token ở bản preview) và đầu vào đa phương thức (văn bản, hình ảnh, âm thanh, video). | Bộ nhớ đệm prompt mở rộng và lập luận thích ứng hiệu quả; cơ chế đệm nhằm giảm chi phí & độ trễ cho các lượt tiếp theo. |
| Phù hợp nhất cho | Tác nhân doanh nghiệp, quy trình mã hóa tự động dài, lượt chạy dài nhạy chi phí, môi trường quản trị với kiểm soát an toàn. | Nghiên cứu/benchmark, lập luận đa phương thức, tích hợp sâu trong hệ sinh thái Google (Search/Ads/Apps). | Sản phẩm cho nhà phát triển tương tác, trợ lý mã hóa độ trễ thấp, quy trình lặp lại hưởng lợi từ prompt caching. |
Cách truy cập API Claude opus 4.5
Bước 1: Đăng ký khóa API
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy khóa API (thông tin xác thực truy cập) của giao diện. Nhấp “Add Token” tại mục token API trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API Claude opus 4.5
Chọn endpoint “claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp Apifox test để bạn tiện thử nghiệm. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base URL là định dạng [Anthropic Messages] và định dạng [Chat].
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mô hình sẽ phản hồi . Xử lý phản hồi API để lấy câu trả lời đã tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời đã tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro Preview API