Claude Opus 4.5 là gì
Claude Opus 4.5 là mô hình ngôn ngữ lớn (LLM) thuộc lớp “Opus” mới nhất của Anthropic trong dòng Claude 4.5, được xây dựng cho suy luận phức tạp, kỹ thuật phần mềm chuyên nghiệp và các quy trình tác tử chạy dài hạn. Anthropic định vị Opus 4.5 là một lựa chọn cao cấp, cân bằng giữa năng lực tối đa với hiệu năng thực tiễn và mức giá dễ tiếp cận hơn so với các bản phát hành Opus trước đó. Bản phát hành này hoàn thiện dòng Claude 4.5 cùng với Sonnet 4.5 và Haiku 4.5.
Họ mô hình / định danh: Claude Opus 4.5 (tên API được Anthropic ghi là claude-opus-4-5-20251101).
Các tính năng cốt lõi của Claude Opus 4.5
- Mục đích / thế mạnh chính: Kỹ thuật phần mềm chuyên nghiệp, tác tử nâng cao, mô hình hóa bảng tính/tài chính, quy trình nhiều lượt kéo dài, và “computer use” (tương tác với GUI, bảng tính, trình duyệt).
- Tham số effort: Tham số yêu cầu mới (low / medium / high) dùng để đánh đổi khả năng tính toán/token lấy độ sâu suy luận. Hữu ích để điều chỉnh độ trễ/chi phí so với mức độ đầy đủ của câu trả lời.
- Computer use & thị giác được tăng cường: Hành động zoom mới và khả năng kiểm tra màn hình/UI được cải thiện để mô hình có thể đọc các phần tử UI nhỏ và hình ảnh chi tiết trước khi thực hiện hành động.
- Tính liên tục của tư duy: “Thinking block preservation” — Opus 4.5 bảo toàn các khối suy luận trước đó để duy trì tính liên tục trong các phiên dài.
Chi tiết kỹ thuật của Claude Opus 4.5
Định danh mô hình: claude-opus-4-5-20251101 (thường được dùng cho các lệnh gọi API).
Cửa sổ ngữ cảnh & giới hạn token: đầu vào 200.000 token / đầu ra 64.000 token
Phương thức hỗ trợ: hỗ trợ đầu vào văn bản, mã, hình ảnh và tài liệu; đầu ra là văn bản (có cấu trúc và không có cấu trúc). Các tích hợp đối tác bổ sung thêm tính năng (batch predictions, function calling, prompt caching).
Hiệu năng benchmark & kết quả thực nghiệm
Anthropic và nhiều đơn vị độc lập đã công bố/báo cáo kết quả benchmark và hành vi kiểm thử của Opus 4.5. Dưới đây là những tuyên bố và con số đáng chú ý nhất:
- SWE-bench (benchmark kỹ thuật phần mềm) — SWE-bench ≈ 80,9% trong các đánh giá do Anthropic báo cáo. Opus 4.5 dẫn đầu ở 7/8 ngôn ngữ lập trình trong các bài kiểm tra SWE-bench Multilingual của Anthropic.
- Độ bền tác tử trong thực tế — cải thiện khả năng vận hành tác tử liên tục và xử lý tốt hơn các quy trình nhiều bước cũng như điều phối công cụ.
- Aider Polyglot: cải thiện +10,6% so với Sonnet 4.5 trên các tác vụ lập trình phức tạp. Anthropic
- Terminal Bench: cải thiện +15% so với Sonnet 4.5 trong các quy trình terminal/mã nhiều bước.
- Vending-Bench (lập kế hoạch dài hạn): cải thiện 29% so với Sonnet 4.5 trên các tác vụ tác tử dài hạn.
- Lập trình tự động: Anthropic báo cáo hiệu năng ổn định trong các phiên lập trình tự động kéo dài 30 phút (so với các mô hình trước đó suy giảm sớm hơn).
Các trường hợp sử dụng điển hình và ưu tiên
- Kỹ thuật phần mềm phức tạp & script dài — sinh mã, gỡ lỗi, tái cấu trúc nhiều tệp, và tác tử lập trình tự động.
- Tác tử tự động và điều phối công cụ — xâu chuỗi các lệnh gọi API, duyệt web, tự động hóa bảng tính, và các quy trình dài nhiều bước nơi trạng thái phải được bảo toàn qua nhiều lượt.
- Tổng hợp tài liệu lớn & nghiên cứu — bản tóm lược pháp lý, báo cáo dài, viết nhiều chương, và tóm tắt trên các kho ngữ liệu rất lớn nhờ ngữ cảnh mở rộng và nén ngữ cảnh.
- Tự động hóa doanh nghiệp — công cụ nội bộ, trích xuất dữ liệu từ tệp/bảng tính, và các tác tử vận hành liên tục các quy trình kinh doanh.
Claude Opus 4.5 so với Gemini 3.0 Pro so với GPT 5.1
| Dimension | Claude Opus 4.5 (Anthropic) | Gemini 3.0 Pro (Google) | GPT 5.1 (OpenAI) |
|---|---|---|---|
| Tên mô hình | claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101 | gemini-3-pro-preview-thinking;gemini-3-pro-preview | gpt-5.1-chat-latest;gpt-5.1 |
| Thế mạnh chính | Độ tin cậy của tác tử dài hạn, hiệu quả token, lập trình & điều phối đa tác tử, tập trung vào an toàn. | Suy luận tiên phong, hiệu năng đa phương thức, điểm số dẫn đầu bảng xếp hạng (LMArena, GPQA, MathArena); tích hợp rộng với Google. | Suy luận thích ứng, trải nghiệm thuận tiện cho nhà phát triển, prompt caching mở rộng (24h), tính tương tác nhanh và công cụ lập trình. |
| Mức giá đại diện (đầu vào/đầu ra trên 1M token) | $5 / $25 (Anthropic công bố cho Opus 4.5). — giá preview cho doanh nghiệp. | Các mức preview được báo cáo khoảng $2 / $12 hoặc các mức cao hơn (thay đổi theo khu vực / gói). | $1.25 / $10 (OpenAI công bố giá API GPT-5.1). |
| Ngữ cảnh / cửa sổ & bộ nhớ | Tập trung vào nén ngữ cảnh, tính năng bộ nhớ và các phiên dài hiệu quả; được tinh chỉnh cho các lần chạy đa tác tử. | Cửa sổ ngữ cảnh rất lớn được báo cáo (1M token trong preview) và đầu vào đa phương thức (văn bản, hình ảnh, âm thanh, video). | Prompt caching mở rộng và suy luận thích ứng hiệu quả; caching nhằm giảm chi phí & độ trễ cho các lượt tiếp theo. |
| Phù hợp nhất cho | Tác tử doanh nghiệp, quy trình mã tự động dài, các lần chạy dài nhạy cảm về chi phí, môi trường được quản lý với kiểm soát an toàn. | Nghiên cứu/benchmark, suy luận đa phương thức, các tính năng tích hợp trong hệ sinh thái Google (Search/Ads/Apps). | Sản phẩm dành cho nhà phát triển có tính tương tác cao, hỗ trợ lập trình độ trễ thấp, quy trình lặp lại được hưởng lợi từ prompt caching. |
Cách truy cập API Claude opus 4.5
Bước 1: Đăng ký để lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API Claude opus 4.5
Chọn endpoint “claude-opus-4-5-20251101-thinking;claude-opus-4-5-20251101” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài kiểm tra Apifox để bạn thuận tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url ở định dạng Anthropic Messages và định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro Preview API