Claude Opus 4.5 là mẫu "Opus-class" mới nhất của Anthropic (ra mắt vào cuối tháng 11 năm 2025). Nó được định vị là mẫu máy hàng đầu dành cho kỹ thuật phần mềm chuyên nghiệp, quy trình làm việc của đại lý dài hạn và các nhiệm vụ doanh nghiệp có rủi ro caovà Anthropic cố tình định giá nó để làm cho khả năng cao dễ tiếp cận hơn với người dùng sản xuất. Dưới đây tôi sẽ giải thích những gì Claude Opus 4.5 API là, mô hình hoạt động như thế nào trên các tiêu chuẩn kỹ thuật thực tế, chính xác là như thế nào giá hoạt động (API và đăng ký), so sánh với các mô hình Anthropic cũ và các đối thủ cạnh tranh (OpenAI, Google Gemini) và các phương pháp hay nhất thực tế để chạy khối lượng công việc sản xuất một cách hiệu quả về chi phí. Tôi cũng bao gồm mã hỗ trợ và bộ công cụ tính toán chi phí & chuẩn mực nhỏ bạn có thể sao chép và chạy.
API Claude Opus 4.5 là gì?
Claude Opus 4.5 là mô hình Opus mới nhất: một mô hình đa phương thức, năng lực cao được tinh chỉnh đặc biệt cho kỹ thuật phần mềm chuyên nghiệp, sử dụng công cụ agentic (tức là gọi và soạn thảo các công cụ bên ngoài) và các tác vụ sử dụng máy tính. Nó vẫn giữ nguyên khả năng tư duy mở rộng (lập luận nội bộ từng bước minh bạch mà bạn có thể truyền phát) và bổ sung các điều khiển thời gian chạy chi tiết (đáng chú ý là effort tham số). Anthropic định vị mô hình này phù hợp với các tác nhân sản xuất, di chuyển/cải tiến mã và quy trình làm việc của doanh nghiệp đòi hỏi tính mạnh mẽ và số lần lặp thấp hơn.
Khả năng API cốt lõi và UX của nhà phát triển
Opus 4.5 hỗ trợ:
- Tạo văn bản chuẩn + hướng dẫn có độ trung thực cao.
- Chế độ suy nghĩ mở rộng/lý luận nhiều bước (hữu ích cho việc lập trình, tài liệu dài).
- Sử dụng công cụ (tìm kiếm trên web, thực thi mã, công cụ tùy chỉnh), bộ nhớ đệm và nhắc nhở.
- “Claude Code” và luồng tác nhân (tự động hóa các tác vụ nhiều bước trên cơ sở mã).
Claude Opus 4.5 hoạt động như thế nào?
Opus 4.5 là tiêu chuẩn tiên tiến nhất về kỹ thuật phần mềm — tuyên bố ~80.9% trên SWE-bench đã được xác minhvà đạt điểm số cao trong các bài kiểm tra "sử dụng máy tính" như OSWorld. Opus 4.5 có thể ngang bằng hoặc vượt trội hơn hiệu suất của Sonnet 4.5 ở mức sử dụng token thấp hơn (tức là hiệu quả token cao hơn).
Tiêu chuẩn kỹ thuật phần mềm (SWE-bench / Terminal Bench / Aider Polyglot): Anthropic báo cáo Opus 4.5 dẫn đầu Đã xác minh băng ghế dự bị SWE, cải thiện Terminal Bench bằng ~ 15% so với Sonnet 4.5 và cho thấy một 10.6% tìm hiểu về Aider Polyglot và Sonnet 4.5 (so sánh nội bộ).
Mã hóa tự động, dài hạn: Anthropic: Opus 4.5 giữ hiệu suất ổn định trong Các buổi lập trình tự chủ kéo dài 30 phút và cho thấy ít ngõ cụt hơn trong quy trình làm việc nhiều bước. Đây là một phát hiện nội bộ được lặp lại trong các bài kiểm tra tác nhân của họ.
Cải tiến nhiệm vụ thực tế (Vending-Bench / BrowseComp-Plus, v.v.): Trích dẫn nhân học + 29% trên Vending-Bench (nhiệm vụ tầm xa) so với Sonnet 4.5 và số liệu tìm kiếm tác nhân được cải thiện trên BrowseComp-Plus.

Một số điểm chính rút ra từ báo cáo:
- Lãnh đạo mã hóa: Opus 4.5 thường đánh bại các phiên bản Opus/Sonnet trước đó và nhiều mô hình đối thủ cạnh tranh cùng thời về tổng hợp chuẩn mực kỹ thuật phần mềm (các phiên bản SWE-bench Verified và Terminal-bench).
- Tự động hóa văn phòng: người đánh giá nhấn mạnh khả năng tạo bảng tính và PowerPoint tốt hơn — những cải tiến giúp giảm khối lượng công việc hậu chỉnh sửa cho các nhà phân tích và nhóm sản phẩm.
- Độ tin cậy của tác nhân và công cụ: Opus 4.5 cải thiện quy trình làm việc của tác nhân nhiều bước và các tác vụ chạy dài, giảm thiểu lỗi trong các đường ống nhiều cuộc gọi.
Claude Opus 4.5 có giá bao nhiêu?
Đây là câu hỏi chính mà bạn đã hỏi. Dưới đây tôi sẽ chia nhỏ nó thành Cấu trúc giá API, tầng đăng ký, ví dụ tính toán chi phívà điều đó có nghĩa gì trong thực tế.
Cấu trúc giá API — những gì Anthropic đã công bố
Anthropic cho Opus 4.5 đặt giá API của mô hình ở mức:
- Đầu vào (mã thông báo): 5 đô la cho 1,000,000 mã thông báo đầu vào
- Đầu ra (token): 25 đô la cho 1,000,000 token đầu ra
Anthropic đã định hình rõ ràng mức giá này như một sự giảm giá có chủ đích để hiệu suất của Opus có thể tiếp cận rộng rãi. Mã định danh mô hình dành cho các nhà phát triển là claude-opus-4-5-20251101 sợi dây .
In Sao chổiAPI, Claude Opus 4.5 API is 4 đô la/1 triệu token đầu vào và 20 đô la/1 triệu token đầu ra đối với Opus 4.5, rẻ hơn khoảng 20% so với giá chính thức của Google.
Bảng giá (đơn giản hóa, USD cho mỗi triệu token)
| Mẫu | Đầu vào ($ / MTok) | Đầu ra ($ / MTok) | Chú ý |
|---|---|---|---|
| Claude Opus 4.5 (cơ bản) | $5.00 | $25.00 | Giá niêm yết của Anthropic. |
| Claude Opus 4.1 | $15.00 | $75.00 | Phiên bản Opus cũ hơn — giá niêm yết cao hơn. |
| Bài thơ Sonnet 4.5 của Claude | $3.00 | $15.00 | Gia đình rẻ hơn cho nhiều nhiệm vụ. |
Lưu ý quan trọng: đây là giá dựa trên token (không phải theo yêu cầu). Bạn sẽ được tính phí dựa trên số token được sử dụng trong yêu cầu của bạn — cả đầu vào (lời nhắc + ngữ cảnh) và đầu ra (token mô hình được tạo ra).
Các gói đăng ký và cấp độ ứng dụng (người tiêu dùng/chuyên nghiệp/nhóm)
API rất phù hợp cho các bản dựng tùy chỉnh, trong khi gói đăng ký của Claude tích hợp quyền truy cập Opus 4.5 với các công cụ UI, loại bỏ lo ngại về việc sử dụng từng token trong các tình huống tương tác. Gói miễn phí (0 đô la) chỉ giới hạn ở tính năng trò chuyện cơ bản và mô hình Haiku/Sonnet, không bao gồm Opus.
Gói Pro (20 đô la mỗi tháng hoặc 17 đô la mỗi năm) và gói Max (100 đô la mỗi người mỗi tháng, cung cấp mức sử dụng gấp 5 đến 20 lần gói Pro) sẽ mở khóa Opus 4.5, Claude Code, thực thi tệp và số lượng dự án không giới hạn.
Làm thế nào để tối ưu hóa việc sử dụng mã thông báo?
- Sử dụng
effortthích hợp: chọnlowcho những câu trả lời thông thường,highchỉ khi cần thiết. - Ưu tiên các đầu ra và lược đồ có cấu trúc để tránh việc nói đi nói lại nhiều lần.
- Sử dụng API Tệp để tránh phải gửi lại các tài liệu lớn trong lời nhắc.
- Tóm tắt hoặc cô đọng ngữ cảnh theo chương trình trước khi gửi.
- Bộ nhớ đệm phản hồi lặp lại và sử dụng lại chúng khi các đầu vào nhắc nhở giống hệt hoặc tương tự nhau.
Quy tắc thực tế: sử dụng công cụ sớm (theo dõi mã thông báo theo yêu cầu), chạy thử nghiệm tải với lời nhắc đại diện và tính toán chi phí cho mỗi tác vụ thành công (không phải chi phí cho mỗi mã thông báo) để tối ưu hóa nhắm mục tiêu vào ROI thực.
Mã mẫu nhanh: gọi Claude Opus 4.5 + tính toán chi phí
Dưới đây là đã sẵn sàng sao chép ví dụ: (1) curl, (2) Python sử dụng SDK của Anthropic và (3) một trình trợ giúp Python nhỏ tính toán chi phí dựa trên các mã thông báo đầu vào/đầu ra được đo lường.
Quan trọng: lưu trữ khóa API của bạn một cách an toàn trong một biến môi trường. Các đoạn mã giả định
ANTHROPIC_API_KEYđược thiết lập. ID mô hình được hiển thị làclaude-opus-4-5-20251101(Nhân loại).
1) Ví dụ cURL (lời nhắc đơn giản)
curl https://api.anthropic.com/v1/complete \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model":"claude-opus-4-5-20251101",
"prompt":"You are an assistant. Given the following requirements produce a minimal Python function that validates emails. Return only code.",
"max_tokens": 600,
"temperature": 0.0
}'
2) Python (SDK nhân học) — yêu cầu cơ bản
# pip install anthropic
import os
from anthropic import Anthropic, HUMAN_PROMPT, AI_PROMPT
client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))
prompt = HUMAN_PROMPT + "Given the following requirements produce a minimal Python function that validates emails. Return only code.\n\nRequirements:\n- Python 3.10\n- Use regex\n" + AI_PROMPT
resp = client.completions.create(
model="claude-opus-4-5-20251101",
prompt=prompt,
max_tokens_to_sample=600,
temperature=0.0
)
print(resp.completion) # model output
Lưu ý: Tên SDK Python và chữ ký lệnh gọi của Anthropic có thể khác nhau; nội dung trên tuân theo các mẫu chung trong SDK công khai và tài liệu của họ — hãy kiểm tra tài liệu phiên bản đã cài đặt của bạn để biết tên phương thức chính xác. GitHub+1
3) Máy tính chi phí (Python) — tính toán chi phí từ mã thông báo
def compute_claude_cost(input_tokens, output_tokens,
input_price_per_m=5.0, output_price_per_m=25.0):
"""
Compute USD cost for Anthropic Opus 4.5 given token counts.
input_price_per_m and output_price_per_m are dollars per 1,000,000 tokens.
"""
cost_input = (input_tokens / 1_000_000) * input_price_per_m
cost_output = (output_tokens / 1_000_000) * output_price_per_m
return cost_input + cost_output
# Example: 20k input tokens and 5k output tokens
print(compute_claude_cost(20000, 5000)) # => ~0.225 USD
Mẹo: Đo lường token cho các yêu cầu thực tế bằng nhật ký máy chủ/dữ liệu từ xa của nhà cung cấp. Nếu bạn cần số lượng token hóa chính xác tại địa phương, hãy sử dụng bộ đếm token hóa tương thích với sơ đồ token hóa của Claude hoặc dựa vào bộ đếm token hóa của nhà cung cấp nếu có.
Khi nào bạn nên chọn Opus 4.5 thay vì các mẫu rẻ hơn?
Sử dụng Opus 4.5 khi:
- Bạn có kỹ thuật quan trọng đối với nhiệm vụ khối lượng công việc mà tính chính xác ở lần chạy đầu tiên có giá trị đáng kể (tạo mã phức tạp, đề xuất kiến trúc, chạy tác nhân dài).
- Nhiệm vụ của bạn cần công cụ phối hợp hoặc suy luận sâu sắc nhiều bước trong một quy trình làm việc duy nhất. Việc gọi công cụ lập trình là một yếu tố khác biệt quan trọng.
- Bạn đang cố gắng để giảm vòng lặp đánh giá của con người — độ chính xác cao hơn ở lần chạy đầu tiên của mô hình có thể giảm thời gian xử lý của con người và do đó giảm tổng chi phí.
Hãy xem xét Sonnet/Haiku hoặc các mô hình của đối thủ cạnh tranh khi:
- Trường hợp sử dụng của bạn là nói nhiều, âm lượng lớn, rủi ro thấp Tóm lại, token rẻ hơn và thông lượng cao hơn là yếu tố quan trọng. Sonnet (cân bằng) hoặc Haiku (nhẹ) có thể tiết kiệm chi phí hơn.
- Bạn cần giá rẻ nhất tuyệt đối cho mỗi mã thông báo xử lý và sẵn sàng đánh đổi một số khả năng/độ chính xác (ví dụ, tóm tắt đơn giản, trợ lý cơ bản).
Tôi nên thiết kế lời nhắc cho Opus 4.5 như thế nào?
Vai trò tin nhắn và chiến lược điền trước nào hiệu quả nhất?
Sử dụng mẫu gồm ba phần:
- WELFARE (vai trò: hệ thống): hướng dẫn chung — âm điệu, lan can, vai trò.
- Trợ lý (tùy chọn): ví dụ đóng hộp hoặc nội dung chuẩn bị.
- người sử dang (vai trò: người dùng): yêu cầu ngay lập tức.
Điền trước các ràng buộc cho thông báo hệ thống (định dạng, độ dài, chính sách an toàn, lược đồ JSON nếu bạn muốn đầu ra có cấu trúc). Đối với các tác nhân, hãy bao gồm thông số kỹ thuật công cụ và ví dụ sử dụng để Opus 4.5 có thể gọi các công cụ đó một cách chính xác.
Làm thế nào để sử dụng nén ngữ cảnh và lưu trữ tạm thời để lưu mã thông báo?
- Nén ngữ cảnh: Nén các phần cũ hơn của cuộc trò chuyện thành các bản tóm tắt ngắn gọn mà mô hình vẫn có thể sử dụng. Opus 4.5 hỗ trợ tự động hóa để rút gọn ngữ cảnh mà không làm mất các khối lập luận quan trọng.
- Lưu trữ tạm thời: phản hồi mô hình bộ nhớ đệm cho các lời nhắc lặp lại (Anthropic cung cấp các mẫu bộ nhớ đệm lời nhắc để giảm độ trễ/chi phí).
Cả hai tính năng đều giảm dấu vết của các tương tác dài và được khuyến nghị cho các quy trình làm việc dài hạn của tác nhân và trợ lý sản xuất.
Thực hành tốt nhất: Đạt được kết quả ở cấp độ Opus trong khi kiểm soát chi phí
1) Tối ưu hóa lời nhắc và ngữ cảnh
- Giảm thiểu bối cảnh không liên quan — chỉ gửi những thông tin cần thiết. Cắt bớt và tóm tắt cuộc trò chuyện trước đó nếu bạn dự kiến sẽ phải trao đổi qua lại nhiều.
- Sử dụng truy xuất/nhúng + RAG để chỉ lấy các tài liệu cần thiết cho một truy vấn cụ thể (thay vì gửi toàn bộ tập hợp dữ liệu dưới dạng mã thông báo nhắc). Tài liệu của Anthropic khuyến nghị sử dụng RAG và bộ nhớ đệm nhắc để giảm chi phí mã thông báo.
2) Lưu trữ và tái sử dụng các phản hồi khi có thể
Bộ nhớ đệm nhanh chóng: Nếu nhiều yêu cầu có lời nhắc giống hệt nhau hoặc gần giống hệt nhau, hãy lưu trữ đầu ra bộ nhớ đệm và phục vụ các phiên bản đã lưu trữ thay vì gọi lại mô hình mỗi lần. Các tài liệu của Anthropic đặc biệt nhấn mạnh việc lưu trữ lời nhắc bộ nhớ đệm như một giải pháp tối ưu hóa chi phí.
3) Chọn đúng mô hình cho công việc
- Sử dụng Opus 4.5 dành cho các nhiệm vụ quan trọng, có giá trị cao đối với doanh nghiệp, nơi mà việc thực hiện lại tốn kém.
- Sử dụng Sonnet 4.5 or Haiku 4.5 cho các tác vụ khối lượng lớn, rủi ro thấp. Chiến lược mô hình hỗn hợp này mang lại tỷ lệ giá/hiệu suất tốt hơn trên toàn bộ hệ thống.
4) Kiểm soát số lượng token tối đa và luồng phát trực tuyến
Giới Hạn max_tokens_to_sample cho đầu ra khi bạn không cần độ chi tiết đầy đủ. Sử dụng tính năng phát trực tuyến khi được hỗ trợ để dừng tạo sớm và tiết kiệm chi phí mã thông báo đầu ra.
Suy nghĩ cuối cùng: Opus 4.5 có đáng để áp dụng ngay không?
Opus 4.5 là một bước tiến đáng kể cho các tổ chức cần khả năng suy luận độ trung thực cao hơn, chi phí token thấp hơn cho các tương tác dài và hành vi tác nhân an toàn hơn, mạnh mẽ hơn. Nếu sản phẩm của bạn dựa trên suy luận bền vững (các tác vụ mã phức tạp, tác nhân tự động, tổng hợp nghiên cứu chuyên sâu hoặc tự động hóa Excel mạnh mẽ), Opus 4.5 cung cấp cho bạn các nút điều khiển bổ sung (nỗ lực, tư duy mở rộng, cải thiện khả năng xử lý công cụ) để điều chỉnh cho hiệu suất và chi phí thực tế.
Các nhà phát triển có thể truy cập Claude Opus 4.5 API thông qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình củaSao chổiAPI trong Sân chơi và tham khảo hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. VớietAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !
Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!
