Cách sử dụng API Claude Opus 4.5

Anthropic đã phát hành Claude Opus 4.5 vào cuối tháng 11 năm 2025, là một mô hình Opus-class mạnh mẽ và hiệu quả hơn, hướng đến kỹ thuật phần mềm chuyên nghiệp, quy trình làm việc của agent và các tác vụ dài hạn. Phiên bản này có sẵn thông qua nền tảng nhà phát triển của Anthropic và CometAPI, đồng thời giới thiệu các điều khiển API mới (đáng chú ý là tham số effort), công cụ sử dụng máy tính được cải tiến, tư duy mở rộng và những cải tiến về hiệu suất token quan trọng trong sản xuất.

Dưới đây là hướng dẫn thực tế và chuyên nghiệp: những thay đổi, cách truy cập, cách sử dụng các biện pháp kiểm soát mới (nỗ lực, tư duy mở rộng, sử dụng công cụ, sử dụng tệp/máy tính), hướng dẫn về chi phí và tối ưu hóa, các cân nhắc về an toàn/quản trị và các mô hình tích hợp thực tế.

Claude Opus 4.5 thực chất là gì và tại sao nó lại quan trọng?

Claude Opus 4.5 là thành viên mới nhất trong dòng sản phẩm Opus của Anthropic (ra mắt ngày 24–25 tháng 11 năm 2025), tập trung vào khả năng lập luận và mã hóa tối đa, đồng thời cải thiện hiệu suất mã thông báo và cung cấp các điều khiển API mới để cân bằng giữa chi phí và tính toàn diện. Anthropic định vị Opus 4.5 là "mô hình thông minh nhất" mà hãng đã phát hành, hướng đến các tác vụ kỹ thuật phần mềm phức tạp, các tác nhân chạy lâu, tự động hóa bảng tính/Excel và các tác vụ đòi hỏi lập luận nhiều bước liên tục.

Những cập nhật chính trong Opus 4.5 là gì?

Anthropic thiết kế Opus 4.5 để cải thiện chiều sâu của lý luận và đại lý hành vi đồng thời giúp các nhà phát triển kiểm soát tốt hơn việc cân bằng giữa chi phí và độ trễ. Các điểm nổi bật của bản phát hành là:

Tham số nỗ lực (beta): một nút API hạng nhất kiểm soát số tiền "ngân sách suy nghĩ" mà Claude chi cho một yêu cầu (thường là low, medium, high). Nó ảnh hưởng đến lập luận, lệnh gọi công cụ và các mã thông báo "suy nghĩ" nội bộ để bạn có thể điều chỉnh tốc độ so với độ kỹ lưỡng cho mỗi lệnh gọi thay vì phải chuyển đổi mô hình. Đây là tính năng đặc trưng của Opus 4.5.
Phối hợp tác nhân và công cụ tốt hơn: Độ chính xác được cải thiện khi chọn công cụ, các lệnh gọi công cụ được cấu trúc tốt hơn và quy trình làm việc công cụ-kết quả mạnh mẽ hơn để xây dựng tác nhân và quy trình nhiều bước. Anthropic cung cấp tài liệu và hướng dẫn SDK cho quy trình "sử dụng công cụ".
Mã thông báo / hiệu quả chi phí — Anthropic báo cáo mức giảm sử dụng mã thông báo lên đến ~50% cho một số quy trình công việc so với Sonnet 4.5, cùng với ít lỗi gọi công cụ hơn và ít lần lặp lại hơn cho các tác vụ kỹ thuật phức tạp.
Khả năng đa phương thức được nâng cao: Cải thiện toàn diện về khả năng thị giác, lý luận và toán học.
Cửa sổ ngữ cảnh được mở rộng lên 200 mã thông báo, hỗ trợ các cuộc hội thoại dài, sâu và phân tích tài liệu phức tạp.

Những khả năng thực tế nào được cải thiện?

Nâng cấp hiệu suất

Phối hợp tác nhân và công cụ tốt hơn: độ chính xác được cải thiện khi chọn công cụ, các lệnh gọi công cụ được cấu trúc tốt hơn và quy trình công cụ-kết quả mạnh mẽ hơn để xây dựng tác nhân và quy trình nhiều bước. Anthropic cung cấp tài liệu và hướng dẫn SDK cho luồng "sử dụng công cụ". Xử lý ngữ cảnh được cải thiện, trình trợ giúp nén cho các lần chạy tác nhân dài và SDK công cụ hàng đầu để đăng ký và xác thực công cụ giúp Opus 4.5 tốt hơn cho việc xây dựng các tác nhân chạy tự động trong nhiều bước.
Khả năng đa phương thức được nâng cao: Cải thiện toàn diện về hiệu suất thị giác, lý luận và toán học.
Cửa sổ ngữ cảnh được mở rộng lên 200 mã thông báo, hỗ trợ các cuộc hội thoại dài, sâu và phân tích tài liệu phức tạp.

Lập trình và công việc dài hạn

Opus 4.5 tiếp tục được định hướng theo chuẩn mực cho các tác vụ mã hóa; nó giảm số lần lặp lại và lỗi gọi công cụ trong các tác vụ dài (di chuyển mã, tái cấu trúc, gỡ lỗi nhiều bước). Các báo cáo ban đầu và thẻ hệ thống của Anthropic ghi nhận hiệu suất bền vững được cải thiện trên các chuẩn mực kỹ thuật và hiệu quả vượt trội trong các quy trình dựa trên công cụ.

In SWE-bench, Opus 4.5 báo cáo điểm số hàng đầu trong các tiêu chuẩn đánh giá kỹ thuật phần mềm (Anthropic liệt kê 80.9% trên SWE-bench Verified trong tài liệu ra mắt) và khách hàng báo cáo những cải tiến về gỡ lỗi, chỉnh sửa nhiều tệp và các tác vụ mã dài hạn.

Claude Opus 4.5-SWE-1

Chi phí và hiệu quả

Anthropic thiết kế Opus 4.5 để cải thiện chiều sâu của lý luận và đại lý hành vi trong khi cung cấp cho các nhà phát triển khả năng kiểm soát tốt hơn đối với sự đánh đổi về chi phí/độ trễ:

Giảm giá So sánh với opus 4.1: 5 đô la (đầu vào) / 25 đô la (đầu ra) cho một triệu mã thông báo.
Cải thiện việc sử dụng mã thông báo: Giảm trung bình 50–75% mức tiêu thụ trong khi vẫn duy trì hiệu suất.
một nút API hạng nhất kiểm soát số tiền "ngân sách suy nghĩ" mà Claude chi cho một yêu cầu (thường là low, medium, high). Nó ảnh hưởng đến lập luận, lệnh gọi công cụ và các mã thông báo "suy nghĩ" nội bộ, do đó bạn có thể điều chỉnh tốc độ so với độ kỹ lưỡng cho mỗi lệnh gọi thay vì chuyển đổi mô hình. Đây là tính năng đặc trưng của Opus 4.5 (So với Sonnet 4.5: Nỗ lực trung bình → ít hơn 76% mã thông báo, hiệu suất tương đương; Nỗ lực cao → cải thiện hiệu suất 4.3%, giảm 48% mức sử dụng mã thông báo).

Làm thế nào để truy cập và sử dụng API Claude Opus 4.5?

Tôi có thể lấy quyền truy cập và chìa khóa bằng cách nào?

Tạo tài khoản nhà phát triển Anthropic / Claude. Đăng ký tại cổng thông tin dành cho nhà phát triển Claude/Anthropic và tạo khóa API thông qua Console (có luồng tổ chức/quản trị cho nhóm). API Tin nhắn là điểm cuối chính cho các tương tác kiểu trò chuyện/trợ lý.
Đối tác đám mây: Opus 4.5 cũng có sẵn thông qua các thị trường đám mây lớn như Google Vertex AI, Sao chổiAPI(Nền tảng tổng hợp API AI, cần sử dụng xác thực của nó)), Trong CometAPI, bạn có thể truy cập Claude opus 4.5 API thông qua định dạng Anthropic Messages và định dạng Chat.

Tôi nên xác thực yêu cầu của mình như thế nào?

Sử dụng mã thông báo người mang tiêu chuẩn: bao gồm một Authorization: Bearer $_API_KEY tiêu đề với mỗi lệnh gọi API. Yêu cầu được gửi qua JSON qua HTTPS; API Tin nhắn chấp nhận danh sách các tin nhắn có cấu trúc (hệ thống + người dùng + trợ lý).

Bắt đầu nhanh — Python (SDK chính thức)

Cài đặt SDK:

pip install anthropic

Ví dụ tối thiểu (đồng bộ):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Lệnh gọi này sử dụng mã định danh mô hình Opus 4.5 chuẩn. Đối với các điểm cuối do nhà cung cấp quản lý (Vertex, CometAPI, Foundry), hãy làm theo tài liệu của nhà cung cấp để xây dựng máy khách và cung cấp url và khóa của nhà cung cấp (ví dụ: https://api.cometapi.com/v1/messages cho CometAPI).

Bắt đầu nhanh — Python (CometAPI)

Bạn cần đăng nhập vào CometAPI và lấy khóa.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Làm thế nào để tôi sử dụng cái mới nỗ lực tham số và tư duy mở rộng?

Là gì nỗ lực tham số và tôi thiết lập nó như thế nào?

nỗ lực tham số là một điều khiển API hạng nhất được giới thiệu với Opus 4.5 để điều chỉnh lượng tính toán nội bộ và ngân sách mã thông báo mà mô hình dành để tạo ra đầu ra của nó. Các giá trị điển hình là low, mediumvà high. Sử dụng nó để cân bằng độ trễ và chi phí mã thông báo so với tính kỹ lưỡng:

low — câu trả lời nhanh chóng, hiệu quả cho các tác vụ thường xuyên và tự động hóa khối lượng lớn.
medium — cân bằng chất lượng/chi phí cho mục đích sản xuất.
high — phân tích sâu, lý luận nhiều bước hoặc khi độ chính xác là quan trọng nhất.

Nhân chủng học được giới thiệu effort cho Opus 4.5 (beta). Bạn phải bao gồm tiêu đề beta (ví dụ: effort-2025-11-24) và chỉ định output_config: { "effort": "low|medium|high" } (ví dụ hiển thị bên dưới). high là hành vi mặc định. Giảm nỗ lực sẽ giảm việc sử dụng mã thông báo và độ trễ nhưng có thể giảm nhẹ tính kỹ lưỡng. Sử dụng nó cho các tác vụ có thông lượng cao hoặc nhạy cảm với độ trễ.

Ví dụ:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Khi nào sử dụng which: sử dụng low cho các đường ống tự động (ví dụ: phân loại email), medium cho trợ lý tiêu chuẩn và high cho việc tạo mã, nghiên cứu chuyên sâu hoặc các tác vụ nhạy cảm với rủi ro. Anthropic nhấn mạnh tham số này như một yếu tố kiểm soát chính cho Opus 4.5.

Trong thử nghiệm SWE-bench:

Ở chế độ Nỗ lực trung bình: hiệu suất tương đương với Sonnet 4.5, nhưng mã thông báo đầu ra giảm 76%;

Ở chế độ Nỗ lực cao: hiệu suất vượt trội hơn Sonnet 4.5 khoảng 4.3 điểm phần trăm và số lượng mã thông báo giảm 48%.

Claude Opus 4.5-SWE-2

Tư duy mở rộng là gì và tôi có thể áp dụng nó như thế nào?

Tư duy Mở rộng (còn gọi là "tư duy mở rộng" hoặc "khối tư duy") cho phép mô hình thực hiện các chuỗi tư duy trung gian hoặc suy luận từng bước, đồng thời tùy chọn bảo toàn hoặc tóm tắt các khối tư duy nội bộ. API Messages hỗ trợ hành vi này và Anthropic đã bổ sung các điều khiển để bảo toàn các khối tư duy trước đó, giúp các tác nhân nhiều lượt có thể sử dụng lại các suy luận trước đó mà không cần lặp lại việc tính toán lại tốn kém. Sử dụng tư duy mở rộng khi nhiệm vụ đòi hỏi lập kế hoạch nhiều bước, giải quyết vấn đề dài hạn hoặc điều phối công cụ.

Làm thế nào để tích hợp các công cụ và tác nhân xây dựng với Opus 4.5?

Một trong những điểm mạnh chính của Opus 4.5 là cải thiện sử dụng công cụ: xác định các công cụ trong máy khách của bạn, để Claude quyết định khi nào gọi chúng, thực thi công cụ và trả về tool_result — Claude sẽ sử dụng những kết quả đó trong phản hồi cuối cùng. Anthropic cung cấp các SDK Agent cho phép bạn đăng ký các hàm công cụ đã nhập (ví dụ: run_shell, call_api, search_docs) mà Claude có thể khám phá và gọi trong quá trình suy nghĩ mở rộng. Nền tảng này chuyển đổi các định nghĩa công cụ thành các hàm có thể gọi mà mô hình có thể gọi và nhận kết quả. Đây là cách bạn xây dựng quy trình làm việc của agentic một cách an toàn (với đầu vào/đầu ra được kiểm soát).

Dưới đây là một mẫu thực tế và ví dụ Python toàn diện.

Mẫu sử dụng công cụ (khái niệm)

Vật tư khách hàng tools siêu dữ liệu với tên, mô tả và lược đồ JSON (input_schema).
Mô hình trả về một tool_use chặn (hướng dẫn có cấu trúc của mô hình để gọi một công cụ cụ thể với các đầu vào cụ thể). Phản hồi API stop_reason có lẽ tool_use.
Khách hàng thực hiện công cụ (mã của bạn gọi API bên ngoài hoặc hàm cục bộ).
Khách hàng gửi tin nhắn tiếp theo với role:"user" và tool_result khối nội dung chứa các kết quả đầu ra của công cụ.
Mô hình sử dụng kết quả công cụ và trả về câu trả lời cuối cùng hoặc các lệnh gọi công cụ tiếp theo.

Luồng này cho phép kiểm soát an toàn phía máy khách đối với những gì mô hình thực hiện (mô hình đề xuất công cụ gọi; bạn kiểm soát việc thực hiện).

Ví dụ đầu cuối — Python (công cụ thời tiết đơn giản)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Bạn nên cấu trúc các tác nhân như thế nào để có độ tin cậy cao?

Vệ sinh đầu vào công cụ (tránh tiêm theo lời nhắc).
Xác thực đầu ra của công cụ trước khi đưa chúng trở lại mô hình (kiểm tra lược đồ).
Giới hạn phạm vi công cụ (nguyên tắc đặc quyền tối thiểu).
Sử dụng trình trợ giúp nén (từ Anthropic SDK) để duy trì khả năng quản lý ngữ cảnh trong thời gian dài.

Tôi nên thiết kế lời nhắc và cấu trúc tin nhắn cho Opus 4.5 như thế nào?

Vai trò tin nhắn và chiến lược điền trước nào hiệu quả nhất?

Sử dụng mẫu gồm ba phần:

WELFARE (vai trò: hệ thống): hướng dẫn chung — âm điệu, lan can, vai trò.
Trợ lý (tùy chọn): ví dụ đóng hộp hoặc nội dung chuẩn bị.
người sử dang (vai trò: người dùng): yêu cầu ngay lập tức.

Điền trước các ràng buộc cho thông báo hệ thống (định dạng, độ dài, chính sách an toàn, lược đồ JSON nếu bạn muốn đầu ra có cấu trúc). Đối với các tác nhân, hãy bao gồm thông số kỹ thuật công cụ và ví dụ sử dụng để Opus 4.5 có thể gọi các công cụ đó một cách chính xác.

Làm thế nào để sử dụng nén ngữ cảnh và lưu trữ tạm thời để lưu mã thông báo?

Nén ngữ cảnh: Nén các phần cũ hơn của cuộc trò chuyện thành các bản tóm tắt ngắn gọn mà mô hình vẫn có thể sử dụng. Opus 4.5 hỗ trợ tự động hóa để rút gọn ngữ cảnh mà không làm mất các khối lập luận quan trọng.
Lưu trữ tạm thời: phản hồi mô hình bộ nhớ đệm cho các lời nhắc lặp lại (Anthropic cung cấp các mẫu bộ nhớ đệm lời nhắc để giảm độ trễ/chi phí).

Cả hai tính năng đều giảm dấu vết của các tương tác dài và được khuyến nghị cho các quy trình làm việc dài hạn của tác nhân và trợ lý sản xuất.

Xử lý lỗi và các biện pháp tốt nhất

Dưới đây là các khuyến nghị thực tế về độ tin cậy và an toàn khi tích hợp sản xuất với Opus 4.5.

Độ tin cậy và thử lại

Xử lý giới hạn tốc độ (HTTP 429) với hậu quả theo cấp số nhân và độ rung (bắt đầu ở mức 500–1000ms).
sự bình thường: đối với các lệnh gọi LLM không đột biến, bạn có thể thử lại một cách an toàn, nhưng hãy cẩn thận trong các quy trình làm việc mà mô hình kích hoạt các tác dụng phụ bên ngoài (lệnh gọi công cụ) — loại bỏ trùng lặp bằng cách theo dõi tool_use_id hoặc ID yêu cầu của riêng bạn.
Độ ổn định khi phát trực tuyến: xử lý các luồng một phần và kết nối lại một cách bình thường; nếu xảy ra gián đoạn, hãy thử lại toàn bộ yêu cầu hoặc tiếp tục bằng trạng thái cấp ứng dụng để tránh các tương tác công cụ không nhất quán.

An ninh và an toàn

Tiêm nhanh và an toàn dụng cụ: không bao giờ cho phép mô hình thực thi trực tiếp các lệnh shell hoặc mã tùy ý mà không cần xác thực. Luôn xác thực đầu vào của công cụ và khử trùng đầu ra. Mô hình đề xuất các lệnh gọi công cụ; mã của bạn quyết định có chạy chúng hay không. Thẻ hệ thống và tài liệu của Anthropic mô tả các ràng buộc căn chỉnh và mức độ an toàn—hãy tuân theo chúng cho các miền có rủi ro cao.
Xử lý dữ liệu và tuân thủ: Xử lý các lời nhắc và đầu vào/đầu ra của công cụ chứa PII hoặc dữ liệu được quản lý theo chính sách pháp lý/tuân thủ của bạn. Sử dụng các biện pháp kiểm soát VPC/doanh nghiệp của nhà cung cấp nếu bạn có yêu cầu nghiêm ngặt về lưu trữ dữ liệu hoặc kiểm toán (Bedrock / Vertex / Foundry cung cấp các tùy chọn doanh nghiệp).

Khả năng quan sát và kiểm soát chi phí

Siêu dữ liệu yêu cầu/phản hồi nhật ký (không phải nội dung nhạy cảm thô trừ khi được phép) — số lượng mã thông báo, effort mức độ, độ trễ, ID mô hình và nhà cung cấp. Các số liệu này rất cần thiết cho việc phân bổ chi phí và gỡ lỗi.
Sử dụng nỗ lực để kiểm soát chi phí cho mỗi cuộc gọi: thích hơn low nỗ lực tóm tắt thường quy hoặc các điểm cuối QPS cao; sử dụng high nỗ lực gỡ lỗi sâu hoặc điều tra. Theo dõi chất lượng so với mức tiêu thụ mã thông báo để chọn mặc định cho các điểm cuối khác nhau.

Kết luận — Khi nào (và như thế nào) bạn nên chọn Opus 4.5?

Claude Opus 4.5 là sự lựa chọn tự nhiên khi sản phẩm của bạn cần:

suy luận sâu sắc nhiều bước (chuỗi logic dài, nghiên cứu hoặc gỡ lỗi),
sự phối hợp mạnh mẽ giữa tác nhân/công cụ (quy trình làm việc phức tạp sử dụng API bên ngoài) hoặc
hỗ trợ mã cấp sản xuất trên các cơ sở mã lớn.

Về mặt hoạt động, sử dụng nỗ lực để điều chỉnh ngân sách cho mỗi cuộc gọi; dựa vào mô hình sử dụng công cụ để duy trì an toàn thực thi và chọn đối tác đám mây (hoặc Anthropic API trực tiếp) dựa trên nhu cầu tuân thủ của bạn. So sánh với kho dữ liệu của riêng bạn: số lượng nhà cung cấp (SWE-bench, v.v.) là những tín hiệu hữu ích nhưng nhiệm vụ và dữ liệu thực tế của bạn quyết định ROI. Để đảm bảo an toàn, hãy tuân thủ thẻ hệ thống Opus 4.5 và đặt ra các giới hạn xung quanh việc thực thi công cụ và xử lý PII.

Các nhà phát triển có thể truy cập Claude Opus 4.5 API thông qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình củaSao chổiAPI trong Sân chơi và tham khảo hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Với e tAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!