如何使用 Claude Opus 4.5 API

Anthropic 於 2025 年 11 月下旬發佈了 Claude Opus 4.5，作為更強大、更高效的 Opus 級模型，面向專業軟體工程、代理型工作流程與長時程任務。它可透過 Anthropic 的開發者平台與 CometAPI 使用，並引入了新的 API 控制（尤其是 effort 參數）、改進的電腦使用工具、延展思考，以及在生產環境中重要的 Token 效率提升。

以下是實務導向的專業指南：有哪些變更、如何取得存取權、如何使用新控制項（effort、延展思考、工具使用、檔案/電腦使用）、成本與最佳化建議、安全/治理考量，以及真實世界的整合範式。

什麼是 Claude Opus 4.5，為什麼重要？

Claude Opus 4.5 是 Anthropic 最新的 Opus 級模型家族成員（於 2025 年 11 月 24–25 日發佈），聚焦於最大化推理與程式能力，同時提升 Token 效率，並提供新的 API 控制以在成本與嚴謹度間取得平衡。Anthropic 將 Opus 4.5 定位為其「最智慧的模型」，面向複雜軟體工程任務、長時間運行的代理、試算表/Excel 自動化，以及需要持續多步推理的任務。

Opus 4.5 的主要更新是什麼？

Anthropic 設計 Opus 4.5，強化推理的「深度」與「代理型」行為，同時讓開發者能更好掌控成本/延遲取捨。發佈重點如下：

Effort 參數（測試版）：一個一等公民的 API 控制旋鈕，用於控制 Claude 在單次請求上投入多少「思考預算」（常見為 low、medium、high）。它會影響推理、工具呼叫與內部「思考」tokens，讓你可在單次呼叫中調整速度與嚴謹度，而非切換模型。這是 Opus 4.5 的標誌性能力。
更佳的代理與工具編排：更準確的工具選擇、更結構化的工具呼叫，以及更健壯的工具結果工作流程，適合構建代理與多步管線。Anthropic 提供「工具使用」流程的文件與 SDK 指南。
Token/成本效率：Anthropic 報告相較 Sonnet 4.5，在某些流程中可減少約 50% 的 Token 使用，且在複雜工程任務上減少工具呼叫錯誤與迭代次數。
增強多模態能力：在視覺、推理與數學表現上全面提升。
上下文視窗擴展至 200K tokens，支援更深更長的對話與複雜文件分析。

實務能力有哪些提升？

效能升級

更佳的代理與工具編排：更準確的工具選擇、更結構化的工具呼叫，以及更健壯的工具結果工作流程，適合構建代理與多步管線。改良的上下文處理、長時間代理運行的壓縮輔助、以及一等公民的工具 SDK（用於註冊/驗證工具），使得 Opus 4.5 更適合建立可長時間無人值守的代理。
增強多模態能力：在視覺、推理與數學表現上全面提升。
上下文視窗擴展至 200K tokens，支援更深更長的對話與複雜文件分析。

程式開發與長時程工作

Opus 4.5 在程式任務上延續以基準為導向；它在長任務（程式遷移、重構、多步除錯）中減少迭代與工具呼叫錯誤。早期報告與 Anthropic 的系統卡指出，在工程基準上有持續性表現提升，且在工具驅動的管線中帶來顯著效率收益。

在 SWE-bench 中，Opus 4.5 在軟體工程基準上報告領先（Anthropic 在發佈資料中列出 SWE-bench Verified 達 80.9%），客戶也回報在除錯、多檔案編輯、長時程代碼任務上有改善。

Claude Opus 4.5-SWE-1

成本與效率

Anthropic 設計 Opus 4.5，強化推理「深度」與「代理型」行為，同時讓開發者能更好掌控成本/延遲取捨：

相較 opus 4.1 的降價：$5（輸入）/$25（輸出）每百萬 tokens。
Token 使用改善：在維持表現的同時，平均減少 50–75% 的消耗。
一個一等公民的 API 控制，用於控制 Claude 在請求上投入多少「思考預算」（常見為 low、medium、high）。它影響推理、工具呼叫與內部「思考」tokens，讓你可在單次呼叫中調整速度與嚴謹度，而非切換模型。這是 Opus 4.5 的標誌性能力（相較 Sonnet 4.5：Medium Effort → Token 減少 76%，表現相當；High Effort → 表現提升 4.3 個百分點，Token 減少 48%）。

如何存取與使用 Claude Opus 4.5 API？

如何取得存取權與金鑰？

建立 Anthropic / Claude 開發者帳號。於 Claude/Anthropic 開發者入口註冊，並在主控台建立 API 金鑰（團隊可使用組織/管理流程）。Messages API 是聊天/助理型互動的主要端點。
雲端合作夥伴：Opus 4.5 亦可透過主要雲端市場 Google Vertex AI、CometAPI（AI API 聚合平台，需要使用其驗證）取得。在 CometAPI 中，可使用 Anthropic Messages 格式與 Chat 格式存取 Claude opus 4.5 API。

我該如何驗證請求？

使用標準 Bearer token：於每個 API 呼叫加上 Authorization: Bearer $_API_KEY 標頭。請求以 HTTPS 上的 JSON 傳輸；Messages API 接受結構化訊息列表（system + user + assistant）。

快速上手 — Python（官方 SDK）

安裝 SDK：

pip install anthropic

最小範例（同步）：

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

此呼叫使用了 Opus 4.5 的標準模型識別碼。對於提供者管理的端點（Vertex、CometAPI、Foundry），請依提供者文件構建客戶端並提供其 URL 與金鑰（例如 CometAPI 使用 https://api.cometapi.com/v1/messages）。

快速上手 — Python（CometAPI）

你需要登入 CometAPI 並取得金鑰。

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

如何使用新的 effort 參數與延展思考？

什麼是 effort 參數，如何設定？

effort 參數是 Opus 4.5 新增的一等公民 API 控制，用於調整模型在產生輸出時投入的內部運算與 Token 預算。典型值為 low、medium、high。可用它在延遲與 Token 成本與嚴謹程度間取得平衡：

low — 針對高流量自動化與例行任務的快速、節省 Token 回覆。
medium — 適合生產用途的品質/成本平衡。
high — 深度分析、多步推理，或對準確性要求最高的情境。

Anthropic 在 Opus 4.5（測試版）中引入 effort。你必須加上測試版標頭（例如 effort-2025-11-24），並指定 output_config: { "effort": "low|medium|high" }（如下例）。high 是預設行為。降低 effort 可減少 Token 使用與延遲，但可能略微降低嚴謹度。可用於高吞吐或延遲敏感的任務。

範例：

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

何時使用何種等級：low 用於自動化管線（如電子郵件分類）、medium 用於標準助理、high 用於代碼產生、深度研究或高風險情境。Anthropic 將此參數強調為 Opus 4.5 的關鍵控制。

在 SWE-bench 測試中：

在 Medium Effort 模式：表現與 Sonnet 4.5 相當，但輸出 tokens 減少 76%；

在 High Effort 模式：表現較 Sonnet 4.5 約高出 4.3 個百分點，且 tokens 減少 48%。

Claude Opus 4.5-SWE-2

什麼是延展思考（Extended Thinking），如何啟用？

延展思考（亦稱「extended thinking」或「思考區塊」）允許模型在產生最終輸出前執行中間的思考鏈或逐步推理，並可選擇性地保留或摘要內部思考區塊。Messages API 支援此行為，Anthropic 也新增了控制項以保留先前的思考區塊，使多輪代理能重用早先推理而不必重複昂貴的計算。當任務需要多步規劃、長時程問題解決或工具編排時，請使用延展思考。

如何在 Opus 4.5 中整合工具並構建代理？

Opus 4.5 的一大強項是改進的「工具使用」：在客戶端定義工具，讓 Claude 決定何時呼叫，執行該工具，並回傳 tool_result——Claude 會在最終回覆中使用這些結果。Anthropic 提供 Agent SDK，可註冊具型別的工具函式（例如 run_shell、call_api、search_docs），讓 Claude 在延展思考期間發現並呼叫。平台會將工具定義轉換為可呼叫的函式，供模型呼叫並接收結果。這是以安全方式構建代理型工作流程（由你控制輸入/輸出）的關鍵。

以下是實用模式與端到端的 Python 範例。

工具使用模式（概念）

客戶端提供 tools 中繼資料，包含名稱、描述與 JSON schema（input_schema）。
模型回傳 tool_use 區塊（模型發出的結構化指示，指定要呼叫的工具與輸入）。API 回應的 stop_reason 可能為 tool_use。
客戶端執行工具（你的程式呼叫外部 API 或本地函式）。
客戶端發送後續訊息，使用 role:"user" 並包含 tool_result 內容區塊，帶上工具輸出。
模型消化工具結果，並回傳最終答案或進一步工具呼叫。

此流程確保由客戶端安全掌控模型的執行（模型「提議」工具呼叫；是否執行由你決定）。

端到端範例 — Python（簡單天氣工具）

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

如何提升代理的可靠性？

清理工具輸入（避免提示注入）。
在回饋模型前驗證工具輸出（進行 schema 檢查）。
限制工具權限（最小必要權限原則）。
使用壓縮輔助（來自 Anthropic SDK）在長時間運行中保持上下文可控。

如何為 Opus 4.5 設計提示與結構化訊息？

哪些訊息角色與預填策略最有效？

採用三段式模式：

System（role: system）：全域指令——語氣、護欄、角色。
Assistant（可選）：預設範例或引導內容。
User（role: user）：當前請求。

在 system 訊息中預先填入限制（格式、長度、安全政策、若需結構化輸出則提供 JSON schema）。對代理來說，加入工具規格與使用範例，讓 Opus 4.5 能正確呼叫這些工具。

如何使用上下文壓縮與提示快取來節省 Tokens？

上下文壓縮：將較舊的對話片段壓縮為精煉摘要，但保留模型仍需的關鍵推理區塊。Opus 4.5 支援自動化壓縮上下文，以避免流失關鍵資訊。
提示快取：對重複提示快取模型回覆（Anthropic 提供提示快取模式，降低延遲/成本）。

兩者均能降低長互動的 Token 足跡，適用於長時間運行的代理與生產型助理。

錯誤處理與最佳實務

以下是將 Opus 4.5 用於生產整合的可靠性與安全建議。

可靠性與重試

處理速率限制（HTTP 429）：使用指數退避與抖動（從 500–1000ms 起）。
具冪等性：對不具副作用的 LLM 呼叫可安全重試；但在模型會觸發外部副作用（工具呼叫）的流程中要謹慎——可透過追蹤 tool_use_id 或自有請求 ID 去重。
串流穩定性：處理部分串流並優雅地重連；若中斷，建議重試整個請求或使用應用層狀態恢復，以避免不一致的工具互動。

安全與風險控管

提示注入與工具安全：切勿允許模型直接執行任意 Shell 指令或程式碼而未經驗證。務必驗證工具輸入並清理輸出。模型僅提出工具呼叫，你的程式決定是否執行。Anthropic 的系統卡與文件描述了對齊限制與安全等級——在高風險領域請遵循。
資料處理與合規：對包含個資或受規管資料的提示與工具 I/O，依據你的法規/合規政策處理。若有嚴格的資料駐留或稽核需求，使用提供者的 VPC/企業控制（如 Bedrock / Vertex / Foundry 提供企業選項）。

可觀測性與成本控制

記錄請求/回應中繼資料（未獲許可時勿記錄敏感原文）——Token 數、effort 等級、延遲、模型 ID 與提供者。這些指標對成本歸因與除錯很關鍵。
使用 effort 控制單次呼叫成本：例行摘要或高 QPS 端點可偏好 low；深度除錯或調查則用 high。監控品質與 Token 消耗，為不同端點選擇預設值。

結論——何時（以及如何）選擇 Opus 4.5？

當你的產品需要：

深度多步推理（長邏輯鏈、研究或除錯），
穩健的代理/工具編排（呼叫外部 API 的複雜工作流程），或
針對大型程式碼庫的生產級程式輔助，

Claude Opus 4.5 是自然的選擇。運作上，使用 effort 調整單次呼叫預算；依循工具使用模式以維持執行安全；並依合規需求在雲端夥伴（或直接 Anthropic API）中做選擇。請用你的真實語料評測：供應商數據（如 SWE-bench）是有用的訊號，但 ROI 仍取決於你的實際任務與資料。就安全而言，遵循 Opus 4.5 系統卡，並對工具執行與個資處理設置護欄。

開發者可透過 CometAPI 存取 Claude Opus 4.5 API。若要開始，請在 Playground 探索 CometAPI 的模型能力，並參考 API 指南以獲得詳細指示。存取前，請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格，協助你整合。

Ready to Go?→ Sign up for CometAPI today！

若想獲得更多 AI 技巧、指南與新聞，請追蹤我們於 VK、X 與 Discord！