如何使用 Claude Opus 4.5 API

CometAPI
AnnaNov 24, 2025
如何使用 Claude Opus 4.5 API

Anthropic 於 2025 年 11 月下旬發佈了 Claude Opus 4.5,作為更強大、更高效的 Opus 級模型,面向專業軟體工程、代理型工作流程與長時程任務。它可透過 Anthropic 的開發者平台與 CometAPI 使用,並引入了新的 API 控制(尤其是 effort 參數)、改進的電腦使用工具、延展思考,以及在生產環境中重要的 Token 效率提升。

以下是實務導向的專業指南:有哪些變更、如何取得存取權、如何使用新控制項(effort、延展思考、工具使用、檔案/電腦使用)、成本與最佳化建議、安全/治理考量,以及真實世界的整合範式。

什麼是 Claude Opus 4.5,為什麼重要?

Claude Opus 4.5 是 Anthropic 最新的 Opus 級模型家族成員(於 2025 年 11 月 24–25 日發佈),聚焦於最大化推理與程式能力,同時提升 Token 效率,並提供新的 API 控制以在成本與嚴謹度間取得平衡。Anthropic 將 Opus 4.5 定位為其「最智慧的模型」,面向複雜軟體工程任務、長時間運行的代理、試算表/Excel 自動化,以及需要持續多步推理的任務。

Opus 4.5 的主要更新是什麼?

Anthropic 設計 Opus 4.5,強化推理的「深度」與「代理型」行為,同時讓開發者能更好掌控成本/延遲取捨。發佈重點如下:

  • Effort 參數(測試版):一個一等公民的 API 控制旋鈕,用於控制 Claude 在單次請求上投入多少「思考預算」(常見為 lowmediumhigh)。它會影響推理、工具呼叫與內部「思考」tokens,讓你可在單次呼叫中調整速度與嚴謹度,而非切換模型。這是 Opus 4.5 的標誌性能力。
  • 更佳的代理與工具編排:更準確的工具選擇、更結構化的工具呼叫,以及更健壯的工具結果工作流程,適合構建代理與多步管線。Anthropic 提供「工具使用」流程的文件與 SDK 指南。
  • Token/成本效率:Anthropic 報告相較 Sonnet 4.5,在某些流程中可減少約 50% 的 Token 使用,且在複雜工程任務上減少工具呼叫錯誤與迭代次數。
  • 增強多模態能力:在視覺、推理與數學表現上全面提升。
  • 上下文視窗擴展至 200K tokens,支援更深更長的對話與複雜文件分析。

實務能力有哪些提升?

效能升級

  • 更佳的代理與工具編排:更準確的工具選擇、更結構化的工具呼叫,以及更健壯的工具結果工作流程,適合構建代理與多步管線。改良的上下文處理、長時間代理運行的壓縮輔助、以及一等公民的工具 SDK(用於註冊/驗證工具),使得 Opus 4.5 更適合建立可長時間無人值守的代理。
  • 增強多模態能力:在視覺、推理與數學表現上全面提升。
  • 上下文視窗擴展至 200K tokens,支援更深更長的對話與複雜文件分析。

程式開發與長時程工作

Opus 4.5 在程式任務上延續以基準為導向;它在長任務(程式遷移、重構、多步除錯)中減少迭代與工具呼叫錯誤。早期報告與 Anthropic 的系統卡指出,在工程基準上有持續性表現提升,且在工具驅動的管線中帶來顯著效率收益。

在 SWE-bench 中,Opus 4.5 在軟體工程基準上報告領先(Anthropic 在發佈資料中列出 SWE-bench Verified 達 80.9%),客戶也回報在除錯、多檔案編輯、長時程代碼任務上有改善。

Claude Opus 4.5-SWE-1

成本與效率

Anthropic 設計 Opus 4.5,強化推理「深度」與「代理型」行為,同時讓開發者能更好掌控成本/延遲取捨:

  • 相較 opus 4.1 的降價:$5(輸入)/$25(輸出)每百萬 tokens。
  • Token 使用改善:在維持表現的同時,平均減少 50–75% 的消耗。
  • 一個一等公民的 API 控制,用於控制 Claude 在請求上投入多少「思考預算」(常見為 lowmediumhigh)。它影響推理、工具呼叫與內部「思考」tokens,讓你可在單次呼叫中調整速度與嚴謹度,而非切換模型。這是 Opus 4.5 的標誌性能力(相較 Sonnet 4.5:Medium Effort → Token 減少 76%,表現相當;High Effort → 表現提升 4.3 個百分點,Token 減少 48%)。

如何存取與使用 Claude Opus 4.5 API?

如何取得存取權與金鑰?

  1. 建立 Anthropic / Claude 開發者帳號。於 Claude/Anthropic 開發者入口註冊,並在主控台建立 API 金鑰(團隊可使用組織/管理流程)。Messages API 是聊天/助理型互動的主要端點。
  2. 雲端合作夥伴:Opus 4.5 亦可透過主要雲端市場 Google Vertex AI、CometAPI(AI API 聚合平台,需要使用其驗證)取得。在 CometAPI 中,可使用 Anthropic Messages 格式與 Chat 格式存取 Claude opus 4.5 API。

我該如何驗證請求?

使用標準 Bearer token:於每個 API 呼叫加上 Authorization: Bearer $_API_KEY 標頭。請求以 HTTPS 上的 JSON 傳輸;Messages API 接受結構化訊息列表(system + user + assistant)。

快速上手 — Python(官方 SDK)

安裝 SDK:

pip install anthropic

最小範例(同步):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

此呼叫使用了 Opus 4.5 的標準模型識別碼。對於提供者管理的端點(Vertex、CometAPI、Foundry),請依提供者文件構建客戶端並提供其 URL 與金鑰(例如 CometAPI 使用 https://api.cometapi.com/v1/messages)。

快速上手 — Python(CometAPI)

你需要登入 CometAPI 並取得金鑰。

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

如何使用新的 effort 參數與延展思考?

什麼是 effort 參數,如何設定?

effort 參數是 Opus 4.5 新增的一等公民 API 控制,用於調整模型在產生輸出時投入的內部運算與 Token 預算。典型值為 lowmediumhigh。可用它在延遲與 Token 成本與嚴謹程度間取得平衡:

  • low — 針對高流量自動化與例行任務的快速、節省 Token 回覆。
  • medium — 適合生產用途的品質/成本平衡。
  • high — 深度分析、多步推理,或對準確性要求最高的情境。

Anthropic 在 Opus 4.5(測試版)中引入 effort。你必須加上測試版標頭(例如 effort-2025-11-24),並指定 output_config: { "effort": "low|medium|high" }(如下例)。high 是預設行為。降低 effort 可減少 Token 使用與延遲,但可能略微降低嚴謹度。可用於高吞吐或延遲敏感的任務。

範例:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

何時使用何種等級:low 用於自動化管線(如電子郵件分類)、medium 用於標準助理、high 用於代碼產生、深度研究或高風險情境。Anthropic 將此參數強調為 Opus 4.5 的關鍵控制。

在 SWE-bench 測試中:

  • 在 Medium Effort 模式:表現與 Sonnet 4.5 相當,但輸出 tokens 減少 76%;
  • 在 High Effort 模式:表現較 Sonnet 4.5 約高出 4.3 個百分點,且 tokens 減少 48%。

Claude Opus 4.5-SWE-2

什麼是延展思考(Extended Thinking),如何啟用?

延展思考(亦稱「extended thinking」或「思考區塊」)允許模型在產生最終輸出前執行中間的思考鏈或逐步推理,並可選擇性地保留或摘要內部思考區塊。Messages API 支援此行為,Anthropic 也新增了控制項以保留先前的思考區塊,使多輪代理能重用早先推理而不必重複昂貴的計算。當任務需要多步規劃、長時程問題解決或工具編排時,請使用延展思考。

如何在 Opus 4.5 中整合工具並構建代理?

Opus 4.5 的一大強項是改進的「工具使用」:在客戶端定義工具,讓 Claude 決定何時呼叫,執行該工具,並回傳 tool_result——Claude 會在最終回覆中使用這些結果。Anthropic 提供 Agent SDK,可註冊具型別的工具函式(例如 run_shellcall_apisearch_docs),讓 Claude 在延展思考期間發現並呼叫。平台會將工具定義轉換為可呼叫的函式,供模型呼叫並接收結果。這是以安全方式構建代理型工作流程(由你控制輸入/輸出)的關鍵。

以下是實用模式與端到端的 Python 範例。

工具使用模式(概念)

  1. 客戶端提供 tools 中繼資料,包含名稱、描述與 JSON schema(input_schema)。
  2. 模型回傳 tool_use 區塊(模型發出的結構化指示,指定要呼叫的工具與輸入)。API 回應的 stop_reason 可能為 tool_use
  3. 客戶端執行工具(你的程式呼叫外部 API 或本地函式)。
  4. 客戶端發送後續訊息,使用 role:"user" 並包含 tool_result 內容區塊,帶上工具輸出。
  5. 模型消化工具結果,並回傳最終答案或進一步工具呼叫。

此流程確保由客戶端安全掌控模型的執行(模型「提議」工具呼叫;是否執行由你決定)。

端到端範例 — Python(簡單天氣工具)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

如何提升代理的可靠性?

  • 清理工具輸入(避免提示注入)。
  • 在回饋模型前驗證工具輸出(進行 schema 檢查)。
  • 限制工具權限(最小必要權限原則)。
  • 使用壓縮輔助(來自 Anthropic SDK)在長時間運行中保持上下文可控。

如何為 Opus 4.5 設計提示與結構化訊息?

哪些訊息角色與預填策略最有效?

採用三段式模式:

  • System(role: system):全域指令——語氣、護欄、角色。
  • Assistant(可選):預設範例或引導內容。
  • User(role: user):當前請求。

在 system 訊息中預先填入限制(格式、長度、安全政策、若需結構化輸出則提供 JSON schema)。對代理來說,加入工具規格與使用範例,讓 Opus 4.5 能正確呼叫這些工具。

如何使用上下文壓縮與提示快取來節省 Tokens?

  • 上下文壓縮:將較舊的對話片段壓縮為精煉摘要,但保留模型仍需的關鍵推理區塊。Opus 4.5 支援自動化壓縮上下文,以避免流失關鍵資訊。
  • 提示快取:對重複提示快取模型回覆(Anthropic 提供提示快取模式,降低延遲/成本)。

兩者均能降低長互動的 Token 足跡,適用於長時間運行的代理與生產型助理。

錯誤處理與最佳實務

以下是將 Opus 4.5 用於生產整合的可靠性與安全建議。

可靠性與重試

  • 處理速率限制(HTTP 429):使用指數退避與抖動(從 500–1000ms 起)。
  • 具冪等性:對不具副作用的 LLM 呼叫可安全重試;但在模型會觸發外部副作用(工具呼叫)的流程中要謹慎——可透過追蹤 tool_use_id 或自有請求 ID 去重。
  • 串流穩定性:處理部分串流並優雅地重連;若中斷,建議重試整個請求或使用應用層狀態恢復,以避免不一致的工具互動。

安全與風險控管

  • 提示注入與工具安全:切勿允許模型直接執行任意 Shell 指令或程式碼而未經驗證。務必驗證工具輸入並清理輸出。模型僅提出工具呼叫,你的程式決定是否執行。Anthropic 的系統卡與文件描述了對齊限制與安全等級——在高風險領域請遵循。
  • 資料處理與合規:對包含個資或受規管資料的提示與工具 I/O,依據你的法規/合規政策處理。若有嚴格的資料駐留或稽核需求,使用提供者的 VPC/企業控制(如 Bedrock / Vertex / Foundry 提供企業選項)。

可觀測性與成本控制

  • 記錄請求/回應中繼資料(未獲許可時勿記錄敏感原文)——Token 數、effort 等級、延遲、模型 ID 與提供者。這些指標對成本歸因與除錯很關鍵。
  • 使用 effort 控制單次呼叫成本:例行摘要或高 QPS 端點可偏好 low;深度除錯或調查則用 high。監控品質與 Token 消耗,為不同端點選擇預設值。

結論——何時(以及如何)選擇 Opus 4.5?

當你的產品需要:

  • 深度多步推理(長邏輯鏈、研究或除錯),
  • 穩健的代理/工具編排(呼叫外部 API 的複雜工作流程),或
  • 針對大型程式碼庫的生產級程式輔助,

Claude Opus 4.5 是自然的選擇。運作上,使用 effort 調整單次呼叫預算;依循工具使用模式以維持執行安全;並依合規需求在雲端夥伴(或直接 Anthropic API)中做選擇。請用你的真實語料評測:供應商數據(如 SWE-bench)是有用的訊號,但 ROI 仍取決於你的實際任務與資料。就安全而言,遵循 Opus 4.5 系統卡,並對工具執行與個資處理設置護欄。

開發者可透過 CometAPI 存取 Claude Opus 4.5 API。若要開始,請在 Playground 探索 CometAPI 的模型能力,並參考 API 指南以獲得詳細指示。存取前,請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,協助你整合。

Ready to Go?→ Sign up for CometAPI today

若想獲得更多 AI 技巧、指南與新聞,請追蹤我們於 VKXDiscord

以低成本 存取頂級模型

閱讀更多