Anthropic 於 2025 年 11 月下旬發佈了 Claude Opus 4.5,作為更強大、更高效的 Opus 級模型,面向專業軟體工程、代理型工作流程與長時程任務。它可透過 Anthropic 的開發者平台與 CometAPI 使用,並引入了新的 API 控制(尤其是 effort 參數)、改進的電腦使用工具、延展思考,以及在生產環境中重要的 Token 效率提升。
以下是實務導向的專業指南:有哪些變更、如何取得存取權、如何使用新控制項(effort、延展思考、工具使用、檔案/電腦使用)、成本與最佳化建議、安全/治理考量,以及真實世界的整合範式。
什麼是 Claude Opus 4.5,為什麼重要?
Claude Opus 4.5 是 Anthropic 最新的 Opus 級模型家族成員(於 2025 年 11 月 24–25 日發佈),聚焦於最大化推理與程式能力,同時提升 Token 效率,並提供新的 API 控制以在成本與嚴謹度間取得平衡。Anthropic 將 Opus 4.5 定位為其「最智慧的模型」,面向複雜軟體工程任務、長時間運行的代理、試算表/Excel 自動化,以及需要持續多步推理的任務。
Opus 4.5 的主要更新是什麼?
Anthropic 設計 Opus 4.5,強化推理的「深度」與「代理型」行為,同時讓開發者能更好掌控成本/延遲取捨。發佈重點如下:
- Effort 參數(測試版):一個一等公民的 API 控制旋鈕,用於控制 Claude 在單次請求上投入多少「思考預算」(常見為
low、medium、high)。它會影響推理、工具呼叫與內部「思考」tokens,讓你可在單次呼叫中調整速度與嚴謹度,而非切換模型。這是 Opus 4.5 的標誌性能力。 - 更佳的代理與工具編排:更準確的工具選擇、更結構化的工具呼叫,以及更健壯的工具結果工作流程,適合構建代理與多步管線。Anthropic 提供「工具使用」流程的文件與 SDK 指南。
- Token/成本效率:Anthropic 報告相較 Sonnet 4.5,在某些流程中可減少約 50% 的 Token 使用,且在複雜工程任務上減少工具呼叫錯誤與迭代次數。
- 增強多模態能力:在視覺、推理與數學表現上全面提升。
- 上下文視窗擴展至 200K tokens,支援更深更長的對話與複雜文件分析。
實務能力有哪些提升?
效能升級
- 更佳的代理與工具編排:更準確的工具選擇、更結構化的工具呼叫,以及更健壯的工具結果工作流程,適合構建代理與多步管線。改良的上下文處理、長時間代理運行的壓縮輔助、以及一等公民的工具 SDK(用於註冊/驗證工具),使得 Opus 4.5 更適合建立可長時間無人值守的代理。
- 增強多模態能力:在視覺、推理與數學表現上全面提升。
- 上下文視窗擴展至 200K tokens,支援更深更長的對話與複雜文件分析。
程式開發與長時程工作
Opus 4.5 在程式任務上延續以基準為導向;它在長任務(程式遷移、重構、多步除錯)中減少迭代與工具呼叫錯誤。早期報告與 Anthropic 的系統卡指出,在工程基準上有持續性表現提升,且在工具驅動的管線中帶來顯著效率收益。
在 SWE-bench 中,Opus 4.5 在軟體工程基準上報告領先(Anthropic 在發佈資料中列出 SWE-bench Verified 達 80.9%),客戶也回報在除錯、多檔案編輯、長時程代碼任務上有改善。

成本與效率
Anthropic 設計 Opus 4.5,強化推理「深度」與「代理型」行為,同時讓開發者能更好掌控成本/延遲取捨:
- 相較 opus 4.1 的降價:$5(輸入)/$25(輸出)每百萬 tokens。
- Token 使用改善:在維持表現的同時,平均減少 50–75% 的消耗。
- 一個一等公民的 API 控制,用於控制 Claude 在請求上投入多少「思考預算」(常見為
low、medium、high)。它影響推理、工具呼叫與內部「思考」tokens,讓你可在單次呼叫中調整速度與嚴謹度,而非切換模型。這是 Opus 4.5 的標誌性能力(相較 Sonnet 4.5:Medium Effort → Token 減少 76%,表現相當;High Effort → 表現提升 4.3 個百分點,Token 減少 48%)。
如何存取與使用 Claude Opus 4.5 API?
如何取得存取權與金鑰?
- 建立 Anthropic / Claude 開發者帳號。於 Claude/Anthropic 開發者入口註冊,並在主控台建立 API 金鑰(團隊可使用組織/管理流程)。Messages API 是聊天/助理型互動的主要端點。
- 雲端合作夥伴:Opus 4.5 亦可透過主要雲端市場 Google Vertex AI、CometAPI(AI API 聚合平台,需要使用其驗證)取得。在 CometAPI 中,可使用 Anthropic Messages 格式與 Chat 格式存取 Claude opus 4.5 API。
我該如何驗證請求?
使用標準 Bearer token:於每個 API 呼叫加上 Authorization: Bearer $_API_KEY 標頭。請求以 HTTPS 上的 JSON 傳輸;Messages API 接受結構化訊息列表(system + user + assistant)。
快速上手 — Python(官方 SDK)
安裝 SDK:
pip install anthropic
最小範例(同步):
import os
from anthropic import Anthropic
# expects ANTHROPIC_API_KEY in env
client = Anthropic(api_key=os.environ)
resp = client.messages.create(
model="claude-opus-4-5-20251101",
messages=,
max_tokens=512,
)
print(resp.content.text) # SDK returns structured content blocks
此呼叫使用了 Opus 4.5 的標準模型識別碼。對於提供者管理的端點(Vertex、CometAPI、Foundry),請依提供者文件構建客戶端並提供其 URL 與金鑰(例如 CometAPI 使用 https://api.cometapi.com/v1/messages)。
快速上手 — Python(CometAPI)
你需要登入 CometAPI 並取得金鑰。
curl
--location
--request POST 'https://api.cometapi.com/v1/messages' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages": }'
如何使用新的 effort 參數與延展思考?
什麼是 effort 參數,如何設定?
effort 參數是 Opus 4.5 新增的一等公民 API 控制,用於調整模型在產生輸出時投入的內部運算與 Token 預算。典型值為 low、medium、high。可用它在延遲與 Token 成本與嚴謹程度間取得平衡:
low— 針對高流量自動化與例行任務的快速、節省 Token 回覆。medium— 適合生產用途的品質/成本平衡。high— 深度分析、多步推理,或對準確性要求最高的情境。
Anthropic 在 Opus 4.5(測試版)中引入 effort。你必須加上測試版標頭(例如 effort-2025-11-24),並指定 output_config: { "effort": "low|medium|high" }(如下例)。high 是預設行為。降低 effort 可減少 Token 使用與延遲,但可能略微降低嚴謹度。可用於高吞吐或延遲敏感的任務。
範例:
# Example using the beta messages API shown in Anthropic docs
from anthropic import Anthropic
import os
client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=, # required beta header
messages=,
max_tokens=1500,
output_config={"effort": "medium"} # low | medium | high
)
print(response)
何時使用何種等級:low 用於自動化管線(如電子郵件分類)、medium 用於標準助理、high 用於代碼產生、深度研究或高風險情境。Anthropic 將此參數強調為 Opus 4.5 的關鍵控制。
在 SWE-bench 測試中:
- 在 Medium Effort 模式:表現與 Sonnet 4.5 相當,但輸出 tokens 減少 76%;
- 在 High Effort 模式:表現較 Sonnet 4.5 約高出 4.3 個百分點,且 tokens 減少 48%。

什麼是延展思考(Extended Thinking),如何啟用?
延展思考(亦稱「extended thinking」或「思考區塊」)允許模型在產生最終輸出前執行中間的思考鏈或逐步推理,並可選擇性地保留或摘要內部思考區塊。Messages API 支援此行為,Anthropic 也新增了控制項以保留先前的思考區塊,使多輪代理能重用早先推理而不必重複昂貴的計算。當任務需要多步規劃、長時程問題解決或工具編排時,請使用延展思考。
如何在 Opus 4.5 中整合工具並構建代理?
Opus 4.5 的一大強項是改進的「工具使用」:在客戶端定義工具,讓 Claude 決定何時呼叫,執行該工具,並回傳 tool_result——Claude 會在最終回覆中使用這些結果。Anthropic 提供 Agent SDK,可註冊具型別的工具函式(例如 run_shell、call_api、search_docs),讓 Claude 在延展思考期間發現並呼叫。平台會將工具定義轉換為可呼叫的函式,供模型呼叫並接收結果。這是以安全方式構建代理型工作流程(由你控制輸入/輸出)的關鍵。
以下是實用模式與端到端的 Python 範例。
工具使用模式(概念)
- 客戶端提供
tools中繼資料,包含名稱、描述與 JSON schema(input_schema)。 - 模型回傳
tool_use區塊(模型發出的結構化指示,指定要呼叫的工具與輸入)。API 回應的stop_reason可能為tool_use。 - 客戶端執行工具(你的程式呼叫外部 API 或本地函式)。
- 客戶端發送後續訊息,使用
role:"user"並包含tool_result內容區塊,帶上工具輸出。 - 模型消化工具結果,並回傳最終答案或進一步工具呼叫。
此流程確保由客戶端安全掌控模型的執行(模型「提議」工具呼叫;是否執行由你決定)。
端到端範例 — Python(簡單天氣工具)
# 1) Define tools metadata and send initial request
from anthropic import Anthropic
import os, json
client = Anthropic(api_key=os.environ)
tools = [
{
"name": "get_weather",
"description": "Return the current weather for a given city.",
"input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
}
]
resp = client.messages.create(
model="claude-opus-4-5-20251101",
messages=,
tools=tools,
max_tokens=800,
)
# 2) Check if Claude wants a tool call
stop_reason = resp.stop_reason # SDK field
if stop_reason == "tool_use":
# Extract the tool call (format varies by SDK; this is schematic)
tool_call = resp.tool_calls # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}
tool_name = tool_call
tool_input = tool_call
# 3) Execute the tool client-side (here: stub)
def get_weather(city):
# Replace this stub with a real weather API call
return {"temp_c": 12, "condition": "Partly cloudy"}
tool_result = get_weather(tool_input)
# 4) Send tool_result back to Claude
follow_up = client.messages.create(
model="claude-opus-4-5-20251101",
messages=[
{"role":"user", "content":[{"type":"tool_result",
"tool_use_id": resp.tool_use_id,
"content": json.dumps(tool_result)}]}
],
max_tokens=512,
)
print(follow_up.content.text)
else:
print(resp.content.text)
如何提升代理的可靠性?
- 清理工具輸入(避免提示注入)。
- 在回饋模型前驗證工具輸出(進行 schema 檢查)。
- 限制工具權限(最小必要權限原則)。
- 使用壓縮輔助(來自 Anthropic SDK)在長時間運行中保持上下文可控。
如何為 Opus 4.5 設計提示與結構化訊息?
哪些訊息角色與預填策略最有效?
採用三段式模式:
- System(role: system):全域指令——語氣、護欄、角色。
- Assistant(可選):預設範例或引導內容。
- User(role: user):當前請求。
在 system 訊息中預先填入限制(格式、長度、安全政策、若需結構化輸出則提供 JSON schema)。對代理來說,加入工具規格與使用範例,讓 Opus 4.5 能正確呼叫這些工具。
如何使用上下文壓縮與提示快取來節省 Tokens?
- 上下文壓縮:將較舊的對話片段壓縮為精煉摘要,但保留模型仍需的關鍵推理區塊。Opus 4.5 支援自動化壓縮上下文,以避免流失關鍵資訊。
- 提示快取:對重複提示快取模型回覆(Anthropic 提供提示快取模式,降低延遲/成本)。
兩者均能降低長互動的 Token 足跡,適用於長時間運行的代理與生產型助理。
錯誤處理與最佳實務
以下是將 Opus 4.5 用於生產整合的可靠性與安全建議。
可靠性與重試
- 處理速率限制(HTTP 429):使用指數退避與抖動(從 500–1000ms 起)。
- 具冪等性:對不具副作用的 LLM 呼叫可安全重試;但在模型會觸發外部副作用(工具呼叫)的流程中要謹慎——可透過追蹤
tool_use_id或自有請求 ID 去重。 - 串流穩定性:處理部分串流並優雅地重連;若中斷,建議重試整個請求或使用應用層狀態恢復,以避免不一致的工具互動。
安全與風險控管
- 提示注入與工具安全:切勿允許模型直接執行任意 Shell 指令或程式碼而未經驗證。務必驗證工具輸入並清理輸出。模型僅提出工具呼叫,你的程式決定是否執行。Anthropic 的系統卡與文件描述了對齊限制與安全等級——在高風險領域請遵循。
- 資料處理與合規:對包含個資或受規管資料的提示與工具 I/O,依據你的法規/合規政策處理。若有嚴格的資料駐留或稽核需求,使用提供者的 VPC/企業控制(如 Bedrock / Vertex / Foundry 提供企業選項)。
可觀測性與成本控制
- 記錄請求/回應中繼資料(未獲許可時勿記錄敏感原文)——Token 數、
effort等級、延遲、模型 ID 與提供者。這些指標對成本歸因與除錯很關鍵。 - 使用 effort 控制單次呼叫成本:例行摘要或高 QPS 端點可偏好
low;深度除錯或調查則用high。監控品質與 Token 消耗,為不同端點選擇預設值。
結論——何時(以及如何)選擇 Opus 4.5?
當你的產品需要:
- 深度多步推理(長邏輯鏈、研究或除錯),
- 穩健的代理/工具編排(呼叫外部 API 的複雜工作流程),或
- 針對大型程式碼庫的生產級程式輔助,
Claude Opus 4.5 是自然的選擇。運作上,使用 effort 調整單次呼叫預算;依循工具使用模式以維持執行安全;並依合規需求在雲端夥伴(或直接 Anthropic API)中做選擇。請用你的真實語料評測:供應商數據(如 SWE-bench)是有用的訊號,但 ROI 仍取決於你的實際任務與資料。就安全而言,遵循 Opus 4.5 系統卡,並對工具執行與個資處理設置護欄。
開發者可透過 CometAPI 存取 Claude Opus 4.5 API。若要開始,請在 Playground 探索 CometAPI 的模型能力,並參考 API 指南以獲得詳細指示。存取前,請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,協助你整合。
Ready to Go?→ Sign up for CometAPI today!
