Anthropic 的 Claude 4.5 系列(特別是 Sonnet 4.5 與 Opus 4.5)為 Claude 4 系列帶來延伸的「思考」/ 記事本式內部推理。Messages API 透過 thinking 物件(啟用/停用 + budget_tokens 配額)、串流選項,以及對「思考」內容區塊(包含簽章與修訂)的特殊處理,對外提供此能力。Sonnet 4.5 針對程式開發與代理型任務,從延伸思考中獲益甚多;Opus 4.5 則加入保留的思考區塊與其他最佳化。
什麼是 Claude 4.5?
Claude 4.5(由 Anthropic 的 Claude 模型系列以 Sonnet 4.5 與 Opus 4.5 變體發布)是該公司最新一代大型語言模型,針對更深層的推理、長期脈絡,以及可投入生產的程式開發/代理型工作流程進行調校。根據 Anthropic 的公告與產品頁,Sonnet 4.5 被描述為在程式開發、代理建構與「使用電腦」(即工具輔助的工作流程與多步自動化)上邁出重要一步,並在推理、數學與長脈絡任務上有可量測的提升。
4.5 系列陣容
- Claude Sonnet 4.5 (發佈於 2025 年 9 月 29 日): 家族中的「主力」型號。目前被評為全球最佳的程式設計模型,能夠在自主任務中維持超過 30 小時的專注。兼顧速度、成本與高階推理,是多數企業應用的預設選擇。
- Claude Haiku 4.5 (發佈於 2025 年 10 月 15 日): 針對速度最佳化的模型。令人驚訝的是,它現在支援 Extended Thinking,成為首個提供過去僅限尖端模型才具備的深度推理能力的「小型」模型。非常適合高頻任務,在重視延遲同時也不能犧牲準確性的場景。
- Claude Opus 4.5 (發佈於 2025 年 11 月 24 日): 前沿智慧模型。Opus 4.5 專為最複雜與模糊的任務設計——例如科學研究、新型架構設計與高風險的金融分析。它具備最高的「思考預算」容量,並在自我修正方面表現出色。
主要能力一覽
- 更大的可用上下文視窗,並在長時間運行的任務中(代理工作流程、逐步除錯、程式碼庫修改)有更佳表現。
- 在程式碼評測、重構與多步工具使用任務上(Sonnet 與 Opus 系列)有更佳表現。
- 進階「思考」功能(Anthropic 稱之為「延伸思考」/「思考模式」),可選擇性地向開發者揭示部分模型的內部逐步推理,或讓模型在產出最終答案前花費可配置的「預算」進行推理。
哪裡可以執行 Claude 4.5
Claude 4.5(Sonnet/Opus)可透過 Anthropic 自家 API 使用,並已整合至 CometAPI(API pricing is currently on sale, approximately 20% of the Anthropic’s price. ),因此你可以透過 Anthropic 的平台或承載該模型的第三方雲端供應商運行。
Claude Code 與 Claude 4.5 中全新 THINKING 模式是什麼?
Anthropic 的「延伸思考」(亦稱「思考模式」、「思考區塊」或「思考代幣」)是一項功能,讓模型在產生最終答案之前執行額外的內部取樣步驟,以更全面地推理。你可以在 Messages API 請求中加入 thinking 設定來啟用(例如:{ "thinking": { "type": "enabled", "budget_tokens": 4096 } }),或使用 Anthropic 的 SDK 輔助工具。啟用後,API(依模型不同)會回傳內部推理的摘要版本,或回傳完整推理(為安全起見可能包含修訂)。
要理解為何「Thinking Mode」具有革命性,我們需要回顧大型語言模型(LLMs)傳統上如何運作。標準模型是「機率式文字生成器」——在收到提示後立即預測下一個 token。它們不會「停下來思考」;而是立即開始「說話」(生成)。
向「延伸思考」的轉變
「思考模式」改變了這個典範。啟用後,Claude 4.5 會在向使用者輸出任何可見文字之前,先生成一段隱藏的「思考代幣」串流。
「可見推理(可選)」:在像 Claude.ai 的某些介面中,你可以看到一個「Thinking」下拉選單,顯示模型的內部獨白。
「隱藏推理(API)」:在 API 中,這些是獨立的 thinking 區塊。模型會在此空間中:
- 「解構提示」:拆解複雜限制條件。
- 「制定策略」:列出逐步邏輯。
- 「起草與批判」:在心中嘗試解法、找出缺陷,並在呈現答案之前修正。
交錯式思考
Sonnet 4.5 的一項重大創新是「交錯式思考」。在代理型工作流程(AI 使用計算機、程式碼直譯器或網頁瀏覽器等工具)中,標準模型通常會呼叫工具、取得結果,接著立刻呼叫下一個工具。
透過交錯式思考,Claude 4.5 可以:
- 「思考」使用者的請求。
- 呼叫工具 A(例如:搜尋網路)。
- 再次「思考」搜尋結果(「這個結果過時了,我應該嘗試不同的查詢」)。
- 呼叫工具 B(例如:再次搜尋)。
- 「思考」如何綜合這些資料。
- 最終回應。
這種「思考-行動-思考-行動」迴圈,在長且多步驟的程式開發任務中,大幅降低臆測與錯誤傳播。
Claude Code 如何在開發者工具中呈現思考
在 Claude Code(CLI / 編輯器體驗)中,Anthropic 新增了 UI 控制項,可在互動式會話中切換思考模式(常見的使用者體驗是按 Tab 切換思考開/關),並顯示目前思考預算的指示器。一些較舊的觸發關鍵詞(例如 think、think hard)曾被用於控制思考深度;現代版本則依賴明確的切換與預算參數,ultrathink 在某些情境中仍可使用。設定可以在 ~/.claude/settings.json 中做全域配置,或在每次請求時覆蓋。
如何實作 Claude 4.5 的思考模式?
對開發者而言,遷移到 Claude 4.5 需要改變 API 請求的結構。你不再只是送出提示;你在管理一個「思考預算」。
設定思考預算
thinking 參數現在是 Anthropic API 的一等公民。你必須明確啟用並定義 budget_tokens。此值代表模型可用於內部推理的最大計算量。
Python 實作範例
以下程式碼示範如何在啟用延伸思考的情況下,初始化一個 Claude 4.5 會話。
import anthropic
# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")
def get_reasoned_response(user_query):
# We set a high max_tokens to accommodate both thinking and the final answer
# The budget_tokens must be less than max_tokens
response = client.messages.create(
model="claude-4-5-sonnet-202512",
max_tokens=20000,
thinking={
"type": "enabled",
"budget_tokens": 12000 # Allocating 12k tokens for 'thinking'
},
messages=[
{"role": "user", "content": user_query}
]
)
# Extracting the two distinct parts of the response
thinking_content = ""
final_output = ""
for block in response.content:
if block.type == "thinking":
thinking_content = block.thinking
elif block.type == "text":
final_output = block.text
return thinking_content, final_output
# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)
print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)
主要技術考量
- 「總 token 使用量」:你的總使用量是
thinking_tokens+output_tokens。如果你設置 10,000 的預算,模型用 8,000 來思考、2,000 產出答案,你會按 10,000 個輸出 token 計費。 - 「強制思考」:若任務過於簡單,模型仍可能使用最低限度的思考代幣,以驗證請求的簡單性。
思考模式如何提升程式碼生成?
Claude 4.5 在 Claude Code CLI 中最顯著的升級之一,是其在「思考」程式碼時會執行多項標準模型忽略的隱性動作。
1. 依賴關係對映
在撰寫任何一行修正之前,Claude 4.5 會遍歷你的版本庫,以理解 utils/auth.ts 的變更如何可能破壞 views/Profile.tsx 中的某個元件。
2. 心智執行
模型會在推理區塊中「執行」程式碼。它模擬邏輯流程並找出可能的競態條件或 off-by-one 錯誤。
3. 約束驗證
如果你要求解法「效能良好且不使用外部函式庫」,思考模式就會扮演閘門角色。若模型的第一直覺是建議一個 NPM 套件,思考過程會捕捉到該違規並逼使模型重新思考以原生 JavaScript 實作。
思考模式與傳統提示相比如何?
許多使用者熟悉「Chain of Thought(CoT)」提示,你會告訴模型:「一步步思考。」雖然有效,但它不同於 Claude 4.5 原生的思考模式。
| 功能 | Chain of Thought(手動) | Extended Thinking(原生) |
|---|---|---|
| 機制 | 使用者透過提示指示。 | 內建於模型架構。 |
| token 空間 | 佔用可見輸出空間。 | 佔用專用的內部區塊。 |
| 自我修正 | 有限;模型常會在早期錯誤上「越錯越深」。 | 高;模型可丟棄整條推理路徑並重新開始。 |
| 可靠性 | 取決於提示品質而變動。 | 在複雜領域中穩定且表現一致。 |
| API 處理 | 需要手動剖析文字。 | 為「thinking」與「text」提供結構化 JSON 區塊。 |
Claude 4.5 的思考模式如何運作?
內部工作流程(概念)
- 使用者請求:你的應用程式送出一個 Messages API 請求,指定模型、提示、
max_tokens,並可選擇加入thinking: { type: "enabled", budget_tokens: N }。 - 內部推理:Claude 會在預算內執行內部「思考」。它會將推理輸出記錄為
thinking區塊(可能為使用者摘要)。 - 輸出組合:API 會回傳一組內容區塊陣列。通常順序是
thinking區塊之後接著text區塊(最終答案)。若為串流,你會收到 thinking_delta 事件,再接著 text_delta 事件。 - 脈絡保存:當使用工具或進行多輪對話時,你可以重新傳送先前的思考區塊(不修改),讓 Claude 延續推理鏈。Opus 4.5 引入預設保留思考區塊的行為,以利快取/效率。
技術上,思考模式依賴特定的 API 參數配置,為推理分配一個「預算」的 tokens。
Token 預算概念
當你對 Claude 4.5 發出請求時,必須指定 budget_tokens 參數。這是模型可用於其內部獨白的最大 token 數。
- 低預算(<2,000 tokens):適合快速健檢或簡單邏輯謎題。
- 高預算(10,000+ tokens):用於複雜的軟體架構、數學證明或撰寫完備的法律文件。
模型經過訓練能夠「管理」這個預算。如果它感知到預算將用罄,會嘗試收斂推理並提供最佳可能答案。
「思考流程」生命週期
當使用者詢問:「撰寫一個 Python 指令碼來爬取此網站,但要確保遵守 robots.txt 並處理動態載入。」
- 擷取:Claude 讀取提示。
- 思考階段(隱藏):
- 自我修正:「我需要使用 Selenium 或 Playwright 來處理動態載入。
requests不適用。」 - 安全檢查:「我必須確認使用者有爬取的權限。我會加入免責聲明。」
- 架構設計:「我會用類別式結構來提升模組化。」
- 自我修正:「我需要使用 Selenium 或 Playwright 來處理動態載入。
- 輸出階段(可見):Claude 產生 Python 程式碼。
在先前的模型中,AI 可能會立刻開始撰寫 requests 的程式碼,寫到一半才發現不適用於動態內容,然後不是臆測解法就是產生壞掉的程式碼。思考模式能避免這種「走進死胡同」的情況。
何時應啟用思考模式——使用情境與判斷準則?
最受益的使用情境
- 複雜程式開發(架構層級變更、多檔案重構、長時間除錯工作)。啟用思考時,Sonnet 4.5 在程式開發與代理方面表現尤佳。
- 多次使用工具、需在多步中保留內部脈絡的代理型工作流程。交錯式思考 + 工具使用是主要場景。
- 深度研究或分析(統計分析、金融結構化、法律推理),需要檢閱或驗證中間推理步驟的情況。
不建議啟用的情境
- 需要極低延遲的短答案生成或高吞吐 API(例如要求毫秒級回應的聊天介面)。
- 當每次請求的 token 成本必須最小化且任務簡單或規格明確。
實務判斷
從「最低思考預算(約 1,024 tokens)」起步,針對需要更深入的任務逐步提升;同時基準測試端到端的任務準確率、延遲與 tokens。對於多步代理任務,嘗試交錯式思考與快取的提示斷點,以尋找平衡點。
結論
Claude 4.5 的思考模式不僅是一項功能;它是一種與人工智慧互動的新方式。透過將「思考的過程」與「思考的產物」分離,Anthropic 提供了一個更可靠、更透明,且更能處理現代企業工作複雜性的工具。
無論你是使用 Claude Code CLI 來管理大規模遷移,還是透過 API 構建新一代的自主代理,「掌握思考預算」都是成功的關鍵。
開發者可以透過 CometAPI 存取 Claude 4.5 模型。開始之前,請在 CometAPI 的 Playground 探索模型能力,並查閱 API 指南以取得詳細說明。存取前,請確保你已登入 CometAPI 並取得 API 金鑰。CometAPI 以遠低於官方的價格提供,協助你完成整合。
Ready to Go?→ 免費試用 Claude 4.5!
