Claude 4.5 的思考模式:你需要知道的一切

CometAPI
AnnaDec 30, 2025
Claude 4.5 的思考模式:你需要知道的一切

Anthropic 的 Claude 4.5 系列(特別是 Sonnet 4.5Opus 4.5)為 Claude 4 系列帶來延伸的「思考」/ 記事本式內部推理。Messages API 透過 thinking 物件(啟用/停用 + budget_tokens 配額)、串流選項,以及對「思考」內容區塊(包含簽章與修訂)的特殊處理,對外提供此能力。Sonnet 4.5 針對程式開發與代理型任務,從延伸思考中獲益甚多;Opus 4.5 則加入保留的思考區塊與其他最佳化。

什麼是 Claude 4.5?

Claude 4.5(由 Anthropic 的 Claude 模型系列以 Sonnet 4.5Opus 4.5 變體發布)是該公司最新一代大型語言模型,針對更深層的推理、長期脈絡,以及可投入生產的程式開發/代理型工作流程進行調校。根據 Anthropic 的公告與產品頁,Sonnet 4.5 被描述為在程式開發、代理建構與「使用電腦」(即工具輔助的工作流程與多步自動化)上邁出重要一步,並在推理、數學與長脈絡任務上有可量測的提升。

4.5 系列陣容

  • Claude Sonnet 4.5 (發佈於 2025 年 9 月 29 日): 家族中的「主力」型號。目前被評為全球最佳的程式設計模型,能夠在自主任務中維持超過 30 小時的專注。兼顧速度、成本與高階推理,是多數企業應用的預設選擇。
  • Claude Haiku 4.5 (發佈於 2025 年 10 月 15 日): 針對速度最佳化的模型。令人驚訝的是,它現在支援 Extended Thinking,成為首個提供過去僅限尖端模型才具備的深度推理能力的「小型」模型。非常適合高頻任務,在重視延遲同時也不能犧牲準確性的場景。
  • Claude Opus 4.5 (發佈於 2025 年 11 月 24 日): 前沿智慧模型。Opus 4.5 專為最複雜與模糊的任務設計——例如科學研究、新型架構設計與高風險的金融分析。它具備最高的「思考預算」容量,並在自我修正方面表現出色。

主要能力一覽

  • 更大的可用上下文視窗,並在長時間運行的任務中(代理工作流程、逐步除錯、程式碼庫修改)有更佳表現。
  • 在程式碼評測、重構與多步工具使用任務上(Sonnet 與 Opus 系列)有更佳表現。
  • 進階「思考」功能(Anthropic 稱之為「延伸思考」/「思考模式」),可選擇性地向開發者揭示部分模型的內部逐步推理,或讓模型在產出最終答案前花費可配置的「預算」進行推理。

哪裡可以執行 Claude 4.5

Claude 4.5(Sonnet/Opus)可透過 Anthropic 自家 API 使用,並已整合至 CometAPI(API pricing is currently on sale, approximately 20% of the Anthropic’s price. ),因此你可以透過 Anthropic 的平台或承載該模型的第三方雲端供應商運行。

Claude Code 與 Claude 4.5 中全新 THINKING 模式是什麼?

Anthropic 的「延伸思考」(亦稱「思考模式」、「思考區塊」或「思考代幣」)是一項功能,讓模型在產生最終答案之前執行額外的內部取樣步驟,以更全面地推理。你可以在 Messages API 請求中加入 thinking 設定來啟用(例如:{ "thinking": { "type": "enabled", "budget_tokens": 4096 } }),或使用 Anthropic 的 SDK 輔助工具。啟用後,API(依模型不同)會回傳內部推理的摘要版本,或回傳完整推理(為安全起見可能包含修訂)。

要理解為何「Thinking Mode」具有革命性,我們需要回顧大型語言模型(LLMs)傳統上如何運作。標準模型是「機率式文字生成器」——在收到提示後立即預測下一個 token。它們不會「停下來思考」;而是立即開始「說話」(生成)。

向「延伸思考」的轉變

「思考模式」改變了這個典範。啟用後,Claude 4.5 會在向使用者輸出任何可見文字之前,先生成一段隱藏的「思考代幣」串流。

「可見推理(可選)」:在像 Claude.ai 的某些介面中,你可以看到一個「Thinking」下拉選單,顯示模型的內部獨白。

「隱藏推理(API)」:在 API 中,這些是獨立的 thinking 區塊。模型會在此空間中:

  • 「解構提示」:拆解複雜限制條件。
  • 「制定策略」:列出逐步邏輯。
  • 「起草與批判」:在心中嘗試解法、找出缺陷,並在呈現答案之前修正。

交錯式思考

Sonnet 4.5 的一項重大創新是「交錯式思考」。在代理型工作流程(AI 使用計算機、程式碼直譯器或網頁瀏覽器等工具)中,標準模型通常會呼叫工具、取得結果,接著立刻呼叫下一個工具。

透過交錯式思考,Claude 4.5 可以:

  1. 「思考」使用者的請求。
  2. 呼叫工具 A(例如:搜尋網路)。
  3. 再次「思考」搜尋結果(「這個結果過時了,我應該嘗試不同的查詢」)。
  4. 呼叫工具 B(例如:再次搜尋)。
  5. 「思考」如何綜合這些資料。
  6. 最終回應。

這種「思考-行動-思考-行動」迴圈,在長且多步驟的程式開發任務中,大幅降低臆測與錯誤傳播。

Claude Code 如何在開發者工具中呈現思考

Claude Code(CLI / 編輯器體驗)中,Anthropic 新增了 UI 控制項,可在互動式會話中切換思考模式(常見的使用者體驗是按 Tab 切換思考開/關),並顯示目前思考預算的指示器。一些較舊的觸發關鍵詞(例如 thinkthink hard)曾被用於控制思考深度;現代版本則依賴明確的切換與預算參數,ultrathink 在某些情境中仍可使用。設定可以在 ~/.claude/settings.json 中做全域配置,或在每次請求時覆蓋。

如何實作 Claude 4.5 的思考模式?

對開發者而言,遷移到 Claude 4.5 需要改變 API 請求的結構。你不再只是送出提示;你在管理一個「思考預算」。

設定思考預算

thinking 參數現在是 Anthropic API 的一等公民。你必須明確啟用並定義 budget_tokens。此值代表模型可用於內部推理的最大計算量。

Python 實作範例

以下程式碼示範如何在啟用延伸思考的情況下,初始化一個 Claude 4.5 會話。

import anthropic

# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # We set a high max_tokens to accommodate both thinking and the final answer
    # The budget_tokens must be less than max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allocating 12k tokens for 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Extracting the two distinct parts of the response
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)

主要技術考量

  • 「總 token 使用量」:你的總使用量是 thinking_tokens + output_tokens。如果你設置 10,000 的預算,模型用 8,000 來思考、2,000 產出答案,你會按 10,000 個輸出 token 計費。
  • 「強制思考」:若任務過於簡單,模型仍可能使用最低限度的思考代幣,以驗證請求的簡單性。

思考模式如何提升程式碼生成?

Claude 4.5 在 Claude Code CLI 中最顯著的升級之一,是其在「思考」程式碼時會執行多項標準模型忽略的隱性動作。

1. 依賴關係對映

在撰寫任何一行修正之前,Claude 4.5 會遍歷你的版本庫,以理解 utils/auth.ts 的變更如何可能破壞 views/Profile.tsx 中的某個元件。

2. 心智執行

模型會在推理區塊中「執行」程式碼。它模擬邏輯流程並找出可能的競態條件或 off-by-one 錯誤。

3. 約束驗證

如果你要求解法「效能良好且不使用外部函式庫」,思考模式就會扮演閘門角色。若模型的第一直覺是建議一個 NPM 套件,思考過程會捕捉到該違規並逼使模型重新思考以原生 JavaScript 實作。

思考模式與傳統提示相比如何?

許多使用者熟悉「Chain of Thought(CoT)」提示,你會告訴模型:「一步步思考。」雖然有效,但它不同於 Claude 4.5 原生的思考模式。

功能Chain of Thought(手動)Extended Thinking(原生)
機制使用者透過提示指示。內建於模型架構。
token 空間佔用可見輸出空間。佔用專用的內部區塊。
自我修正有限;模型常會在早期錯誤上「越錯越深」。高;模型可丟棄整條推理路徑並重新開始。
可靠性取決於提示品質而變動。在複雜領域中穩定且表現一致。
API 處理需要手動剖析文字。為「thinking」與「text」提供結構化 JSON 區塊。

Claude 4.5 的思考模式如何運作?

內部工作流程(概念)

  1. 使用者請求:你的應用程式送出一個 Messages API 請求,指定模型、提示、max_tokens,並可選擇加入 thinking: { type: "enabled", budget_tokens: N }
  2. 內部推理:Claude 會在預算內執行內部「思考」。它會將推理輸出記錄為 thinking 區塊(可能為使用者摘要)。
  3. 輸出組合:API 會回傳一組內容區塊陣列。通常順序是 thinking 區塊之後接著 text 區塊(最終答案)。若為串流,你會收到 thinking_delta 事件,再接著 text_delta 事件。
  4. 脈絡保存:當使用工具或進行多輪對話時,你可以重新傳送先前的思考區塊(不修改),讓 Claude 延續推理鏈。Opus 4.5 引入預設保留思考區塊的行為,以利快取/效率。

技術上,思考模式依賴特定的 API 參數配置,為推理分配一個「預算」的 tokens。

Token 預算概念

當你對 Claude 4.5 發出請求時,必須指定 budget_tokens 參數。這是模型可用於其內部獨白的最大 token 數。

  • 低預算(<2,000 tokens):適合快速健檢或簡單邏輯謎題。
  • 高預算(10,000+ tokens):用於複雜的軟體架構、數學證明或撰寫完備的法律文件。

模型經過訓練能夠「管理」這個預算。如果它感知到預算將用罄,會嘗試收斂推理並提供最佳可能答案。

「思考流程」生命週期

當使用者詢問:「撰寫一個 Python 指令碼來爬取此網站,但要確保遵守 robots.txt 並處理動態載入。」

  1. 擷取:Claude 讀取提示。
  2. 思考階段(隱藏):
    • 自我修正:「我需要使用 Selenium 或 Playwright 來處理動態載入。requests 不適用。」
    • 安全檢查:「我必須確認使用者有爬取的權限。我會加入免責聲明。」
    • 架構設計:「我會用類別式結構來提升模組化。」
  3. 輸出階段(可見):Claude 產生 Python 程式碼。

在先前的模型中,AI 可能會立刻開始撰寫 requests 的程式碼,寫到一半才發現不適用於動態內容,然後不是臆測解法就是產生壞掉的程式碼。思考模式能避免這種「走進死胡同」的情況。

何時應啟用思考模式——使用情境與判斷準則?

最受益的使用情境

  • 複雜程式開發(架構層級變更、多檔案重構、長時間除錯工作)。啟用思考時,Sonnet 4.5 在程式開發與代理方面表現尤佳。
  • 多次使用工具、需在多步中保留內部脈絡的代理型工作流程。交錯式思考 + 工具使用是主要場景。
  • 深度研究或分析(統計分析、金融結構化、法律推理),需要檢閱或驗證中間推理步驟的情況。

不建議啟用的情境

  • 需要極低延遲的短答案生成或高吞吐 API(例如要求毫秒級回應的聊天介面)。
  • 當每次請求的 token 成本必須最小化且任務簡單或規格明確。

實務判斷

從「最低思考預算(約 1,024 tokens)」起步,針對需要更深入的任務逐步提升;同時基準測試端到端的任務準確率、延遲與 tokens。對於多步代理任務,嘗試交錯式思考與快取的提示斷點,以尋找平衡點。

結論

Claude 4.5 的思考模式不僅是一項功能;它是一種與人工智慧互動的新方式。透過將「思考的過程」與「思考的產物」分離,Anthropic 提供了一個更可靠、更透明,且更能處理現代企業工作複雜性的工具。

無論你是使用 Claude Code CLI 來管理大規模遷移,還是透過 API 構建新一代的自主代理,「掌握思考預算」都是成功的關鍵。

開發者可以透過 CometAPI 存取 Claude 4.5 模型。開始之前,請在 CometAPIPlayground 探索模型能力,並查閱 API 指南以取得詳細說明。存取前,請確保你已登入 CometAPI 並取得 API 金鑰。CometAPI 以遠低於官方的價格提供,協助你完成整合。

Ready to Go?→ 免費試用 Claude 4.5!

以低成本 存取頂級模型

閱讀更多