Claude Opus 4.5：它如何——以及價格是多少？

Anthropic 的 Claude 系列一直是 2025 年前沿模型競賽中動作最快的主線之一。過去幾週，多起洩漏、社交貼文與調查性報導都指向一個即將到來的 Claude Opus 4.5（常簡稱為「Opus 4.5」）——部分消息來源稱其內部參考名為 Neptune V6——且該模型已分享給外部紅隊成員進行越獄測試。公開資訊仍相當零碎，因此本文匯整現有報導，說明此次洩漏對能力與安全性的意涵，並對可能的定價與 Opus 4.5 在 Google 的 Gemini 3 與 OpenAI 的 GPT-5.1 面前的相對位置做出務實估計。

What is Claude Opus 4.5?

A frontier Claude 4.5 family member

Anthropic 過去以「Opus」「Sonnet」「Haiku」等名稱區分模型家族與能力層級。Opus 是 4.x 世代（例如 Opus 4.1）中能力最強的一支；Sonnet 與 Haiku 分別對應中階與較小型層級。依此命名慣例，「Claude Opus 4.5」合乎邏輯地對應為 Claude 4.5 系列中的新高端發佈。

「Opus」是 Anthropic 在 Claude 4 系列中用來指稱最高容量、最高能力模型的標籤——定位於最困難的推理、研究與程式設計任務（Opus 4 與 Opus 4.1 是最醒目的線上例子）。Opus 模型的設計取向是以更高的推論成本換取更好的長上下文推理、程式表現與複雜流程的穩健度，Anthropic 歷來也把延展上下文處理與「更深層思考」模式等特性優先留給 Opus 層級。

What the identifiers tell us: “Opus 4.5” and “Neptune V6”

目前的公開訊號中出現了兩條相互獨立的線索：

開發者與社群成員回報，在 Claude Code CLI 請求與版本庫討論中短暫看到 Opus 4.5 這個模型識別字串——這是內部名稱滲入日誌或 PR 時常見的早期洩漏足跡。
多家媒體與社群貼文稱開發／紅隊版本的內部代號是 Neptune V6；Anthropic 過往慣用 Neptune 的內部工作臺名稱指代發佈前／紅隊快照。因此，Neptune 很可能對應於內部測試實例，而外部產品名稱則會是 Claude Opus 4.5。

結論：公開訊號顯示 Claude Opus 4.5 是預期中的 Claude 4.5 系列高能力成員，當前處於測試階段，並（依最新報導）正進行主動紅隊測試。這組訊號彼此一致且可信，但尚不足以等同於官方產品公告。

How did the leak surface and how reliable is it?

The visible trail of evidence

目前的敘事由三種模式匯聚而成：

出現在開發工具／拉取請求中的模型識別：觀察者在 Claude Code CLI 的 PR 或內部工具日誌中注意到「Claude Opus 4.5／Neptune V6」字串——這通常是內部模型名稱外溢到可見工作流的早期指標。一則簡短的 X/Twitter 貼文與後續轉發將這一發現擴散到更大的社群。
Reddit 與社群討論：聚焦 Claude 的子版塊正在討論用戶回報的變化、Sonnet/Opus 可用性與效能異常，一些用戶聲稱在其測試環境中瞥見 4.5 變體。社群訊號雜訊不少，但作為早期跡象頗具參考價值。
Anthropic Shares New AI Model with Red Team Members：AIPRM 首席工程師 Tibor Blaho 在 X（前 Twitter）發文稱 Anthropic 於週二將 Neptune V6 LLM 發送給紅隊測試者。值得注意的是，爆料者還提到該 AI 公司為外部安全評估者發起了一項為期 10 天的挑戰；若能在 10 天內找到經確認的、具有普適性的越獄方法，將可獲得額外獎勵。

How confident should you be?

應持審慎樂觀態度。證據鏈符合早期模型洩漏的典型路徑：內部識別外滲至工具或日誌、社群成員發現、媒體接續報導。這一模式過去多次先於正式發佈出現——但偶爾也僅指向不會公開落地的內部試驗。簡言之：以 Neptune 命名的測試實例與在日誌中出現的 Opus 4.5 識別，兩者的「存在」是可信的。

What would Claude Opus 4.5 be like (features and performance)?

What Opus 4.1 already offers

依 Anthropic 公告與產品文件：Opus 4.1 強化了代理式工作流、實務程式設計與穩健的多步推理。它位於 Anthropic 產品譜系的高端，可透過 Claude API、Claude Code，以及 AWS Bedrock、Google Vertex AI 等合作管道使用。鑒於 Opus 類模型鎖定複雜工程與企業級任務，它們具備大上下文視窗與安全／護欄層。

What Sonnet 4.5 brought that informs expectations for a hypothetical Opus 4.5

Sonnet 4.5 在「程式能力」「代理式工具使用」與「延展推理」上持續推進——這些領域與 Opus 的使命高度重疊。Sonnet 4.5 也在數學與金融、安全領域知識上有所提升；Anthropic 將其定位為「最佳程式模型」與最適合代理式工作流的選擇。這使得我們有理由預期任何即將到來的 Opus 4.5 會沿用 Sonnet 的架構或訓練改進，並在 Opus 的更高能力範疇中放大其效果。

Likely Claude Opus 4.5 feature set (inferred)

若 Opus 4.5 延續以往 Opus 升級的產品邏輯，合理預期包括：

預設更強的多步推理與「延展思考」：更佳的內在思考鏈、更長且可靠的複雜規劃與多代理協作鏈（Sonnet 4.5 已在此有所強化）。
更高的程式與軟體工程能力：更少代碼幻覺、更好的跨檔案推理、改進的修補與測試產生能力，以及可覆蓋大型代碼庫的更長上下文視窗——Opus 系列明確聚焦於此。
改進的工具使用與代理協調：更穩定的工具呼叫、更佳的子任務與非同步流程編排（對 Copilot 類代理與「辦公代理」整合尤為重要）。
企業級安全、法規遵循與可解釋性：更強護欄、系統卡與 ASL 分類，延續 Sonnet 4.5 的路線。
多模態升級（可能）：更好的影像／代碼／文件理解以支援混合工作流——雖然 Sonnet 率先發力，Opus 可能進一步推進。

Performance expectations

量測表現大概率會延續家族更新的模式：Opus 4.5 旨在超越 Opus 4.1，並在程式與代理基準上對標或追平 Sonnet 4.5 的成績——但以更高的每 token 成本，聚焦於少數更嚴苛的使用場景（企業工程、研究與代理自動化）。若 Sonnet 4.5 在程式與推理上已大幅進步，Opus 4.5 的定位則是在關鍵任務中提供「最高」可靠性與最佳的一次通過正確率。

How much would Claude Opus 4.5 cost?

What Anthropic charges today (H3)

Anthropic 的公開個人訂閱（Claude Pro）與 API 定價提供了最佳參考：

消費者／Pro 訂閱：Claude Pro 對個人效率用途標示為「年繳 $17/月」或「月繳 $20/月」。這讓使用者可在 Claude.ai 上使用較高階的模型與功能。
API／Opus 定價（已在 Opus 4／4.1 確認）：Anthropic 在 2025 年公開文件與多份定價摘要中，為 Opus 級模型設定了約「每 100 萬輸入 tokens 收費 $15、每 100 萬輸出 tokens 收費 $75」的費率。Anthropic 也提供「提示快取」與「批次處理」折扣（提示快取可大幅降低重複提示成本；批次處理可為大型任務帶來約 ~50% 的降幅）。這些 Opus 費率明顯高於 Sonnet/Haiku 層級，反映其高端定位。

Estimated pricing for an Opus 4.5 release

若 Opus 4.5 發佈，最保守（也最可能）的定價情境是：

不變價（最可能）：Anthropic 將 Opus 4.5 置於與 4.1 相同的 Opus 定價區間——即「約 $15／$75 每百萬 tokens」——並透過快取／批次等機制逐步調整實際成本。歷來 Opus 4.1 的發佈並未提高基準 Opus 價格，因此一次漸進式改進可能沿用相同策略。

How does an Opus 4.5 (rumored) compare to Gemini 3 and GPT-5.1?

（我比較目前公開的宣稱與基準：Gemini 3（Google）、GPT-5.1（OpenAI），以及 Opus 家族（Anthropic）。對於 Opus 4.5，我基於 Opus 4.1 與 Sonnet 4.5 的表現進行合理外推。）

What Gemini 3 and GPT-5.1 are now

Gemini 3（Google）：Google 於 2025 年 11 月公開推出 Gemini 3，定位為其迄今最強的多模態與推理模型，具備全新代理功能、強大的多模態（文字／影像／影片／音訊）推理，並在多項基準（LMArena、GPQA、MathArena、MMMU 系列）上取得頂尖成績。Google 正將 Gemini 3 佈署於 Gemini 應用、Google Cloud 與開發者工具。
GPT-5.1（OpenAI）：OpenAI 在 2025 年 11 月中發佈 GPT-5.1，作為 GPT-5 的升級，提供兩個變體：GPT-5.1 Instant（更迅速、更對話化）與 GPT-5.1 Thinking（在複雜任務上具更強持續性）。OpenAI 強調對話品質提升、「更溫暖」的輸出，以及更多使用者個人化選項；其定位是對 GPT-5 的迭代升級。

Head-to-head expectations

原生推理與基準領先：公開基準顯示 Gemini 3 在多項指標（LMArena Elo、多模態基準）上刷新排行榜。GPT-5.1 以更順暢、對話體驗更佳的迭代著稱，並在複雜任務上表現強勁；Sonnet 4.5 與 Opus 4.1 在程式與代理任務上仍具競爭力。若 Opus 4.5 落地，預期其會在程式與可靠性上壓過 Opus 4.1，但就 Google 公開的多模態與推理成績而言，Gemini 3 可能在多項尖端指標上暫居上風。

程式與「電腦操作」：Anthropic 強調 Sonnet 4.5 的程式優勢，並在許多測試中將 Sonnet 描述為最佳程式模型；Opus 歷來聚焦最棘手的程式與代理用例。儘管如此，Google 與 OpenAI 也在大力投資代碼工具與代理平台——Gemini 3 提供「vibe coding」與代理整合，OpenAI 亦持續透過 GPT 系列增強代碼能力。

多模態與代理工作流：Google 的 Gemini 系列長期強調廣泛的多模態理解（影像、影片、音訊、文字）；Gemini 3 進一步迭代。Anthropic 的 Claude 家族則優先強化工具使用與代理安全；Sonnet 4.5 提升了代理能力，但 Opus 4.1／4.5 的調性更偏向深度與可靠性，而非多媒體廣度。GPT-5.1 嘗試在兩者之間取得平衡，並強調對話性與客製化。

誰「勝出」取決於產品目標：多模態創意與大生態自動化 → Gemini 3；關鍵任務工程、程式與高安全需求自動化 → Opus/Sonnet；大規模對話客製化 → GPT-5.1。

Final verdict: what to expect and how to plan

Anthropic 正在快速迭代：Sonnet 4.5 重塑了在程式與代理任務上的成本—能力平衡，而 Opus 4.1 仍是面向關鍵工程與代理編排的現行高端模型。有關 Claude Opus 4.5 的傳聞合理且符合 Anthropic 的發佈節奏——但仍「尚未官方確認」。若／當 Opus 4.5 推出，預期其相較 Opus 4.1 將在推理、程式可靠性與代理穩定性上帶來漸進但關鍵的提升；定價應仍落在 Opus 的高端區間（輸入／輸出費率與企業分層相近），並繼續是高輸出工作負載的高投入之選。

開發者可透過 CometAPI 存取 Gemini 3 Pro Preview API 與 Claude Sonnet 4.5 API。開始之前，請在 Playground 探索 CometAPI 的模型能力，並參考 API 指南以取得詳細說明。存取前，請先登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格，協助你快速整合。

準備好了嗎？→ Sign up for CometAPI today！

若想獲取更多 AI 技巧、指南與新聞，歡迎在 VK、X 與 Discord 關注我們！