什麼是 GPT-5.1-Codex-Max？

GPT-5.1-Codex-Max 是一款屬於 Codex 系列的模型，經過調校並專為代理式編碼工作流程而打造——也就是自主執行多步驟工程任務，例如倉庫級重構、長時間除錯、多小時代理迴圈、程式碼審查，以及以程式方式使用工具。它面向開發者工作流程，適用於模型必須：

在多次編輯與互動中維持狀態；
作為自動化鏈的一部分操作工具與終端機（執行測試、編譯、安裝、發出 git 指令）；
產生修補程式、執行測試，並為輸出提供可追溯的日誌與引用

主要功能

壓縮與多視窗上下文： 原生訓練支援壓縮歷史內容，並能在多個上下文視窗間連貫運作，從而實現專案級的連續性。
代理式工具使用（終端機 + 工具鏈）： 提升了執行終端機序列、安裝／建置／測試，以及根據程式輸出做出反應的能力。
更高的 token 效率： 設計上可為小型任務更有效地分配 token，同時對複雜任務使用更長的推理流程。
重構與大型編輯： 更擅長跨檔案重構、遷移與倉庫級修補（OpenAI 內部評估）。
推理強度模式： 提供新的推理強度層級，用於更長時間、計算量更大的推理（例如適合非延遲敏感任務的 Extra High / xhigh）。

技術能力（其擅長之處）

長期跨度重構與迭代迴圈： 可透過反覆迭代、執行測試、總結失敗原因並更新程式碼，持續進行長達數小時的專案級重構與除錯工作（OpenAI 在內部展示中報告超過 24 小時）。
真實世界錯誤修復： 在真實倉庫修補基準測試中表現強勁（SWE-Bench Verified：OpenAI 報告 Codex-Max 在 xhigh／extra-effort 設定下達到 77.9%）。
終端機／工具熟練度： 可讀取日誌、呼叫編譯器／測試、編輯檔案、建立 PR——也就是作為原生於終端機的代理執行，並具有明確、可檢視的工具呼叫。
可接受的輸入： 標準文字提示，以及程式碼片段、倉庫快照（透過工具／IDE 整合）、在支援視覺功能的 Codex 介面中的螢幕截圖／視窗，以及工具呼叫請求（例如執行 npm test、開啟檔案、建立 PR）。
可產生的輸出： 程式碼修補（diff 或 PR）、測試報告、逐步執行日誌、自然語言說明，以及帶註解的程式碼審查意見。作為代理使用時，它還可輸出結構化工具呼叫與後續動作。

基準表現（部分結果與背景）

SWE-bench Verified (n=500) —— GPT-5.1-Codex（high）：73.7%；GPT-5.1-Codex-Max（xhigh）：77.9%。此指標評估來自 GitHub／開源議題的真實世界工程任務。
SWE-Lancer IC SWE： GPT-5.1-Codex：66.3% → GPT-5.1-Codex-Max：79.9%（OpenAI 報告其在某些排行榜上的提升）。
Terminal-Bench 2.0： GPT-5.1-Codex：52.8% → GPT-5.1-Codex-Max：58.1%（在互動式終端機／工具使用評估中有所提升）。

限制與失效模式

雙重用途／資安風險： 增強的終端機操作與工具執行能力帶來雙重用途疑慮（模型可協助防禦性與攻擊性安全工作）；OpenAI 強調分階段存取控制與監控。
並非完全確定性或完全正確： 即使工程表現更強，模型仍可能提出錯誤修補，或遺漏細微的程式碼語義（例如錯誤偵測中的誤報／漏報），因此人工審查與 CI 測試仍然不可或缺。
成本與延遲取捨： 高強度模式（xhigh）會消耗更多運算資源／時間；長時間、多小時的代理迴圈會消耗額度或預算。請規劃成本與速率限制。([OpenAI開發者][2])
上下文保證與有效連續性： 壓縮功能可支援專案連續性，但對於哪些 token 被保留、以及壓縮如何影響少見邊界情況的精確保證，不能取代有版本管理的倉庫快照與可重現的流程。請將壓縮視為輔助工具，而非唯一真實來源。

與 Claude Opus 4.5 與 Gemini 3 Pro 的比較（高層次）

Anthropic — Claude Opus 4.5： 社群與媒體基準通常認為 Opus 4.5 在原始錯誤修復正確率（SWE-Bench）上略優於 Codex-Max，並在科學工作流程協調與極為精簡、token 效率高的輸出方面具有優勢。Opus 的每 token 定價通常較高，但在實務上可能更具 token 效率。Codex-Max 的優勢則在於長期跨度壓縮、終端機工具整合，以及長時間代理執行的成本效率。
Google Gemini 系列（3 Pro 等）： Gemini 各版本在多模態與一般推理基準上依然表現強勁；在程式設計領域中的結果則依測試框架而異。Codex-Max 專為代理式編碼打造，並以通用模型預設不具備的方式整合 DevTool 工作流程。

如何存取並使用 GPT-5.1 Codex Max API

步驟 1：註冊 API 金鑰

登入 cometapi.com。如果您尚未成為我們的使用者，請先註冊。登入您的 CometAPI console。取得介面的存取憑證 API key。點擊個人中心 API token 中的「Add Token」，取得 token key：sk-xxxxx 並提交。

步驟 2：向 GPT-5.1-Codex-Max API 發送請求

選擇「 gpt-5.1-codex-max」端點來發送 API 請求，並設定請求主體。請求方法與請求主體可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以方便您使用。請將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。開發者可透過 Responses API／Chat 端點進行呼叫。

將您的問題或請求插入 content 欄位——模型會回應這部分內容。處理 API 回應以取得生成的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後，API 會回傳任務狀態與輸出資料。

GPT 5.1 Codex Max

什麼是 GPT-5.1-Codex-Max？

主要功能

技術能力（其擅長之處）

基準表現（部分結果與背景）

限制與失效模式

與 Claude Opus 4.5 與 Gemini 3 Pro 的比較（高層次）

如何存取並使用 GPT-5.1 Codex Max API

步驟 1：註冊 API 金鑰

步驟 2：向 GPT-5.1-Codex-Max API 發送請求

步驟 3：擷取並驗證結果

GPT 5.1 Codex Max 的功能

GPT 5.1 Codex Max 的定價

GPT 5.1 Codex Max 的範例程式碼和 API

Python Code Example

JavaScript Code Example

Curl Code Example

更多模型