什麼是 GPT-5-Codex?
GPT-5-Codex 是 OpenAI GPT-5 系列中的專門變體,專為複雜的軟體工程工作流程而設計:編碼、大規模重構、長時間多步驟代理式任務,以及在 Codex 環境(CLI、IDE 擴充功能與雲端)中的延長自主執行。它被定位為 OpenAI Codex 產品的預設模型,並可透過 Responses API 與 Codex 訂閱方案存取。
主要功能
- 代理式最佳化 — 針對在代理迴圈與工具驅動工作流程中執行進行調校(在使用工具/CLI 時具有更佳的一致性)。代理式能力與工具使用是第一級能力。
- 程式碼品質導向 — 產生更乾淨、更可控的程式碼,適合用於重構、審查與長時間執行的開發任務。
- IDE 與產品整合 — 已整合至開發者產品中(例如 GitHub Copilot 的預覽推出)以及 OpenAI 的 Codex SDK/CLI。
- 僅支援 Responses API — 採用較新的 Responses API 模式(權杖重用、代理迴圈支援)可獲得最佳效果;舊版 Completion 呼叫在 Codex 任務上的表現可能較差。
技術細節 — 訓練與架構
- 基礎譜系:GPT-5-Codex 是 GPT-5 的衍生版本,透過對 GPT-5 快照進一步針對編碼任務與代理行為進行調校而建構。模型內部細節(確切參數量、訓練算力)未公開列出;OpenAI 公布的是能力與調校方法,而非原始參數數量。
- 訓練重點:著重於真實世界的軟體工程語料、互動式代理軌跡、工具使用軌跡,以及指令微調,以提升可控性與長時程正確性。
- 工具與代理迴圈調校:提示與工具定義經過調整,使 Codex 代理迴圈在可比設定下,相較於原始 GPT-5 執行得更快,並產生更準確的多步驟結果。
基準測試表現
來自獨立評測者與彙整網站的公開基準測試顯示,GPT-5-Codex 在現代程式設計基準上領先或接近領先:
- SWE-Bench(真實世界編碼任務): 獨立摘要報告指出,在 500 項任務套件上成功率約為 ~≈77%(數據來自第三方評測)。該評測指出,這一表現略高於通用型 GPT-5(high)基準。
- LiveCodeBench / 其他程式碼基準: 彙整網站報告其相對表現很高(例如在某些任務上的 LiveCodeBench 分數達到 80 分中段)。
模型版本與可用性
可用管道: Responses API(模型 id gpt-5-codex)
gpt-5-codex-low/medium/high – 專為編碼與軟體工程而設計:
- gpt-5-codex-low
- gpt-5-codex-medium
- gpt-5-codex-high
支援 /v1/responses 格式呼叫
限制
- 延遲與算力: 代理式工作流程可能需要大量算力,有時也會比輕量模型更慢,特別是在模型執行測試套件或進行大量靜態分析時。
- 幻覺與過度自信: 儘管已有改進,GPT-5-Codex 仍可能虛構 API、檔案路徑或測試覆蓋率——使用者必須驗證產生的程式碼與 CI 輸出。
- 上下文長度與狀態: 雖然模型已針對較長工作階段進行調校,但仍受實際上下文/注意力限制所約束;對於極大型程式碼庫,仍需要切塊、檢索增強或工具輔助記憶。
- 安全與資安: 自動化程式碼變更可能引入安全性退化或授權違規;必須進行人工監督並採用安全的 CI 關卡機制。
使用情境
- 自動化程式碼審查 — 產出審查意見、識別回歸問題並提出修正建議。
- 功能開發與重構 — 由模型執行測試並進行 CI 驗證的大型多檔案編輯。
- 測試合成與 TDD 自動化 — 生成單元/整合測試並反覆迭代直到通過。
- 開發者助理與代理 — 整合至 IDE 外掛、CI 流水線或自主代理中,以執行複雜的工程任務。
如何使用 GPT-5 Codex API
必要步驟
- 登入 cometapi.com。如果您還不是我們的使用者,請先註冊。
- 登入您的 CometAPI console。
- 取得介面的存取憑證 API key。請在個人中心的 API token 中點選「Add Token」,取得 token key:sk-xxxxx 並提交。
使用方法
- 選擇
gpt-5-codex端點來送出 API 請求,並設定請求主體。請求方法與請求主體可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試,方便您使用。 - 將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。
- 將您的問題或請求插入 content 欄位中——這就是模型將回應的內容。
- . 處理 API 回應以取得生成的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節請參閱 Responses