15 年 2025 月 XNUMX 日。 OpenAI 揭幕 GPT-5-Codex這是 GPT-5 的一個專門變體,並針對其 Codex 產品中的代理軟體工程進行了最佳化。該公司表示,該模型可以自主運行大型、複雜的工程任務, 連續七個多小時、迭代實施、修復失敗的測試並在減少人工幹預的情況下交付完成的工作。
GPT-5-Codex 有何不同
GPT-5-Codex 不僅僅是一個更快的自動完成功能。 OpenAI 將其描述為 針對「代理編碼」進行了最佳化:此模型可以在 Codex 的虛擬開發環境中規劃、執行、測試和最佳化多步驟軟體任務。這包括運行測試、診斷故障、重構以及產生與典型人工審核模式一致的拉取請求式變更。該公司表示,他們使用強化學習在現實世界的編碼任務上訓練該模型,以更好地反映開發人員的工作流程和 PR 偏好。
一項核心技術創新是 動態“思考”時間:此模型並非採用固定的短推理流程,而是根據任務的複雜性調整其內部推理預算-從小規模編輯的幾秒鐘到大型系統級任務的幾個小時。 OpenAI 認為,這使得 Codex 在長期、複雜或綜合性工程問題上成為更強大的合作夥伴。
關鍵技術主張
- 多小時自主權: OpenAI 和多家媒體報導,GPT-5-Codex 可以在一項任務上花費動態的「思考時間」——從幾秒到 長達七小時 — 允許它無需手動操作即可完成較長的工作流程(例如,大型重構、多檔案功能建置和擴展偵錯)。
- 代理行為: 該模型經過調整,可以運行測試、迭代故障、提出和應用修復以及準備功能分支和 PR 等工件——這些行為旨在減少重複的工程工作。
安全性與驗證:預設情況下,模型在沙盒環境中運行,禁用網路存取以降低潛在風險。使用者可以配置安全性策略,例如限制對特定網域的存取或核准模型執行某些命令。每個任務都附帶日誌、參考資料和測試結果,方便開發人員進行驗證。
它如何融入 Codex 和開發人員的工作流程
OpenAI 將 GPT-5-Codex 定位為 Codex 跨環境(終端機、IDE 擴充功能(VS Code、Cursor 等)、Web 介面、GitHub 整合和行動裝置)的引擎,以便開發人員能夠在本地和雲端沙箱之間無縫遷移工作,同時保留狀態。更新後的 Codex 體驗強調並行任務、自動程式碼審查和更緊密的 IDE 集成,因此該模型既可以進行交互協助,也可以在受控沙箱內執行更長時間的後台工程任務。
OpenAI 的產品頁面顯示,Codex 和 GPT-5 支援的功能正在向 ChatGPT Plus/Pro/Business/Edu/Enterprise 層級推出,並將提供更廣泛的可用性和 API 支援。 OpenAI 將當前版本描述為面向 API 客戶的「半發布版本」:目前已在 Codex 產品中提供,並承諾很快提供直接 API 訪問,並且 Codex 客戶可以透過 ChatGPT 訂閱和支援的 IDE 整合來使用。
這對開發人員和團隊意味著什麼
生產力提升: 如果模型的聲明在真實的儲存庫中成立,團隊可能會看到更快的功能交付、更少的瑣碎 PR 週期和自動化的測試修復循環。
人類參與仍然至關重要: 儘管擴大了自主權,但在接受代理提出的變更投入生產之前仍然需要進行人工審查、安全審計和政策檢查。
營運變化: 採用多小時代理助理可能會推動團隊正式化沙盒、CI 門、代碼所有權規則以及 AI 驅動變化的可觀察性。
結論
GPT-5-Codex 代表 AI 代理程式邁出了重要的一步,這些代理程式可以更像獨立的工程協作者,而不是簡單的自動完成工具。 OpenAI 的公開演示和技術說明聲稱其擁有強大的、長達數小時的自主能力和更深入的工程能力,但該模型在生產環境中的實際可靠性將在未來幾個月內得到評判,因為各團隊會將該代理集成到實際工作流程中,並且第三方評估人員會發布獨立評估。
入門
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以訪問 GPT-5 ,GPT-5奈米 GPT-5 迷你 透過 CometAPI 訪問,其中列出的 CometAPI 模型截至本文發布之日。造訪前,請確保您已登入 CometAPI 並取得 API 金鑰。
