2025 年 9 月 15 日。OpenAI 发布了 GPT-5-Codex,这是 GPT-5 的一种专用变体,针对其 Codex 产品内的代理式软件工程进行了优化。该公司称,该模型能够在大型、复杂的工程任务上连续超过七小时自主运行,反复迭代实现、修复失败测试,并在减少人工干预的情况下交付完成的工作。
GPT-5-Codex 有何不同
GPT-5-Codex 不只是更快的自动补全。OpenAI 将其描述为针对“代理式编码”进行优化:该模型能够在 Codex 的虚拟开发环境中规划、执行、测试并完善多步骤的软件任务。这包括运行测试、诊断失败、重构,以及产出符合典型人工审查模式的 PR 风格更改。该公司表示,模型通过在真实世界编码任务上的强化学习进行训练,更好地贴合开发者工作流与 PR 偏好。
其中一个核心技术创新是动态“思考”时间:模型不再是固定的短推理过程,而是根据任务复杂度扩展其内部推理预算——从几秒钟的小改动到数小时的系统级任务。OpenAI 认为,这使得 Codex 在处理长周期、不稳定或集成型的工程问题时成为更强的协作者。
关键技术主张
- 多小时自治:OpenAI 与多家媒体报道,GPT-5-Codex 可在任务上投入动态的“思考时间”——从数秒到最长达七小时——从而在无需过多引导的情况下推进长链路流程(如大型重构、多文件特性开发、长时间调试)。
- **代理式行为:**模型经过调优可运行测试、在失败后迭代、提出并应用修复,并准备功能分支与 PR 等产物——旨在减少重复性的工程工作。
安全与验证:模型默认在沙盒环境中运行,并禁用网络访问以降低潜在风险。用户可配置安全策略,例如限制访问特定域或批准模型执行某些命令。每个任务都会附带日志、参考与测试结果,便于开发者验证。
在 Codex 与开发者工作流中的定位
OpenAI 将 GPT-5-Codex 定位为跨环境驱动 Codex 的引擎——终端、IDE 扩展(VS Code、Cursor 等)、网页界面、GitHub 集成以及移动端——以便开发者在本地与云端沙盒之间无缝迁移工作并保持状态。更新后的 Codex 体验强调并行任务处理、自动化代码审查与更紧密的 IDE 集成,使模型既能交互式辅助,也能在受控沙盒内承担更长时间的后台工程任务。
OpenAI 的产品页面显示,Codex 与基于 GPT-5 的功能正面向 ChatGPT Plus/Pro/Business/Edu/Enterprise 阶梯逐步推出,更广泛的可用性与 API 支持将随后提供。目前将当前发布称为面向 API 客户的“半发布”:今天可在 Codex 产品内使用,直接 API 访问即将开放;通过 ChatGPT 订阅与受支持 IDE 集成使用 Codex 的客户已可使用。
这对开发者与团队意味着什么
**生产力提升:**如果这些能力在真实代码库中也能兑现,团队或将看到更快的特性交付、更少的琐碎 PR 循环,以及自动化的测试-修复闭环。
**仍需人类在环:**尽管自治时间延长,但在将代理提出的更改合入生产之前,仍需要人类审查、安全审计与策略检查。
**运行方式变革:**采用多小时的代理式助手,可能会推动团队进一步规范沙盒化、CI 门禁、代码所有权规则,以及对 AI 驱动更改的可观测性。
结语
GPT-5-Codex 明确迈向让 AI 代理更像独立工程合作者、而非简单自动补全工具的一步。OpenAI 的公开演示与技术说明声称其具备稳健、可持续数小时的自治与更深入的工程能力,但其在生产环境中的实际可靠性仍有待在未来数月中,由团队在真实工作流中集成并由第三方评测发布独立评估后再行检验。
入门指南
CometAPI 是一个统一的 API 平台,将来自 OpenAI 的 GPT 系列、Google Gemini、Anthropic Claude、Midjourney、Suno 等在内的 500 多个领先提供商的 AI 模型聚合到一个面向开发者的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具还是数据驱动的分析应用,CometAPI 都能帮助你更快迭代、控制成本并保持供应商无关,同时触达整个 AI 生态的最新突破。
开发者可通过 CometAPI 访问 GPT-5 、GPT-5 Nano 与 GPT-5 Mini,文中列出的 cometAPI 最新模型以文章发表日期为准。访问前,请确保已登录 CometAPI 并获取 API 密钥。
