什么是 GPT-5-Codex?
GPT-5-Codex 是 OpenAI GPT-5 系列中的一个专门变体,面向复杂软件工程工作流而设计:包括编码、大规模重构、长链路多步骤代理任务,以及在 Codex 环境(CLI、IDE 扩展和云端)中的扩展式自主运行。它被定位为 OpenAI Codex 产品的默认模型,并可通过 Responses API 和 Codex 订阅访问。
关键特性
- 代理式优化 —— 针对在代理循环和工具驱动工作流中运行进行了调优(在使用工具/CLI 时具有更好的一致性)。代理能力和工具使用是一等能力。
- 代码质量导向 —— 生成更干净、更可控的代码,适用于重构、审查和长时间运行的开发任务。
- IDE 与产品集成 —— 已集成到开发者产品中(例如 GitHub Copilot 的预览版推送)以及 OpenAI 的 Codex SDK/CLI 中。
- 仅支持 Responses API —— 使用更新的 Responses API 模式(令牌复用、代理循环支持)可获得最佳效果;传统 Completion 调用在 Codex 任务上可能表现不佳。
技术细节 —— 训练与架构
- 基础谱系:GPT-5-Codex 是 GPT-5 的衍生版本,通过对 GPT-5 快照进一步调优以适配编码任务和代理行为而构建。模型内部细节(确切参数量、训练算力)未公开列举;OpenAI 发布的是能力与调优方法,而非原始参数规模。
- 训练重点:强调 真实世界的软件工程语料、交互式代理轨迹、工具使用轨迹,以及指令调优,以提升 可控性 和 长程正确性。
- 工具与代理循环调优:对提示词和工具定义进行了调整,使 Codex 代理循环运行得更快,并且在与相似配置下的原生 GPT-5 相比时,能够产出更准确的多步骤结果。
基准性能
来自独立评测者和聚合网站的公开基准测试显示,GPT-5-Codex 在现代编码基准上处于领先或接近领先的位置:
- SWE-Bench(真实世界编码任务): 独立摘要报告称,在一个包含 500 个任务的套件上成功率约为 ~≈77%(由第三方评测报告)。该评测指出,这一成绩略高于通用型 GPT-5(high)基线。
- LiveCodeBench / 其他代码基准: 聚合网站报告了较高的相对表现(例如某些任务上的 LiveCodeBench 分数达到 80 分中段)。
模型版本与可用性
可用渠道: Responses API(模型 id 为 gpt-5-codex)
gpt-5-codex-low/medium/high – 面向编码与软件工程的专用版本:
- gpt-5-codex-low
- gpt-5-codex-medium
- gpt-5-codex-high
支持 /v1/responses 格式调用
局限性
- 延迟与算力: 代理式工作流可能消耗较多算力,有时也会比轻量模型更慢,尤其是在模型运行测试套件或执行大量静态分析时。
- 幻觉与过度自信: 尽管已有改进,GPT-5-Codex 仍可能幻觉出 API、文件路径或测试覆盖情况——用户必须验证生成的代码和 CI 输出。
- 上下文长度与状态: 虽然该模型针对更长会话进行了调优,但仍受实际上下文/注意力限制约束;超大型代码库需要分块、检索增强或工具辅助记忆。
- 安全与合规: 自动化代码修改可能引入安全回归或许可证违规;必须进行人工监督并设置安全的 CI 门禁。
使用场景
- 自动化代码审查 —— 生成审查意见、识别回归问题并建议修复方案。
- 功能开发与重构 —— 进行大规模多文件编辑,并由模型运行测试和执行 CI 验证。
- 测试生成与 TDD 自动化 —— 生成单元/集成测试并持续迭代直至通过。
- 开发者助手与代理 —— 集成到 IDE 插件、CI 流水线或自主代理中,以执行复杂工程任务。
如何使用 GPT-5 Codex API
必要步骤
- 登录 cometapi.com。如果你还不是我们的用户,请先注册。
- 登录你的 CometAPI 控制台。
- 获取接口访问凭证 API key。在个人中心的 API token 处点击 “Add Token”,获取 token key:sk-xxxxx 并提交。
使用方法
- 选择 “
gpt-5-codex” 端点发送 API 请求,并设置请求体。请求方法和请求体可从我们网站的 API 文档中获取。我们的网站还提供 Apifox 测试,方便你使用。 - 将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。
- 将你的问题或请求插入到 content 字段中——这是模型将要响应的内容。
- 处理 API 响应以获取生成的答案。
CometAPI 提供了完全兼容的 REST API——可实现无缝迁移。详情请参见 Responses