什么是 GPT-5.1-Codex?
gpt-5.1-codex 是 OpenAI GPT-5.1 系列中的一个专用成员,针对具备代理能力、可长时间运行的软件工程工作流进行了优化(代码生成、补丁修改、大规模重构、结构化代码审查以及多步骤代理任务)。
功能
- 代理工具优先 —— 专为输出结构化补丁操作和 shell 调用而构建(模型可以生成
apply_patch_call和shell_call项,由你的集成来执行并返回输出结果)。这使得跨文件的创建/更新/删除操作更加可靠。 - 仅支持 Responses API —— 5.1 系列中的 Codex 变体仅可通过 Responses API 使用,并针对工具驱动的工作流进行了调优,而不是面向对话式聊天流程。
- 自适应推理与延迟模式 —— GPT-5.1 系列引入了
reasoning_effort(包括适用于延迟敏感交互的none模式)以及扩展提示缓存(最长可达 24 小时),以提升交互式编码会话体验。Codex 模型强调高效的迭代式工作。 - 可控性与代码风格特征 —— 经过调优,在长会话中更加“审慎”,以减少无效操作,并为 PR 和补丁差异生成更清晰的更新说明。
- Codex 专属体验: IDE/CLI 默认模型设置、会话恢复、上下文压缩,以及 Codex Web 中面向前端任务的图像/截图输入支持。
技术细节与运行注意事项
- API 接口面:
gpt-5.1-codex通过 Responses API 提供服务(不是 Chat Completions)。Responses API 支持工具调用、结构化输出、流式传输,以及 Codex 所使用的apply_patch和shell工具。 - 工具调用语义: 在请求中包含工具(
tools:)。模型可能会生成apply_patch_call或shell_call项;你的代码执行相应补丁/命令后,再将输出结果在后续请求中返回给模型。Responses API 默认具备代理能力,因此可以编排多步骤计划。 - 推理调节: 对于最少思考/低延迟场景,可使用
reasoning={"effort":"none"}(Responses API);对于更全面的代码推理与验证,可使用{"effort":"medium"}或high。注意,none有助于提升并行工具调用能力,并改善延迟敏感型代码编辑体验。 - 会话持久化 / 上下文: Codex 和 Responses API 支持会话恢复与上下文压缩,可在接近上下文上限时总结较早的上下文,从而支持更长时间的交互式会话,而无需手动裁剪上下文。
主要使用场景(推荐)
- 交互式 IDE 工作流: 智能代码补全、PR 草稿生成、内联补丁修改和多轮代码编辑。
- 代理式自动化: 需要按顺序应用多个补丁、执行 shell 步骤并通过测试进行验证的长时间运行代理任务。
- 代码审查与重构: 更高质量的差异输出和结构化审查评论(合作伙伴报告称在 SWE-bench 上有所提升)。
- 测试生成与验证: 生成单元/集成测试,通过受控 shell 工具运行测试,并根据失败结果进行迭代。
如何使用 GPT-5.1 Codex API
必需步骤
- 登录 cometapi.com。如果你还不是我们的用户,请先注册。
- 登录你的 CometAPI 控制台。
- 获取接口访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。
使用方法
- 选择“
gpt-5.1-codex”端点发送 API 请求,并设置请求体。请求方法和请求体可从我们网站的 API 文档中获取。我们的网站还提供 Apifox 测试,方便你使用。 - 将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。
- 将你的问题或请求插入到 content 字段中——模型将对此作出响应。
- 处理 API 响应以获取生成的答案。
CometAPI 提供了完全兼容的 REST API——实现无缝迁移。有关关键细节,请参阅 Responses