GPT-5.1-Codex API

CometAPI
AnnaNov 14, 2025
GPT-5.1-Codex API

gpt-5.1-codex 是 OpenAI 的 GPT-5.1 系列中的一个专用成员,针对智能体驱动、长时运行的软件工程工作流(代码生成、打补丁、大规模重构、结构化代码评审与多步骤智能体任务)进行了优化。

功能特性

  • 智能体工具优先 — 旨在输出结构化补丁操作与 Shell 调用(模型可生成 apply_patch_callshell_call 项,您的集成负责执行并将输出返回)。这使得跨文件的创建/更新/删除操作更加可靠。
  • 仅限 Responses API — 5.1 系列中的 Codex 变体仅通过 Responses API 提供,面向工具驱动的工作流,而非对话式聊天流程。
  • 自适应推理与时延模式 — GPT-5.1 系列引入 reasoning_effort(包括适用于时延敏感交互的 none 模式)与扩展提示缓存(最长 24 小时),以提升交互式编码会话。Codex 模型强调高效的迭代工作。
  • 可控性与代码风格 — 调优为更“审慎”,在长会话中减少无效动作,并为 PR 与补丁差异生成更清晰的更新信息。
  • Codex 专属体验: 在 Codex Web 中提供 IDE/CLI 默认模型设置、会话恢复、上下文压缩,以及用于前端任务的图像/截图输入。

技术细节与运营注意事项

  • API 接口: gpt-5.1-codex 通过 Responses API 提供(非 Chat Completions)。Responses API 支持工具调用、结构化输出、流式响应,以及 Codex 依赖的 apply_patchshell 工具。
  • 工具调用语义: 在请求中包含工具(tools:)。模型可能发出 apply_patch_callshell_call 项;您的代码执行补丁/命令,并在后续请求中将结果返回给模型。Responses API 默认具备智能体编排能力,可协调多步骤计划。
  • 推理调优: 使用 reasoning={"effort":"none"}(Responses API)以获得最低思考/低时延,或使用 {"effort":"medium"}/high 进行更深入的代码推理与验证。注意,none 有助于并行工具调用与时延敏感的代码编辑。
  • 会话持久化/上下文: Codex 与 Responses API 支持会话恢复与上下文压缩,在接近上下文上限时对较早的上下文进行总结,从而在无需手动裁剪的情况下实现长时间交互。

基准表现

编码准确率: 在差异编辑基准(SWE-bench Verified)上,早期合作方报告 GPT-5.1 相较 GPT-5 的补丁/编辑准确率提升约 7%。在智能体执行运行时方面也有改进(示例:“在某些工具密集型任务中,智能体在 GPT-5.1 上运行速度提升 50%,且准确率超过 GPT-5”)。

SWE-bench Verified(500 道题): GPT-5.1(high)— 76.3% vs GPT-5(high)— 72.8%(OpenAI 报告)。显示在真实仓库补丁生成任务上有可测量的提升。

速度/Token 效率: GPT-5.1 在许多任务上运行速度比 GPT-5 快 2–3×(通过更少的推理 Token,在更易的任务上响应更快)。例如:一个小型 npm 命令答案在 GPT-5 上用时约 10 秒,在 GPT-5.1 上约 2 秒且使用的 Token 大幅减少。

局限、安全与运营注意

  • 幻觉与事实错误: OpenAI 持续降低幻觉,但明确提醒幻觉并未消除——模型仍可能虚构事实或对边缘案例的编程假设给出错误行为;关键系统不应依赖未受约束的模型输出,需独立验证。
  • 过快回复/浅层推理: 更快的默认行为有时会产生“快但浅”的回应(给出快速代码片段,而非深入、基于仓库的编辑)——在需要更深入编辑与验证时使用 reasoning: high
  • 提示工程纪律要求: Codex 变体期望工具上下文与结构化提示;现有 GPT-5 提示通常需要适配。模型的可靠性高度依赖您的集成如何应用补丁并验证输出(测试、CI)。

与其他热门模型的简要比较

  • vs GPT-5(基准): GPT-5.1 更强调在常规任务上的更快响应与更好的可控性,用于编辑/编码基准(SWE-bench 差异编辑在合作方报告中 +7%)并在工具密集链路中降低 Token 使用量。若需深度、审慎的推理,请选择 Thinking/high 推理设置。()
  • vs GPT-5-Codex(上一代): gpt-5.1-codex 是下一代产品——延续 Codex 方向,但针对提示缓存、apply_patch 工具与兼顾时延和深度的自适应推理进行了训练/调优。

主要推荐用例

  • 交互式 IDE 工作流: 智能代码补全、PR 草拟、内联打补丁与多轮代码编辑。
  • 智能体自动化: 需要应用一系列补丁、运行 Shell 步骤并通过测试进行验证的长时运行智能体任务。
  • 代码评审与重构: 更高质量的差异与结构化评审意见(合作方在 SWE-bench 上的改进报告)。
  • 测试生成与验证: 生成单元/集成测试,通过受控的 Shell 工具运行,并基于失败结果迭代。

如何通过 CometAPI 调用 gpt-5.1-codex API

CometAPI 中的 gpt-5.1-codex API 定价,较官方价格优惠 20%:

输入令牌$1.00
输出令牌$8.00

必要步骤

  • 登录 cometapi.com。如果您尚未成为我们的用户,请先注册。
  • 登录您的 CometAPI 控制台
  • 获取接口的访问凭证 API Key。在个人中心的 API Token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。

GPT-5.1-Codex API

使用方法

  1. 选择 “gpt-5.1-codex” 端点发送 API 请求并设置请求体。请求方法与请求体可在我们网站的 API 文档中获取。我们的网站也提供 Apifox 测试,方便您的使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
  3. 将您的问题或请求插入 content 字段——模型将对其做出回应。
  4. . 处理 API 响应以获取生成的答案。

CometAPI 提供完全兼容的 REST API——实现无缝迁移。关于 Responses 的关键细节

另请参阅 GPT-5.1 APIGPT-5.1-Chat-latest API**

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣