OpenAI 的 Responses API 获得重大升级，而非 Assistants API

OpenAI 已推出对其 Responses API 的重大升级，引入了一系列强大工具与企业级特性，改变开发者构建代理式应用的方式。该版本于 2025 年 5 月 21 日发布，基于 2025 年 3 月推出的首版 Responses API（取代 Assistants API），并已在 GPT-4o 与 o 系列推理引擎等模型上处理了数万亿个 tokens。

与传统 ChatGPT（Chat Completions）API 的不同之处

以代理为先的原语 vs. 纯文本补全： 不同于基于提示返回纯文本的 Chat Completions API，Responses API 被设计为构建“agentic”体验的核心原语——允许模型在其思维链中直接调用外部工具，以规划并执行多步骤任务。
内置工具编排： 虽然 Chat Completions 提供函数调用能力，Responses 将工具调用（如图像生成或代码执行）统一为一次精简的 API 调用，减少样板代码并提升开发者效率。
保留推理状态： 像 o3 和 o4-mini 这样的模型可在多次调用与工具调用之间保持推理 tokens，相较于无状态补全，带来更丰富的上下文理解与更低的延迟。
企业级可靠性： 背景模式用于异步任务、用于审计的推理摘要、为 Zero Data Retention 客户提供的加密推理项等特性，较标准 Chat Completions 端点提供更强的 SLA 与隐私控制。

新增能力

远程 MCP 服务器支持： 连接任意 Model Context Protocol 服务器——Shopify、Stripe、Twilio 等——通过只需几行代码即可以第三方数据源扩展模型上下文。
原生图像生成： 在 Responses 中将 gpt-image-1 作为工具使用，无需单独的 API 调用，即可进行流式预览与多轮编辑。
集成代码解释器： 在代理式流程中直接执行数据分析、复杂计算与图像操作，提升行业基准测试表现。
增强的文件搜索： 跨多个向量存储进行查询，并使用属性过滤器将相关文档片段拉入上下文，简化知识库集成。
企业级特性： 背景模式管理长时推理任务、用于调试的自动推理摘要、用于合规部署的加密推理项。

定价与可用性

所有新工具与特性即日起在 Responses API 中适用于 GPT-4o、GPT-4.1 与 o 系列模型（o1、o3、o3-mini、o4-mini）；图像生成仅在 o3 上受支持。定价与现有工具费率保持一致：

图像生成： $5.00 每 1 M 文本输入 tokens，$10.00 每 1 M 图像输入 tokens，$40.00 每 1 M 图像输出 tokens（缓存的输入享受 75% 折扣）
代码解释器： $0.03 每次容器执行
文件搜索： $0.10 每 GB 向量存储每天（首个 GB 免费）；$2.50 每 1 K 次工具调用
远程 MCP 服务器： 无额外费用——按标准输出 token 计费。

不收取单独的 Responses API 费用——tokens 按所选模型的输入/输出费率计费（例如，GPT-4.1 按其公布的每 token 费率计费）。

开发者与企业即日起可通过 client.responses.create 端点集成这些能力。借助这些增强功能，OpenAI 旨在赋能各行业更智能、可靠且安全的 AI 驱动应用。Responses API 现已向所有开发者开放，旧版 Assistants API 将于 2026 年年中完全弃用。现有 Assistants 集成可通过最少代码变更迁移，得益于兼容的请求与响应模式。

入门

CometAPI 提供统一的 REST 接口，将数百个 AI 模型（包括 ChatGPT 家族）聚合到一致的端点之下，并内置 API 密钥管理、用量配额与账单仪表板。无需同时管理多个供应商 URL 和凭证。

开发者可通过 CometAPI 访问最新 ChatGPT API GPT-4.1 API。开始之前，请在 Playground 中探索模型能力，并参考 API 指南获取详细说明。访问前，请确保已登录 CometAPI 并获得 API 密钥。

与传统 ChatGPT（Chat Completions）API 的不同之处

新增能力

定价与可用性

入门

以低成本获取顶级模型

阅读更多

OpenAI 的 Responses API 获得重大升级，而非 Assistants API

与传统 ChatGPT（Chat Completions）API 的不同之处

新增能力

定价与可用性

入门

以低成本 获取顶级模型

阅读更多

以低成本获取顶级模型