OpenAI DevDay 2025:全新 AI 运行层的开发者指南

CometAPI
AnnaOct 8, 2025
OpenAI DevDay 2025:全新 AI 运行层的开发者指南

OpenAI DevDay 2025 是一次高速度的开发者展示活动(于 2025 年 10 月上旬举行),OpenAI 发布了面向从模型提供商到平台运营商转型的一系列产品、工具包、SDK 与模型版本:在 ChatGPT 内运行的应用、拖拽式智能体构建器(AgentKit)、面向开发者工作流的 Codex 正式全面可用(GA),以及新的模型分级(包括 GPT-5 Pro 和用于视频的 Sora 2),明确面向生产级集成。现在让我们看看 OpenAI 在本次大会上介绍了什么,并分析它将为当前 AI 行业带来哪些突破。这也是一份开发者指南。

为什么 OpenAI DevDay 2025 很重要?

DevDay 2025 的重要性在于,它重新定义了在 AI 原生世界中应用将在哪些场景、以何种方式被构建与分发。OpenAI 不再将模型仅视为开发者通过 API 调用的后端能力,而是将体验层——ChatGPT——打包为交互式应用的宿主。这一转变有三点影响:

  1. 分发: 开发者可以直接在聊天体验中触达 ChatGPT 的海量用户,而不再仅依赖传统应用商店或网页渠道。
  2. 组合: 应用、智能体与模型成为可组合的积木。你可以将领域专家模型、能够串联任务步骤的智能体与对话式 UI 组合为一个统一的产品体验。
  3. 重写工程范式: 从“写代码实现函数”到“编排智能体 + 自动化评估”,工程过程变得更为颗粒化、可视化与标准化。

新的 Apps SDK 是什么,它能做什么?

什么是 Apps SDK?

Apps SDK 是 OpenAI 面向构建“在 ChatGPT 内运行的交互式应用”的开发者工具包。与链接到网页或返回静态数据不同,使用该 SDK 构建的应用可以从对话中被调用、在 ChatGPT 内渲染交互式 UI、接受后续请求,并且——关键在于——在整个聊天会话中保留上下文,让应用与语言模型能够无缝协作。

Feature:

  • 聊天内应用嵌入: 应用在 ChatGPT 内渲染,用户可在不离开对话的情况下完成多步任务(例如在 Canva 设计海报,然后将其制作成演示文档)。
  • 上下文连续性: 应用通过 Model Context Protocol / MCP 接收结构化上下文,使其表现为一等公民的聊天参与者,而非一次性集成。
  • 开发者模式与预览: 开发者可在 Developer Mode 中测试应用、快速迭代,并在准备好时提交审核。
  • 商业与变现管道(即将推出): OpenAI 释放出商业钩子的信号,应用可在聊天体验中售卖商品/服务,开发者最终可实现应用变现。
  • 数据与权限工具: SDK 定义了在第三方应用需要执行操作或读取数据时,请求用户连接账户并授予数据访问的模式,内建同意与令牌交换流程。

Apps SDK 的意义

通过让 ChatGPT 成为第三方应用的宿主环境,OpenAI 将该产品从对话式助手重构为一种“运行时”——面向对话交互的“操作系统”。对开发者而言,这降低了摩擦:无需搭建单独的 UI 与分发漏斗,只需编写轻量的应用逻辑,即可受益于 ChatGPT 的发现能力与对话式用户体验。对产品团队与企业而言,这改变了特性的架构方式:不用在网站中嵌入模型,而是在支持追问、澄清与多模态输出的对话织体中嵌入产品。

OpenAI 试图将“自然语言”转化为新的通用 UI 层。在这层中,应用被定义为“能力 + 上下文 + 交易能力”的集合,而非“一组页面”。这相当于将“浏览器 + 应用商店 + 结算 + SDK”统一到一次对话中。它并不意图取代原生应用,而是重构链条:将“首次接触”放在 ChatGPT 中,将“深度使用”保留给外部应用(全屏、重定向)。

什么是 AgentKit,它如何改变智能体开发?

什么是 AgentKit?

AgentKit 是 OpenAI 面向构建、部署与优化智能体应用的新工具包——能够代表用户自主规划、行动与交互的软件智能体。AgentKit 封装了任务分解、工具使用与智能体行为评估的开发者原语。OpenAI 将 AgentKit 定位为“智能体的基础设施”,让开发者可以组装更可靠、可审计、且更易迭代的智能体。

AgentKit 的主要功能有哪些?

  • 可视化智能体构建器: 使用画布连接逻辑节点、定义流程,并在无需手写每个协调细节的情况下编排多个智能体。
  • 工具与 API 连接器: 预构建的适配器将智能体连接到外部服务(API、数据库、Webhook),以实现真实世界的行动。
  • 评估与护栏: 集成的 Evals 与追踪可让团队对智能体轨迹打分、检测回归,并调优提示/链路行为。
  • 部署与可观测性: 内置部署原语与遥测,便于在生产环境中监控智能体性能与故障。

为什么 AgentKit 很重要?

智能体的实际摩擦点在于可靠性与安全性——如何让智能体在世界中行动而不产生意外副作用。AgentKit 尝试让这些问题成为工程优先事项:为工具访问、上下文管理与评估提供标准化模式可降低不可预测性并缩短开发周期。对于构建自动化工作流、客户助理或决策支持系统的组织而言,AgentKit 是将脆弱的智能体原型转化为生产级服务的脚手架。

什么是 Codex,此次 DevDay 有何变化?

什么是 Codex?

Codex 是 OpenAI 面向开发者工作流的专用编码助手产品:一套模型能力、CLI 工具与集成(编辑器插件、CI 钩子),旨在加速代码编写、评审与维护。在 DevDay 上,OpenAI 宣布 Codex 正式全面可用(GA),从预览/内部使用转向面向工程团队的生产支持层。

更新后 Codex 的主要功能有哪些?

  • 具备上下文意识的代码生成: Codex 可基于整个代码库上下文(不仅是短提示窗口)生成代码,并遵循风格与架构约束。
  • 实时编辑与开发者反馈回路: 开发者可以通过指令让 Codex 重构、增加测试或实现特性,并在开发沙箱中进行实时重载演示。
  • 与应用与智能体的集成: 智能体或应用可调用 Codex 编写胶水代码、响应运行时错误,或自动合成 API 客户端。
  • 专用模型: 运行于 GPT5-CODEX,擅长重构与代码评审,并可根据任务复杂度调整“思考时间”。
  • 长时任务: 能够连续执行超过十分钟或更长时间的任务。
  • 多端协作:统一 IDE、终端、GitHub 与云;新增 Slack 集成与 Codex SDK(连接到 CI/CD、运维与数据管道)。

为什么 Codex 的演进很重要?

这很重要,因为它解决了使用 LLM 进行软件开发的两个最大生产力缺口:在大型代码库中保持上下文准确性,以及将“建议”闭环到“已部署变更”。当模型能够针对整个仓库进行推理并就地应用编辑——且该模型与部署工具链集成——开发者便可从编写脚手架代码转向编排更高层次的产品决策。

Codex 正式 GA 的意义不止是让补全更强。演示中最引人注目的方面不是编写了多少代码,而是 Codex 如何自主地导航协议、阅读文档、搭建 MCP 服务器、修改前端、连接外设,并在云端持续推进这些“长期任务”。

OpenAI 宣布了哪些模型与 API 更新?

DevDay 宣布了哪些模型更新?

在 DevDay 上,OpenAI 强调了其模型阵列的刷新与扩展,兼顾更高保真与更具性价比的变体:

  • GPT-5 Pro——GPT-5 家族的高容量产品,针对深度推理、长上下文与生产工作负载优化(详见平台模型页面)。
  • Sora 2——旗舰视频+音频生成模型,生成短、逼真的视频,具备同步对白与改进的物理真实感。OpenAI 将 Sora 2 定位为其生成式视频的下一步。
  • 更小、更便宜的语音/实时模型——“mini” 变体(如 realtime / audio mini 模型),旨在实现低延迟、可负担的语音或实时交互。

GPT-5 Pro:是什么、能做什么、为何重要

是什么: GPT-5 Pro 是 GPT-5 家族的高保真配置,面向企业与关键任务负载。它提供更长的上下文窗口、改进的指令遵循能力,以及在复杂推理任务中更低的幻觉率。Pro 等级被定位为在可接受性能换取延迟与成本的前提下,面向高准确性任务的首选模型。

为何重要: 对依赖准确性与长上下文的应用(如法律分析、科学总结或多步骤决策),Pro 等级改变了用 LLM 构建的经济性:团队可依赖旨在端到端推理与更高可信度的模型,而不是将任务降级为狭窄的规则系统。API 上提供有定价的 Pro 等级也让企业的采购与架构决策更为清晰。

OpenAI DevDay 2025:全新 AI 运行层的开发者指南

Sora 2:是什么、能做什么

是什么: Sora 2 是 OpenAI 的第二代文生视频模型,可生成带有同步音效与对白的短、逼真片段,具备更好的物理合理性与创作者可控参数。OpenAI 同步推出面向消费者的 Sora 应用与开发者 API。

能做什么: Sora 2 可根据文本提示生成短视频、扩展现有短片段,并集成与口型和场景声学相匹配的音频。它面向创意生产、快速原型与围绕 AI 生成短片的新社交形态。

实时与 mini 模型:可负担的实时体验

OpenAI 也强调了更便宜、低延迟的模型变体(realtime / mini 家族),旨在以更低成本实现语音与交互体验。这让产品团队可以添加实时语音助手、低成本聊天机器人,以及嵌入式离线风格特性,而不会因每个 token 的成本过高而受限,拓宽了可行的用例范围。

GPT-image-1-mini API

gpt-image-1-mini 是 OpenAI 的一款“成本优化的、多模态图像模型”,可接受“文本与图像输入”,并生成“图像输出”。它被定位为 OpenAI 完整 GPT-Image-1 家族的更小、更便宜的兄弟模型——面向对成本与延迟有约束的高吞吐生产场景。该模型用于诸如“文生图”、“图像编辑/修复”以及纳入参考图像的工作流等任务。

如何以可承受的价格访问 Sora 2 与 GPT-5 Pro API?

CometAPI 是一个统一的 API 平台,将来自 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等领先提供商的 500+ AI 模型聚合到一个对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化将 AI 能力集成到你的应用中。无论你构建的是聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析管道,CometAPI 都能让你更快迭代、控制成本并保持供应商无关性,同时获取 AI 生态中的最新突破。

开发者可以通过 CometAPI 访问 gpt-5-codex API(gpt-5-codex)、GPT-5 Pro( gpt-5-pro-2025-10-06; gpt-5-pro) 与 Sora 2 API(sora-2-hd; sora-2),最新模型版本 始终与官网同步更新。开始之前,请在 Playground 中探索模型能力,并查阅 API guide 获取详细说明。在访问前,请确保已登录 CometAPI 并获得 API key。CometAPI 提供远低于官方价格的报价,帮助你完成集成。


这些更新如何融为一体——战略路径是什么?

综合来看,这些发布体现了三个有意的动作:

  1. ChatGPT 的平台化: ChatGPT 内的应用 + 应用目录 = 面向第三方开发者的新分发与商业层。将 ChatGPT 从产品提升为平台。
  2. 将智能体作为一等产品原语: AgentKit 让多步骤、工具使用型智能体更易构建、测试与监控,从而催化跨行业的实用自动化。
  3. 从演示走向生产模型: Codex GA 与 Pro 模型分级(GPT-5 Pro、Sora 2)体现了面向企业需求的推进——可靠性、规模、安全工具与多样的价格/性能权衡。

这并非偶然:OpenAI 正在构建一个开发者飞轮——模型为应用与智能体提供能力,应用提供分发与变现,智能体则交付可编程行为,依赖模型与应用集成。

结论——DevDay 2025 是新平台时代的开端吗?

OpenAI DevDay 2025 的核心不在于孤立的功能,而在于将这些功能编织为一致的平台战略:在对话式 OS 中交付的应用、具备清晰生产路径的自主智能体、为真实开发者工作流进化的 Codex,以及拓展媒体能力的模型更新。对建设者而言,结论是务实的:新原语降低集成成本、加速上市,同时也提高了治理与运营纪律的要求。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣