OpenAI DevDay 2025 是一場高速發展的開發者展示會(於 2025 年 5 月初舉行),OpenAI 發布了一系列產品、工具包、SDK 和模型版本,旨在將公司從模型提供商轉變為平台運營商:在 ChatGPT 內部運行的應用程序、拖放式代理構建器 (AgentKit)、面向開發者和用於視訊的 Sora 2),旨在實現生產級整合。現在,讓我們回顧一下 OpenAI 在本次大會上推出的內容,並分析它將為當前的 AI 產業帶來哪些突破。這同時也是一份開發者指南。
OpenAI DevDay 2025 為何重要?
DevDay 2025 意義重大,因為它重新定義了在 AI 原生世界中應用程式的建置和分發地點和方式。 OpenAI 不再將模型視為開發者透過 API 呼叫的後端功能,而是將一個體驗層(ChatGPT)打包為互動式應用程式的宿主。這種轉變有三方面的影響:
- 分佈: 開發人員可以直接在聊天體驗中接觸 ChatGPT 的大量受眾,而不僅僅依賴傳統的應用程式商店或網路管道。
- 組成: 應用程式、代理程式和模型成為可組合的構建塊。您可以將領域專家模型、連結任務步驟的代理程式和對話式 UI 組合成單一的產品體驗。
- 重寫工程範式: 從“編寫程式碼建立函數”到“編排智慧代理+自動化評估”,工程流程已經變得顆粒化、視覺化和標準化。
什麼是新的 Apps SDK?它能實現什麼功能?
什麼是 Apps SDK?
Apps SDK 是 OpenAI 的開發者工具包,用於構建 ChatGPT 內部的互動式應用程式使用 SDK 建立的應用程式無需連結到網頁或返回靜態數據,而是可以從對話中調用,在 ChatGPT 內部呈現互動式 UI,接受後續請求,並且至關重要的是,在整個聊天會話中保留上下文,以便應用程式和語言模型可以無縫協作。
特徵:
- 聊天應用程式嵌入: 應用程式在 ChatGPT 內部呈現,使用戶無需離開對話即可執行多步驟任務(例如,在 Canva 中設計海報,然後將其轉換為簡報)。
- 語境連續性: 應用程式接收結構化上下文(透過模型上下文協定/MCP),因此它們的行為就像一流的聊天參與者,而不是一次性的整合。
- 開發者模式與預覽: 開發人員可以在開發人員模式下測試應用程序,快速迭代,並在準備好時提交審核。
- 商業和貨幣化管道(即將推出): OpenAI 發出了商業鉤子訊號,以便應用程式可以在聊天體驗中銷售商品/服務,開發人員最終可以透過他們的應用程式獲利。
- 數據和權限工具: SDK 定義了當第三方應用程式需要採取行動或讀取資料時要求使用者連接帳戶並授予資料存取權限的模式,並具有用於同意和令牌交換的內建流程。
Apps SDK 為何如此重要
透過將 ChatGPT 打造為第三方應用程式的宿主環境,OpenAI 正在將該產品從對話助理重新定義為 運行 ——一個用於對話互動的「作業系統」。對於開發者來說,這減少了摩擦:他們無需建立單獨的 UI 和分發管道,而是可以編寫輕量級的應用邏輯,並受益於 ChatGPT 的發現和對話式使用者體驗。對於產品團隊和企業來說,它改變了功能的架構方式:無需將模型嵌入網站,而是可以將產品嵌入到支援後續操作、澄清和多模式輸出的對話式結構中。
OpenAI 正嘗試將「自然語言」轉換為新的通用 UI 層。在這一層中,應用程式不再被定義為“一組頁面”,而是“一組功能 + 上下文 + 事務功能”。這相當於將「瀏覽器 + 應用程式商店 + 支付 + SDK」統一為一個對話。 OpenAI 並非旨在取代原生應用,而是重構整個鏈條:將「首次接觸」置於 ChatGPT 中,並將「深度使用」保留給外部應用(例如全螢幕、重定向)。
什麼是 AgentKit 以及它如何改變代理開發?
什麼是 AgentKit?
AgentKit 是 OpenAI 推出的全新工具包,用於建置、部署和優化代理應用程式——能夠代表用戶自主規劃、行動和互動的軟體代理程式。 AgentKit 封裝了用於任務分解、工具使用和代理行為評估的開發者原語。 OpenAI 將 AgentKit 定位為“代理的基礎設施”,使開發者能夠組裝可靠、可審計且易於迭代的代理。
AgentKit的主要功能有哪些?
- 可視化代理生成器: 一個畫布,用於連接邏輯節點、定義流程和協調多個代理,而無需手動編碼每個協調細節。
- 工具和 API 連接器: 預先建置的適配器將代理程式連結到外部服務(API、資料庫、webhook),從而實現現實世界的操作。
- 評估和護欄: 整合的評估和追蹤讓團隊可以對代理追蹤進行評級、檢測回歸並調整提示/鏈行為。
- 部署和可觀察性: 內建部署原語和遙測,用於監控代理性能和生產中的故障。
AgentKit 為何如此重要?
代理的實際問題在於可靠性和安全性——如何讓代理人在現實世界中行動而不產生意外的副作用。 AgentKit 致力於將這些問題置於工程優先的原則下:提供標準化的工具存取、情境管理和評估模式,從而減少不可預測性並縮短開發週期。對於建立自動化工作流程、客戶助理或決策支援系統的組織而言,AgentKit 是將脆弱的代理原型轉化為生產級服務的鷹架。
Codex 是什麼? DevDay 有哪些改變?
Codex 是什麼?
Codex 是 OpenAI 專為開發者工作流程打造的編碼助理產品:它包含一套模型功能、CLI 工具和整合工具(編輯器外掛程式、CI 鉤子),旨在加速程式碼編寫、審查和維護。 OpenAI 在 DevDay 上宣布 Codex 一般可用,將其從預覽/內部使用轉變為工程團隊的生產支援層。
Codex 更新後的主要功能有哪些?
- 上下文感知程式碼產生: Codex 可以根據完整的儲存庫上下文(而不僅僅是一個簡短的提示視窗)產生程式碼並遵循樣式和架構約束。
- 即時編輯與開發人員回饋循環: 開發人員可以透過告訴 Codex 重構、添加測試或在開發沙箱中使用即時重新載入演示實作功能來進行迭代。
- 與應用程式和代理整合: 代理程式或應用程式可以呼叫 Codex 來編寫黏合程式碼、回應執行時間錯誤或自動合成 API 用戶端。
- 專用模型: 運行 GPT5-CODEX,擅長重構和程式碼審查,並能根據任務複雜度調整「思考時間」。
- 長期任務: 能夠連續執行任務十分鐘以上或更長。
- 多端協作:統一IDE、終端機、GitHub、雲端;新增Slack整合和Codex SDK(對接CI/CD、維運、資料管路)。
Codex 的演化為何如此重要?
這意義重大,因為它解決了使用 LLM 進行軟體開發時最大的兩個生產力差距:在大型程式碼庫中保持上下文準確性,以及完成從建議到部署變更的閉環。當模型能夠推理整個儲存庫並現場應用編輯——並且當該模型整合到部署工具中時——開發人員就可以從編寫腳手架程式碼轉向協調更高層級的產品決策。
Codex 的正式 GA 版本不僅僅是為了讓補全功能更強大。演示中最吸引人的並非程式碼量,而是 Codex 如何獨立導航協定、閱讀文件、建立 MCP 伺服器、修改前端、連接週邊設備,並在雲端持續推進「長期任務」。
OpenAI 宣布了哪些模型和 API 更新?
DevDay 上宣布了哪些模型更新?
在 DevDay 上,OpenAI 強調了其模型陣容的更新和擴展,以平衡 更高的保真度 經濟有效 變體:
- GPT-5 專業版 — GPT-5 系列的更高容量產品,針對深度推理、長上下文和生產工作負載進行了最佳化(記錄在平台模型頁面中)。
- 索拉2號 ——一款旗艦級視訊+音訊生成模型,能夠為短小逼真的視訊提供支持,並具有同步對話和更佳的物理真實感。 OpenAI 將 Sora 2 定位為其生成視訊領域的下一步。
- 更小、更便宜的語音/即時模型 — 「迷你」變體(例如即時/音訊迷你模型),旨在實現低延遲、經濟實惠的語音或即時互動。
GPT-5 Pro:它是什麼,它做什麼,為什麼重要
詳細資料: GPT-5 Pro 是 GPT-5 系列的高保真配置,旨在用於企業級和關鍵任務工作負載。它為複雜的推理任務提供了擴展的上下文視窗、改進的指令追蹤能力以及更低的幻覺率。 Pro 層級定位為高精度任務的首選模型,在此類任務中,延遲和成本是性能可接受的權衡。
為什麼它的事項: 對於法律分析、科學摘要或依賴準確性和長期脈絡的多步驟決策等應用,Pro 級服務改變了使用 LLM 進行構建的經濟性:團隊不再將任務降級為狹隘的規則系統,而是可以依賴旨在實現端到端推理和更高信任度的模型。 API 上提供的付費 Pro 級服務也讓企業的採購和架構決策更加清晰。

Sora 2:它是什麼,它能做什麼
詳細資料: Sora 2 是 OpenAI 的第二代文字轉視訊模型,能夠產生簡短逼真的片段,並具有同步的聲音和對話、更佳的物理真實感以及方便創作者操控的旋鈕。 OpenAI 發布了 Sora 2,其中包含面向消費者的 Sora 應用程式和用於整合的開發者 API。
它的作用: Sora 2 可以根據文字提示製作短視頻,並擴展現有短視頻片段,並整合與唇部動作和場景聲學相匹配的音頻。它專為創意製作、快速原型設計和以 AI 生成的短視頻為中心的新型社交形式而設計。
即時與迷你模型:經濟實惠的即時體驗
OpenAI 還強調了更便宜、更低延遲的模型變體(即時/迷你係列),旨在以遠低於以往成本的價格提供語音和互動體驗。這些變體使產品團隊能夠添加即時語音助理、低成本聊天機器人和嵌入式離線功能,而無需支付高昂的代幣成本,從而擴大了可行的用例範圍。
GPT-image-1-mini API
GPT-影像-1-迷你 成本優化的多模式影像模型 來自 OpenAI 接受 文字和圖像輸入 並產生 影像輸出它的定位是 OpenAI 完整 GPT-Image-1 系列的更小巧、更便宜的兄弟,專為高吞吐量生產用途而設計,其中成本和延遲是重要的限制因素。此模型適用於以下任務: 文本到圖像的生成, 圖像編輯/修復以及包含參考圖像的工作流程。
如何以實惠的價格存取 Sora 2 和 GPT-5 Pro API?
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發者可以存取 GPT-5-Codex API(GPT-5-Codex), GPT-5 專業版(gpt-5-pro-2025-10-06;gpt-5-pro)和 Sora 2 API(sora-2-hd;sora-2)透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
這些更新如何組合在一起——戰略模式是什麼?
綜合起來,這些聲明體現了三項深思熟慮的舉措:
- ChatGPT 平台化: ChatGPT 內建的應用程式 + 應用程式目錄 = 為第三方開發者提供全新的分發和商業層。這將 ChatGPT 從產品提升到平台。
- 代理作為一級產品原語: AgentKit 使多步驟、使用工具的代理更易於建置、測試和監控,從而促進跨行業的實際自動化。
- 從演示到生產模型: Codex GA 和 Pro 模型層(GPT-5 Pro、Sora 2)顯示出解決企業需求的動力——可靠性、規模、安全工具以及不同的價格/性能權衡。
這種模式並非偶然:OpenAI 正在創建一個開發者飛輪,其中模型為應用程式和代理提供動力,應用程式提供分發和貨幣化,代理提供依賴模型和應用程式整合的可程式行為。
結論—DevDay 2025 是否標誌著新平台時代的開始?
OpenAI DevDay 2025 的重點不再是孤立的功能,而是將這些功能編織成一個連貫的平台:在對話式作業系統中交付的應用程式、具有清晰生產路徑的自主代理、針對實際開發者工作流程的改進版 Codex,以及擴展媒體功能的模型更新。對於開發者來說,這其中的收穫非常實用:新的原語降低了整合成本並加快了產品上市時間,但也提高了治理和營運紀律的標準。
