OpenAI DevDay 2025: 新しい AI オペレーティング レイヤーの開発者ガイド

CometAPI
AnnaOct 8, 2025
OpenAI DevDay 2025: 新しい AI オペレーティング レイヤーの開発者ガイド

OpenAI DevDay 2025は、2025年10月上旬に開催された高速開発者ショーケースで、OpenAIは、同社をモデルプロバイダーからプラットフォームオペレーターへと移行させるために設計された幅広い製品、ツールキット、SDK、モデルリリースを発表しました。ChatGPT内で実行されるアプリ、ドラッグアンドドロップエージェントビルダー(AgentKit)、開発者ワークフロー用のCodexの一般公開、そしてプロダクショングレードの統合を正面から目指した新しいモデル層セット(GPT-5 Proとビデオ用のSora 2を含む)です。それでは、このカンファレンスでOpenAIが何を発表したかを見て、それが現在のAI業界にどのようなブレークスルーをもたらすのかを分析してみましょう。これは開発者のためのガイドでもあります。

OpenAI DevDay 2025 が重要な理由は何ですか?

DevDay 2025は、AIネイティブの世界においてアプリケーションがどこでどのように構築・配布されるかを再定義する点で重要です。OpenAIは、モデルを開発者がAPI経由で呼び出すバックエンド機能として扱うのではなく、インタラクティブアプリのホストとしてChatGPTというエクスペリエンスレイヤーをパッケージ化しています。この変化は、以下の3つの意味合いを持ちます。

  1. ディストリビューション: 開発者は、従来のアプリ ストアや Web チャネルだけに頼るのではなく、チャット エクスペリエンス内で ChatGPT の膨大なユーザーに直接リーチできます。
  2. 組成: アプリ、エージェント、モデルは、組み合わせ可能な構成要素となります。ドメインスペシャリストモデル、タスクステップを連結するエージェント、会話型UIを組み合わせ、単一の製品エクスペリエンスを構築できます。
  3. エンジニアリングのパラダイムの書き換え: 「関数を作成するためのコードの作成」から「インテリジェントエージェントのオーケストレーション + 自動評価」まで、エンジニアリング プロセスは細分化、視覚化、標準化されています。

新しい Apps SDK とは何ですか? また、これによって何が可能になりますか?

アプリ SDK とは何ですか?

アプリSDKはOpenAIの開発者向けツールキットで、 ChatGPT内に存在するインタラクティブアプリケーションSDK で構築されたアプリは、Web ページにリンクしたり静的データを返したりするのではなく、会話から呼び出して ChatGPT 内でインタラクティブな UI をレンダリングしたり、フォローアップ リクエストを受け入れたり、そして重要な点として、チャット セッション全体でコンテキストを保持して、アプリと言語モデルがシームレスに連携できるようにします。

特徴:

  • チャットアプリへの埋め込み: アプリは ChatGPT 内でレンダリングされるため、ユーザーは会話を離れることなく、複数のステップから成るタスク (Canva でポスターをデザインし、それをピッチデッキに変換するなど) を実行できます。
  • 文脈の連続性: アプリは構造化されたコンテキスト (モデル コンテキスト プロトコル/MCP 経由) を受け取るため、1 回限りの統合ではなく、ファーストクラスのチャット参加者のように動作します。
  • 開発者モードとプレビュー: 開発者は開発者モードでアプリをテストし、迅速に反復して、準備ができたらレビューのために送信できます。
  • コマースと収益化の配管(近日公開予定): OpenAI は、アプリがチャット体験内で商品やサービスを販売し、開発者が最終的にアプリを収益化できるようにするためのコマースフックを示しました。
  • データと権限のためのツール: SDK は、サードパーティ アプリがデータを操作または読み取る必要がある場合に、ユーザーにアカウントを接続してデータ アクセスを許可するように要求するためのパターンを定義し、同意とトークン交換のフローを組み込みます。

アプリSDKが重要な理由

OpenAIはChatGPTをサードパーティアプリのホスト環境にすることで、会話アシスタントから ランタイム — 会話型インタラクションのための「オペレーティングシステム」です。開発者にとっては、UIと配信ファネルを別途構築する代わりに、軽量なアプリロジックを記述し、ChatGPTの検出機能と会話型UXのメリットを享受できるため、作業の負担が軽減されます。製品チームや企業にとっては、機能の設計方法が変わります。ウェブサイトにモデルを埋め込む代わりに、フォローアップ、説明、マルチモーダル出力をサポートする会話型ファブリック内に製品を埋め込むことができます。

OpenAIは、「自然言語」を新たなユニバーサルUIレイヤーへと変換しようと試みています。このレイヤーでは、アプリは「ページの集合」ではなく、「機能+コンテキスト+トランザクション機能」の集合として定義されます。これは、「ブラウザ+アプリストア+チェックアウト+SDK」を会話に統合するようなものです。ネイティブアプリを置き換えるのではなく、チェーンを再構築し、「最初のコンタクト」をChatGPTに置き、「ディープユース」を外部アプリ(フルスクリーン、リダイレクト)に確保することを目的としています。

AgentKit とは何ですか? AgentKit はエージェント開発をどのように変えるのでしょうか?

AgentKitとは何ですか?

AgentKitは、OpenAIの新しいツールキットです。エージェントアプリケーション(ユーザーに代わって自律的に計画、行動、インタラクションを行うソフトウェアエージェント)の構築、展開、最適化に役立ちます。AgentKitは、タスクの分解、ツールの利用、エージェントの行動評価のための開発者向けプリミティブをパッケージ化しています。OpenAIはAgentKitを「エージェントのためのインフラストラクチャ」と位置付け、開発者が信頼性が高く、監査可能で、反復開発が容易なエージェントを構築できるようにします。

AgentKit の主な機能は何ですか?

  • ビジュアルエージェントビルダー: ロジック ノードを接続し、フローを定義し、すべての調整の詳細を手動でコーディングすることなく複数のエージェントをオーケストレーションするためのキャンバス。
  • ツールと API コネクタ: エージェントを外部サービス (API、データベース、Webhook) にリンクして実際のアクションを可能にする、事前に構築されたアダプター。
  • 評価とガードレール: 統合された評価とトレースにより、チームはエージェントのトレースを評価し、回帰を検出し、プロンプト/チェーンの動作を調整できます。
  • デプロイメントと監視可能性: 運用環境でのエージェントのパフォーマンスと障害を監視するための組み込みのデプロイメント プリミティブとテレメトリ。

AgentKit が重要なのはなぜですか?

エージェントの実用上の課題は、信頼性と安全性、つまり予期せぬ副作用なくエージェントを現実世界で動作させる方法にあります。AgentKitは、これらの懸念をエンジニアリングファーストで解決しようと試みます。ツールアクセス、コンテキスト管理、評価のための標準化されたパターンを提供することで、予測不可能性を軽減し、開発サイクルを短縮します。自動化ワークフロー、顧客アシスタント、意思決定支援システムを構築する組織にとって、AgentKitは、脆弱なエージェントのプロトタイプを本番環境レベルのサービスへと変換するための足場となります。

Codex とは何ですか? また、DevDay で何が変わりましたか?

Codex とは何ですか?

Codexは、OpenAIの開発者ワークフロー専用のコーディング支援製品です。コードの作成、レビュー、メンテナンスを加速するために設計されたモデル機能、CLIツール、統合(エディタプラグイン、CIフック)のスイートです。DevDayでOpenAIは発表しました。 Codexは一般公開されていますプレビュー/社内使用からエンジニアリング チーム向けの運用サポート層に移行します。

アップデート後の Codex の主な機能は何ですか?

  • コンテキスト認識コード生成: Codex は、完全なリポジトリ コンテキスト (短いプロンプト ウィンドウだけでなく) に基づいてコードを生成し、スタイルとアーキテクチャの制約に従います。
  • ライブ編集と開発者のフィードバック ループ: 開発者は、開発サンドボックスでライブリロードデモを使用して、Codex にリファクタリング、テストの追加、機能の実装を指示することで反復処理を行うことができます。
  • アプリおよびエージェントとの統合: Codex はエージェントまたはアプリから呼び出され、グルーコードを記述したり、ランタイム エラーに応答したり、API クライアントを自動的に合成したりすることができます。
  • 特殊モデル: それでも僕らは走ります GPT5-CODEXリファクタリングとコードレビューに優れており、タスクの複雑さに応じて「考える時間」を調整できます。
  • 長時間のタスク: 10分以上連続してタスクを実行できます。
  • マルチターミナルコラボレーション: 統合 IDE、ターミナル、GitHub、クラウド。新しく追加された Slack 統合と Codex SDK (CI/CD、運用と保守、データ パイプラインへの接続)。

Codex の進化はなぜ重要なのでしょうか?

これは、LLMを用いたソフトウェア開発における2つの最大の生産性ギャップ、すなわち大規模コードベースにおけるコンテキストの正確性維持と、提案から変更のデプロイまでのループの完結という点に対処するという点で意義深いものです。モデルがリポジトリ全体を推論し、その場で編集を適用できる場合、そしてそのモデルがデプロイツールに統合されている場合、開発者はスキャフォールドコードの作成から、より高レベルの製品決定のオーケストレーションへと移行できます。

Codexの公式GAリリースは、補完機能の強化だけではありません。デモで最も興味深かったのは、記述されたコードの量ではなく、Codexがプロトコルをナビゲートし、ドキュメントを読み、MCPサーバーをセットアップし、フロントエンドを変更し、周辺機器を接続し、クラウド内の「長期タスク」を継続的に実行していく様子でした。

OpenAI はどのようなモデルと API のアップデートを発表しましたか?

DevDay ではどのようなモデルの更新が発表されましたか?

DevDayでOpenAIは、バランスの取れたモデルラインナップのリフレッシュと拡張を強調しました。 より高い忠実度 および コスト効率の良い バリエーション:

  • GPT-5 プロ — 深い推論、長いコンテキスト、本番環境のワークロード向けに最適化された、GPT-5 ファミリーのより大容量の製品 (プラットフォーム モデル ページに記載)。
  • ソラ2 — 同期したセリフと向上した物理的なリアリティを備えた、短くてリアルな動画を実現する、フラッグシップの動画+音声生成モデルです。OpenAIはSora 2を、ジェネレーティブビデオの次世代モデルと位置付けています。
  • より小型で安価な音声/リアルタイムモデル — 低遅延で手頃な価格の音声またはリアルタイムのインタラクションを可能にするために設計された「ミニ」バリアント(例:リアルタイム/オーディオ ミニ モデル)。

GPT-5 Proとは何か、何をするのか、なぜ重要なのか

それは何ですか: GPT-5 Proは、エンタープライズおよびミッションクリティカルなワークロード向けに設計されたGPT-5ファミリーの高忠実度構成です。拡張されたコンテキストウィンドウ、改善された命令追従性、そして複雑な推論タスクにおける幻覚率の低減を実現します。Proレベルは、レイテンシとコストがパフォーマンスと許容できるトレードオフとなる高精度タスクに最適なモデルとして位置付けられています。

なぜ重要なのか: 法務分析、科学的な要約、多段階の意思決定など、正確性と長期的なコンテキストが求められるアプリケーションにおいて、Pro レベルは LLM を用いた開発の経済性を一変させます。タスクを限定的なルールシステムにダウングレードするのではなく、エンドツーエンドの推論と高い信頼性を目的としたモデルを活用できます。また、API 上で有料の Pro レベルが利用可能になることで、企業にとって調達やアーキテクチャに関する意思決定がより明確になります。

OpenAI DevDay 2025: 新しい AI オペレーティング レイヤーの開発者ガイド

SORA 2:それが何なのか、それが何をするのか

それは何ですか: Sora 2は、OpenAIの第2世代テキスト動画変換モデルです。音声とセリフが同期され、物理的なリアリティが向上し、クリエイター向けのコントロールノブも備えた、リアルで短いクリップを生成します。OpenAIは、Sora 2を、消費者向けのSoraアプリと統合用の開発者APIの両方とともにリリースしました。

効能は・・・ Sora 2は、テキストプロンプトからショートビデオを生成し、既存のショートクリップを拡張し、唇の動きやシーンの音響にマッチした音声を統合します。AI生成のショートクリップを中心としたクリエイティブ制作、ラピッドプロトタイピング、そして新しいソーシャルフォーマット向けに設計されています。

リアルタイムとミニモデル: 手頃な価格のリアルタイム体験

OpenAIは、音声およびインタラクティブな体験を従来の数分の1のコストで実現するために設計された、より安価で低レイテンシのモデルバリアント(リアルタイム/ミニファミリー)にも重点を置いています。これにより、製品チームはトークンあたりのコストを法外に高くすることなく、ライブ音声アシスタント、低コストのチャットボット、組み込みのオフラインスタイルの機能を追加できるようになり、実行可能なユースケースの範囲が広がります。

GPT-image-1-mini API

gpt-image-1-mini   コスト最適化されたマルチモーダル画像モデル OpenAIから受け入れる テキストと画像の入力 そして生産する 画像出力これはOpenAIのGPT-Image-1ファミリーの小型で安価な兄弟分として位置付けられており、コストとレイテンシが重要な制約となる高スループットのプロダクション用途向けに設計されています。このモデルは、次のようなタスクを想定しています。 テキストから画像への生成, 画像編集/修復、および参照画像を組み込んだワークフロー。

手頃な価格で Sora 2 と GPT-5 Pro API にアクセスするにはどうすればよいですか?

CometAPIは、OpenAIのGPTシリーズ、GoogleのGemini、AnthropicのClaude、Midjourney、Sunoなど、主要プロバイダーの500以上のAIモデルを、開発者にとって使いやすい単一のインターフェースに統合する統合APIプラットフォームです。一貫した認証、リクエストフォーマット、レスポンス処理を提供することで、CometAPIはAI機能をアプリケーションに統合することを劇的に簡素化します。チャットボット、画像ジェネレーター、音楽作曲ツール、データドリブン分析パイプラインなど、どのようなアプリケーションを構築する場合でも、CometAPIを利用することで、反復処理を高速化し、コストを抑え、ベンダーに依存しない環境を実現できます。同時に、AIエコシステム全体の最新のブレークスルーを活用できます。

開発者はgpt-5-codex API(gpt-5-codex)にアクセスできます。 GPT-5 プロ( gpt-5-pro-2025-10-06; gpt-5-pro) および ソラ2 API(sora-2-hd; sora-2) CometAPI経由で、 最新モデルバージョン 公式ウェブサイトで常に更新されています。まずは、モデルの機能について調べてみましょう。 プレイグラウンド そして相談する APIガイド 詳細な手順についてはこちらをご覧ください。アクセスする前に、CometAPIにログインし、APIキーを取得していることを確認してください。 コメットAPI 統合を支援するために、公式価格よりもはるかに低い価格を提供します。


これらのアップデートはどのように組み合わされるのでしょうか? 戦略的なパターンは何でしょうか?

これらの発表を総合すると、次の 3 つの意図的な動きが明らかになります。

  1. ChatGPTのプラットフォーム化: ChatGPT内のアプリ + アプリディレクトリ = サードパーティ開発者向けの新たな配信・コマースレイヤー。これにより、ChatGPTは製品からプラットフォームへと進化します。
  2. ファーストクラスの製品プリミティブとしてのエージェント: AgentKit を使用すると、複数のステップで構成されるツール使用エージェントの構築、テスト、監視が容易になり、業界全体で実用的な自動化が促進されます。
  3. デモから生産モデルまで: Codex GA および Pro モデル層 (GPT-5 Pro、Sora 2) は、信頼性、スケール、安全ツール、さまざまな価格とパフォーマンスのトレードオフなど、エンタープライズのニーズを解決するための取り組みを示しています。

このパターンは偶然ではありません。OpenAI は、モデルがアプリとエージェントを動かし、アプリが配信と収益化を提供し、エージェントがモデルとアプリの統合の両方に依存するプログラム可能な動作を提供する開発者向けフライホイールを作成しています。

結論 — DevDay 2025 は新しいプラットフォーム時代の始まりとなるでしょうか?

OpenAI DevDay 2025は、個々の機能ではなく、それらの機能を統合したプラットフォームとして統合することに重点が置かれました。具体的には、会話型OS内で提供されるアプリ、明確な開発パスを備えた自律エージェント、実際の開発者ワークフローに対応する進化したCodex、そしてメディア機能を拡張するモデルアップデートなどが挙げられます。開発者にとって、このイベントの成果は実用的です。新しいプリミティブは統合コストを削減し、市場投入までの時間を短縮するだけでなく、ガバナンスと運用規律の基準も引き上げます。

もっと読む

1つのAPIで500以上のモデル

最大20%オフ