OpenAIがChatGPTエージェントをリリース

OpenAIは、AIを活用した生産性向上における最新の技術革新であるChatGPT Agentを正式に発表しました。この新機能により、ChatGPTは会話型アシスタントから、ユーザーに代わって複雑で多段階的なタスクを自律的に実行できるプロアクティブなデジタルエージェントへと進化します。CEOのサム・アルトマン氏を招いたライブストリームで行われたこの発表は、ChatGPT AgentをAIユーティリティにおける大きな飛躍と位置付け、インテリジェントアシスタントの進化における重要な瞬間を示すものです。

主な機能

ChatGPTエージェントは「仮想コンピュータ」環境を統合し、Webインターフェース、ドキュメント、サードパーティサービス全体にわたって、手動介入なしに推論、計画、タスク実行を可能にします。コア機能は以下のとおりです。

ウェブブラウジングとリサーチ: 公開されているウェブサイトやアップロードされたファイル全体を徹底的に調査し、情報を収集して統合します。
フォーム入力と取引: ユーザーが承認したアクションを使用して、オンラインフォームに入力し、注文を出し、予約 (フライトの予約、ディナーの予約など) を管理します。
ドキュメントとスライドの生成: 編集可能な PowerPoint プレゼンテーションと Excel スプレッドシートを生成し、ユーザーがエージェントから直接、完全にフォーマットされた成果物を取得できるようにします。

作業の流れ

ChatGPTエージェントは、ChatGPTインターフェースのツールドロップダウンにある「エージェントモード」トグルから起動できます。エージェントを有効にすると、エージェントがリアルタイムでアクションを解説し、プロセスの各ステップを透明化します。ユーザーはいつでも完全な制御権を保持します。つまり、メールの送信、購入などのアクションを実行する前に明示的に許可を要求し、タスクを途中で中断したり、リダイレクトしたりすることができます。

この機能は、「コネクタ」を利用してユーザーアカウントやサードパーティ製アプリケーションと連携します。コネクタはカレンダー管理や受信トレイの要約といったワークフローを効率化する一方で、手動ログインプロンプトによって堅牢なセキュリティとデータプライバシー保護を実現します。

オペレーターとディープリサーチからの進化

ChatGPT Agentは、OpenAIの以前のツールセットであるOperatorとDeep Researchの長所を統合した統合プラットフォームです。Operatorのブラウザベースの自動化機能はAgentの仮想ブラウザに組み込まれ、Deep Researchの自律的なWebソース分析機能はAgentのツールキットにシームレスに組み込まれています。Operatorのスタンドアロンインターフェースは今後数週間で廃止されるため、ユーザーはすべてのエージェントタスクをより汎用性の高いAgent環境に移行します。

可用性とアクセス

ChatGPTエージェントは、まずは加入者に利用可能になります。 Pro, Plus, チーム ChatGPTのティア。有効化はツールのドロップダウンから「エージェントモード」を選択するか、 /agent チャットセッション内でコマンドを使用できます。PlusおよびTeamユーザーへの展開は数日かけて段階的に行われ、欧州経済領域（EEA）およびスイスでの完全な利用可能は2025年夏後半を予定しています。エンタープライズおよび教育機関のお客様は、OpenAIの段階的展開戦略の一環として、近い将来にアクセスできる予定です。

安全性とプライバシー対策

OpenAI は、自律的な AI アクションに関する懸念に対処するため、ChatGPT エージェント内に複数の安全レイヤーを組み込みました。

明示的な同意: 現実世界のシステムに影響を与えるすべてのアクションには、明確な許可要求が求められます。
中断可能性: ユーザーは、目的との整合性を確保しながら、どの段階でもタスクを停止または上書きできます。
リスクフラグ: システムは潜在的に危険または非倫理的なリクエストにフラグを付け、実行を一時停止してユーザーに確認を通知します。

これらの対策は、OpenAI の責任ある AI 展開への取り組みを強調するものであり、複雑なワークフローにおけるエラーや誤用を軽減することを目的としています。

スタートガイド

CometAPIは、数百ものAIモデルを単一のエンドポイントに集約する統合RESTインターフェースを提供します。APIキー管理、使用量制限、課金ダッシュボードも内蔵されており、複数のベンダーURLや認証情報を管理する手間が省けます。

待っている間、開発者はアクセスすることができます O4-ミニAPI ,O3 API および GPT-4.1 API 　コメットAPI掲載されている最新モデルは、記事公開日時点のものです。まずは、モデルの機能をご確認ください。プレイグラウンドそして相談する APIガイド詳細な手順についてはこちらをご覧ください。アクセスする前に、CometAPIにログインし、APIキーを取得していることを確認してください。コメットAPI 統合を支援するために、公式価格よりもはるかに低い価格を提供します。

結論

OpenAIのChatGPT Agentは、会話型AIにおける極めて重要な進化を象徴し、受動的な対話システムを、エンドツーエンドのタスクを実行できるプロアクティブなデジタルパートナーへと変革します。OpenAIは、深い研究能力と安全で許可に基づくアクションを融合させることで、ユーザーに代わって批判的に考え、決断力を持って行動できる次世代アシスタントの提供を目指しています。この機能がPro、Plus、Teamの各レベル、そして最終的にはエンタープライズ分野に展開されるにつれ、より広範なテクノロジーエコシステムは、エージェントAIがソフトウェア業界の生産性、プライバシー基準、そして競争力をどのように変革していくのかを注視していくでしょう。ChatGPT Agentの潜在能力を最大限に引き出し、予期せぬ結果を防ぐためには、セキュリティ対策と倫理的枠組みを継続的に重視することが不可欠です。