OpenAI は、Responses API、Web およびファイル検索の組み込みツール、コンピュータ使用ツール、そしてオープンソースの Agents SDK といった複数の新しい提供物を導入している。Responses API が開発者に同社の技術上にエージェントを構築する手段を提供する一方で、Agents SDK はエージェントを他の Web ツールやプロセスに接続し、ユーザーや企業の要望どおりの「ワークフロー」を自律的に実行できるよう支援する。
2025 年はしばしば「Year of Agents(エージェントの年)」と称され、OpenAI の動きは業界にとって重要な一歩と見なされている。Agents SDK により、開発者は OpenAI の最新の進歩(推論精度の向上、マルチモーダルな対話、新しい安全技術など)を、現実世界のマルチステップのシナリオで容易に活用できる。LLM 開発者や AI エージェントのビルダーにとって、Agents SDK は自律型 AI システムを構築・管理するための「ビルディングブロック」を提供する。
Agents SDK の意義は、本番環境で AI エージェントをデプロイする際の課題に対処できる点にある。従来、強力な LLM の能力をマルチステップのワークフローへと落とし込むには多大な工数が必要で、多くのカスタムルール記述、逐次プロンプト設計、適切な可観測化ツールのない試行錯誤が求められていた。Agents SDK と Responses API などの関連する新しい API ツールにより、OpenAI はこのプロセスを大幅に簡素化し、開発者がより少ない労力で、より複雑かつ信頼性の高いエージェントを構築できるようにすることを目指している。

What is Agents SDK
OpenAI は、オープンソースへの大規模な回帰として Agents SDK をリリースした。これは、エージェントのワークフローを管理・調整・最適化するためのツールキットで、Anthropic や Google といった競合他社のモデル、あるいは DeepSeek、Qwen、Mistral、Meta の Llama ファミリーなどのオープンソースモデルによって駆動されるエージェントの構築にも対応している。
Why use the Agents SDK
SDK には 2 つの設計原則がある:
- 使う価値のある十分な機能を備えつつ、学習が速いようにプリミティブは最小限に抑える。
- デフォルトで優れた動作をしつつ、何が起きるかを正確にカスタマイズできる。
SDK の主な機能は次のとおり:
- Agent loop: ツールの呼び出し、結果の LLM への送信、LLM が完了と判断するまでのループを処理するビルトインのエージェントループ。
- Python-first: 新しい抽象を学ぶ必要なく、組み込みの言語機能を使ってエージェントをオーケストレーションし、連鎖させる。
- Handoffs: 複数エージェント間の調整と委譲を可能にする強力な機能。
- Guardrails: エージェントと並行して入力の検証やチェックを実行し、チェックが失敗した場合は早期に停止。
- Function tools: 任意の Python 関数をツール化し、自動スキーマ生成と Pydantic による検証を提供。
- Tracing: ワークフローの可視化・デバッグ・監視を可能にするビルトイントレーシング。さらに OpenAI の評価、ファインチューニング、蒸留ツール群も活用可能。
How to use Openai Agents SDK
- Set up your Python environment
python -m venv env
source env/bin/activate
- Install Agents SDK
pip install openai-agents
- set the
OPENAI_API_KEYenvironment variable
CometAPI から set the OPENAI_API_KEY API を自由に設定
- Log in to cometapi.com。まだユーザーでない場合は、まずご登録ください
- インターフェースの Get the access credential API key。パーソナルセンターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。
- サイトの URL を取得します: https://api.cometapi.com/
OPENAI_API_KEYエンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは our website API doc から取得できます。当社サイトは Apifox テストも提供しています。
- Set Up Your Agent
AI が使用できるツールを定義します。たとえば、web search と file retrieval を有効にしたいとします:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=)
これで、エージェントは Web を検索し、ドキュメントを取得する方法を理解します。
5. run
従来のチャットボットと異なり、この AI はユーザー入力に基づいて使用するツールを自動で選択します:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("Latest AI research papers")
print(response)
手動の介入は不要—ただの自律実行です。
The Agent Loop
Runner.run() を呼び出すと、SDK は最終的な出力が得られるまでループを実行します:
- エージェントのモデルと設定、メッセージ履歴を用いて LLM を呼び出します。
- LLM はツール呼び出しを含む可能性のあるレスポンスを返します。
- レスポンスに最終出力が含まれている場合、ループは終了しそれを返します。
- レスポンスに handoff が含まれている場合、エージェントが新しいエージェントに切り替わり、手順 1 からループを継続します。
- (ある場合は)ツール呼び出しを処理し、ツールのレスポンスメッセージを追加します。次に手順 1 からループを継続します。
max_turns パラメータを使ってループの実行回数を制限できます。
最終出力
最終出力は、ループ内でエージェントが最後に生成するものです:
- エージェントに
output_typeを設定した場合、最終出力は LLM が構造化出力でその型を返した時点です。 output_typeがない(プレーンテキストの応答)場合、ツール呼び出しや handoff を含まない最初の LLM 応答が最終出力と見なされます。
Hello world example
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

Technical Structure
「OpenAI Agents SDK は、‘Triage Agent’ や ‘CRM Agent’ といった異なるエージェントが、ツールの相互作用や委譲メカニズムを通じてタスクを完了する方法を示す概念的なフレームワークとなることを目指しています。」
Core Components and Architecture of Agents SDK
OpenAI Agents SDK は、簡潔でありながら堅牢な原則群に基づいて構築されている。中核にあるのは Agent の概念で、特定の指示が与えられ、さまざまなツールを使用できるようにした言語モデルのインスタンスを表す。エージェントはユーザーからの要求(質問やタスク定義など)を受け取り、タスクを事前定義されたツールの使用を含むサブタスクに分解し、最終的なレスポンスを返す。Tools は呼び出し可能な関数として機能的に記述され、Agents SDK を活用することで任意の Python 関数をツールとしてシームレスに利用できる。入力と出力の自動スキーマ検証は Pydantic によって提供される。たとえば、データベースクエリツールや Web 検索ツールを表す Python 関数を、エージェントのツールキットへ直接統合できる。
Agents SDK のもう一つの中核要素は Agent Loop であり、タスク解決の反復プロセスを定義する。クエリへの初回応答から始まり、エージェントは情報が十分か、それとも外部アクションが必要かを評価する。必要に応じて関連ツールを呼び出し、出力を処理し、タスクを再評価する。このサイクルは、エージェントが「I'm done」と完了を示すまで繰り返される。Agents SDK はこのプロセスを自動的に管理し、ツール呼び出し、結果処理、反復リトライといった反復的作業を自動化することで開発を容易にする。これにより、開発者は基盤のメカニクスを気にすることなく、ワークフローやエージェントの能力定義に注力できる。OpenAI はこのアプローチを Python-first と表現し、DSL(ドメイン特化言語)ではなく、ループ、条件分岐、関数呼び出しなどの親しみのある Python の構成要素を強調している。この柔軟性により、開発者はネイティブな Python 構文に依拠しつつ、相互接続されたエージェントをオーケストレーションできる。
Handoff and Multi-Agent Architecture
SDK の機能は単一エージェントを超える。Handoff と呼ばれる機能により、タスクは複数のエージェント間で移譲され、シームレスな協調が可能になる。たとえば、「Triage Agent」が受信クエリの性質を判断して別の専門エージェントに委譲したり、一方のエージェントの出力が別のエージェントの入力として機能したりする。この仕組みは、専門エージェントが広範なタスクのそれぞれの部分を実行するワークフローを支え、複雑なマルチエージェントアーキテクチャを実現する。さらに Guardrails は、エージェントの入力または出力に検証ルールを課すことで信頼性を高める。たとえば、パラメータ形式の準拠を強制したり、異常が検出された際にループを早期終了させたりすることで、実運用における非効率な実行や望ましくない挙動のリスクを低減する。
Orchestration and Monitoring
タスク実行を超えて、Agents SDK には強力な orchestration 機能が備わっており、ツール実行、データフロー、ループ管理を担う。高度な自動化が行われている一方で、OpenAI は透明性を重視し、開発者がエージェントの活動をリアルタイムに監視できるツールを提供する。OpenAI ダッシュボードからアクセス可能な組み込みの Tracing 機能を通じ、開発者はワークフローをステップごとに可視化し、ツールがいつ呼び出され、どの入力を使い、どの出力を返したかを観察できる。プラットフォームは OpenAI の監視基盤を活用して、エージェントロジックの実行をトレースとスパンに分解し、エージェントの挙動に対する詳細な洞察を提供する。これにより、ボトルネックの診断、問題のデバッグ、ワークフローの最適化、パフォーマンスの追跡が可能になる。さらに、このトレーシングアーキテクチャは高度な評価をサポートし、時間とともにエージェントの性能を微調整し改善することを可能にする。
Advantages
OpenAI Agents SDK は個人開発者のためだけのものではなく、AI エージェントベースの製品を構築する企業にも大きな利点を提供する。主な利点は次のとおり:
Fast Prototyping and Production: Agents SDK は、最小限のコードと設定で複雑なエージェント動作を実装し、アイデアから製品までのサイクルを短縮する。たとえば、大手暗号資産プラットフォームの Coinbase は、SDK を使ってマルチエージェントのサポートシステムを迅速にプロトタイプし、展開している。同様に、エンタープライズ検索アシスタントなどの領域では、企業は SDK の Web およびファイル検索ツールを統合して、迅速に価値を提供できる。オーケストレーションの詳細をオフロードすることで、開発者は製品固有の機能に注力できる。
Reduced Development Costs: エージェントシステムを一から構築するには、相当なエンジニアリング投資が必要となる。Agents SDK は、ループ管理、API 呼び出しの同期、エラーハンドリング、LLM に対する整形済みツール出力など、一般的なニーズに対する既製のソリューションを提供することでコストを削減する。オープンソースであるため、企業の要件に合わせたカスタマイズも可能だ。これは、限られたリソースで強力なエージェント駆動型製品を作りたいスタートアップにとって大きな恩恵となる。
Traceability and Debugging: SDK に統合されたトラッキングダッシュボードは、ビジネスアプリケーションに変革をもたらす。AI が「ブラックボックス」であるという業界の懸念に対し、あらゆるエージェントのステップを記録・監査できるようになった。もしカスタマーサポートエージェントが誤った回答をした場合でも、どのツール呼び出しやステップが失敗したかをトレースで確認できる。OpenAI Platform のログ/トレース画面はエージェントの監査性を高め、規制や内部監査の対象となる業界にとって不可欠だ。必要な際に結果を説明できるという安心感のもと、企業は AI をより自信を持って統合できる。
Access to OpenAI’s latest models and tools: Agents SDK を利用することは、OpenAI のトップモデル(例: GPT-4)と現行ツール(Web 検索、コード実行など)の利点を享受することを意味する。これは、より弱いモデルに依存する代替案を構築するよりも品質面で有利だ。高い正確性や最新情報が必要なアプリケーション(例: リサーチアシスタント、金融分析エージェント)にとって、OpenAI のモデル性能は大きな強みとなる。OpenAI がツールを追加するにつれて(さらなる統合が示唆されている)、SDK の利用者はそれらを容易に採用できる。
CometAPI は OpenAI のインターフェースプロトコルと完全に互換で、シームレスな統合を実現します。モデルやサービスへの依存(ロックインリスク)を回避し、データのプライバシーとセキュリティの懸念を軽減し、コストを削減できます。OpenAI の強力なモデルとツールを活用することは高価で、場合によっては性能を制限することがあります。CometAPI はより安価な価格を提供します。
Conclusion
OpenAI は Responses API のような革新的な提供物によって AI の能力を前進させることに尽力している。これらのツールを導入することで、企業や開発者は、よりスマートで適応性が高く、きわめて信頼性の高い AI ソリューションを構築する機会を得る。これらの進展は、人工知能が業界全体でインパクトのある変化を推進し、新たな可能性を切り拓き続ける未来を示している。
