解壓縮 OpenAI 的 Agents SDK:指南

CometAPI
AnnaMar 12, 2025
解壓縮 OpenAI 的 Agents SDK:指南

OpenAI 推出了幾項新產品:Responses API、用於網路和檔案搜尋的內建工具、電腦使用工具和開源 Agents SDK。雖然 Responses API 允許開發人員在其技術之上建立代理,但 Agents SDK 可以幫助他們將代理連結到其他 Web 工具和流程,自主執行使用者或企業所需的「工作流程」。

2025 年通常被譽為“代理年”,而 OpenAI 的舉措被視為該行業的關鍵一步。 Agents SDK 讓開發人員在現實世界的多步驟情境中輕鬆利用 OpenAI 的最新進展(例如改進的推理、多模式互動和新的安全技術)。對於 LLM 開發人員和 AI 代理構建者,Agents SDK 提供了一組「構建塊」來創建和管理自己的自主 AI 系統。

Agents SDK 的意義在於它能夠解決在生產環境中部署AI代理的挑戰。傳統上,將強大的 LLM 功能轉化為多步驟的工作流程需要大量勞動力,需要大量自訂規則編寫、順序提示設計以及在沒有適當可觀察性工具的情況下進行反覆試驗。借助 Agents SDK 和相關的新 API 工具(例如 Responses API),OpenAI 旨在顯著簡化此流程,使開發人員能夠以更少的精力建立更複雜、更可靠的代理程式。

代理 SDK

什麼是 Agents SDK

OpenAI 透過發布 Agents SDK 大舉回歸開源,Agents SDK 是一個工具包,旨在幫助開發人員管理、協調和優化代理工作流程,甚至可以構建由其他非 OpenAI 模型驅動的代理,例如競爭對手 Anthropic 和谷歌的模型,或 DeepSeek、Qwen、Mistral 和 Meta 的 Llama 系列的開源模型。

為何使用 Agents SDK

SDK 有兩個驅動設計原則:

  1. 具有足夠多值得使用的功能,但基本元素較少,可以快速學習。
  2. 開箱即用,但您可以自訂具體發生的情況。

以下是該 SDK 的主要功能:

  • 代理循環:內建代理循環,處理呼叫工具、將結果傳送到 LLM,並循環直到 LLM 完成。
  • Python 優先:使用內建語言功能來協調和連結代理,而不需要學習新的抽象。
  • 交接:在多個代理人之間進行協調和委派的強大功能。
  • 護欄:與您的代理並行運行輸入驗證和檢查,如果檢查失敗則提前中斷。
  • 函數工具:將任何 Python 函數轉換為工具,並具有自動模式產生和 Pydantic 支援的驗證。
  • 追蹤:內建追蹤功能,可讓您視覺化、除錯和監控您的工作流程,以及使用 OpenAI 評估、微調和提煉工具套件。

使用方法 Openai 代理程式 SDK

  1. 設定 Python 環境
python -m venv env
source env/bin/activate
  1. 安裝 Agents SDK
pip install openai-agents
  1. 設置 OPENAI_API_KEY 環境變量

自如 設置 OPENAI_API_KEY 來自 CometAPI 的 API

  1. 設定您的代理

定義你的 AI 可以使用哪些工具。假設我們想要啟用 網絡搜索   文件檢索:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

現在您的代理商知道如何搜尋網路和取得文件。

5. 運行

與傳統聊天機器人不同,這種人工智慧 根據使用者輸入決定使用哪種工具:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

無需人工幹預—只需 自主執行.

代理循環

你打電話時 Runner.run(),SDK 會循環運行,直到獲得最終輸出:

  1. 使用代理程式上的模型和設定以及訊息歷史記錄來呼叫 LLM。
  2. LLM 回傳回應,其中可能包括工具呼叫。
  3. 如果響應有最終輸出,則循環結束並返回它。
  4. 如果回應有交接,則代理設定為新代理,循環從步驟 1 繼續。
  5. 處理工具呼叫(如果有)並且附加工具回應訊息。然後循環從步驟 1 繼續。

您可以使用 max_turns 參數來限制循環執行的次數。

最終輸出

最終輸出是代理在循環中產生的最後的東西:

  • 如果你設定 output_type 在代理上,最終輸出是當 LLM 使用結構化輸出傳回該類型的內容時。
  • 如果沒有 output_type (即純文字回應),那麼沒有任何工具呼叫或交接的第一個 LLM 回應將被視為最終輸出。

你好世界範例

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

解壓縮 OpenAI 的 Agents SDK:指南

技術結構

“OpenAI Agents SDK 旨在成為一個概念框架,展示不同的代理(例如‘Triage Agent’或‘CRM Agent’)如何透過工具互動和委託機制協作完成任務。”

Agents SDK 的核心元件和架構

OpenAI Agents SDK 建立在一套簡潔又強大的原則之上。其核心概念是 經紀人,它表示根據特定指令自訂並配備使用各種工具的語言模型實例。代理首先接收使用者請求(例如問題或任務定義),然後將這些任務分解為可能涉及使用預先定義工具的子任務,最終提供完整的回應。這些 工具 在功能上描述為可呼叫函數;利用 Agents SDK,任何 Python 函數都可以無縫地用作工具,並透過 Pydantic 提供輸入和輸出的自動架構驗證。例如,代表資料庫查詢工具或網路搜尋工具的 Python 函數可以直接整合到代理程式的工具包中。

Agents SDK 的另一個核心部分是 代理循環,定義了任務解決的迭代過程。從最初嘗試回答查詢開始,代理程式會評估它是否有足夠的資訊或需要執行外部操作。當需要時,代理會呼叫相關工具,處理輸出並重新評估任務。這個循環重複進行,直到代理以「我完成了」的回應表示任務完成。 Agents SDK 自主管理此過程,透過自動執行工具呼叫、結果處理和迭代重試等重複任務來簡化開發過程。這使得開發人員可以更專注於定義工作流程和代理功能,而不必擔心底層機制。 OpenAI 將這種方法描述為 Python 優先,強調使用熟悉的 Python 結構(例如循環、條件和函數呼叫)而不是領域特定語言 (DSL)。有了這種靈活性,開發人員可以依賴本機 Python 語法來協調互連的代理。

切換和多代理架構

SDK 的功能超越了單一代理程式。透過一項稱為 交出,任務可以在多個代理之間轉移,使他們能夠無縫協作。例如,「分類代理」可以確定傳入查詢的性質,將其委託給另一個專門的代理,或者一個代理的輸出可以作為另一個代理的輸入。該系統支援專門代理執行更廣泛任務的不同部分的工作流程,從而支援複雜的多代理架構。 OpenAI 為可擴展的應用程式設計了工具包,例如客戶支援自動化、研究流程、多步驟專案、內容創建、銷售營運甚至程式碼審查。此外, 護欄 透過對代理輸入或輸出施加驗證規則來增強可靠性。例如,護欄可以強制參數格式合規性或在偵測到異常時提前終止循環,從而降低實際操作中執行效率低下或不良行為等風險。

編排和監控

除了任務執行之外,Agents SDK 還包含強大的 管弦樂編曲 功能,負責工具執行、資料流和循環管理。儘管自動化程度很高,OpenAI 仍優先考慮透明度,為開發人員提供即時監控代理活動的工具。透過內建 追踪 透過 OpenAI 儀表板中可存取的功能,開發人員可以逐步視覺化工作流程,觀察工具的呼叫時間、它們使用的輸入以及它們返回的輸出。該平台利用 OpenAI 的監控基礎設施將代理邏輯的執行分解為痕跡和跨度,從而提供對代理行為的細緻洞察。這使開發人員能夠診斷瓶頸、調試問題、優化工作流程和追蹤效能。此外,追蹤架構支援複雜的評估,從而能夠隨著時間的推移對代理性能進行微調和改進。

優點

OpenAI Agents SDK 不僅適用於個人開發者,它還為建立基於 AI 代理的產品的公司提供了顯著優勢。我們先來看看優點:

快速原型設計與生產: Agents SDK 以最少的程式碼和配置實現複雜的代理行為,縮短從想法到產品的周期。例如,主流加密平台Coinbase使用SDK快速原型化和部署多代理支援系統。同樣,在企業搜尋助理等領域,企業可以整合 SDK 的網頁和文件搜尋工具,快速實現價值。透過卸載編排細節,開發人員可以專注於特定於產品的功能。

降低開發成本: 從頭開始建立代理系統需要大量的工程投資。 Agents SDK 透過提供滿足常見需求的現成解決方案來降低成本——循環管理、API 呼叫同步、錯誤處理和 LLM 的格式化工具輸出。由於它是開源的,因此還允許定制以滿足公司的需求。這對新創公司來說是一個福音,使他們能夠利用有限的資源創造出強大的代理驅動產品。

可追溯性和調試: SDK 的整合追蹤儀表板改變了業務應用程式。業界擔心人工智慧是一個“黑盒子”,現在允許記錄和審核每個代理步驟。如果客戶支援代理程式給出錯誤答案,則會追蹤顯示哪個工具呼叫或步驟失敗了。 OpenAI 平台的日誌/追蹤螢幕提高了代理的可審計性——這對於受到監管或內部審計的行業至關重要。這使得公司可以更自信地整合人工智慧,因為他們知道他們可以在需要時解釋結果。

存取 OpenAI 的最新模型和工具: 使用 Agents SDK 意味著可以利用 OpenAI 的頂級模型(例如 GPT-4)和當前工具(網路搜尋、程式碼執行)。與構建可能依賴較弱模型的替代方案相比,這提供了品質優勢。對於需要高精度或最新資訊的應用(例如研究助理、財務分析代理),OpenAI 模型的性能是一個很大的優勢。隨著 OpenAI 添加工具(暗示將會有更多整合),SDK 用戶可以輕鬆採用它們。

CometAPI完全相容OpenAI介面協議,確保無縫整合。利用 OpenAI 強大的模型和工具可能會很昂貴,有時會限制效能。 CometAPI 提供更便宜的價格。

相關話題 CometAPI:終極 AI 模型整合平台

結論

OpenAI 致力於透過 Responses API 等創新產品來提升 AI 能力。透過引入這些工具,企業和開發人員有機會建立更智慧、更具適應性、高度可靠的人工智慧解決方案。這些發展表明,未來人工智慧將繼續推動重大變革並釋放各行各業的新可能性。

SHARE THIS BLOG

一個 API 中超過 500 個模型

最高 20% 折扣