OpenAI의 Agents SDK 풀기: 가이드

CometAPI
AnnaMar 12, 2025
OpenAI의 Agents SDK 풀기: 가이드

OpenAI는 여러 가지 새로운 서비스를 출시합니다. Responses API, 웹 및 파일 검색을 위한 내장 도구, 컴퓨터 사용 도구 및 오픈소스 Agents SDK입니다. Responses API를 통해 개발자는 해당 기술을 기반으로 에이전트를 빌드할 수 있지만 Agents SDK를 사용하면 에이전트를 다른 웹 도구 및 프로세스에 연결하여 사용자 또는 비즈니스가 원하는 작업을 자율적으로 수행하는 "워크플로"를 수행할 수 있습니다.

2025년은 종종 "에이전트의 해"로 불리며 OpenAI의 움직임은 업계의 핵심 단계로 여겨진다. Agents SDK를 통해 개발자는 OpenAI의 최신 발전 사항(예: 개선된 추론, 멀티모달 상호 작용 및 새로운 안전 기술)을 실제 다단계 시나리오에서 쉽게 활용할 수 있다. LLM 개발자와 AI 에이전트 빌더의 경우 Agents SDK는 자체 자율 AI 시스템을 만들고 관리하기 위한 일련의 "빌딩 블록"을 제공한다.

Agents SDK의 중요성은 프로덕션 환경에서 AI 에이전트를 배포하는 과제를 해결할 수 있는 능력에 있습니다. 전통적으로 강력한 LLM 기능을 여러 단계 워크플로로 변환하는 것은 많은 노동 집약적이었고, 많은 사용자 지정 규칙 작성, 순차적 프롬프트 디자인, 적절한 관찰 툴링 없이 시행착오가 필요했습니다. Agents SDK와 Responses API와 같은 관련 새로운 API 도구를 통해 OpenAI는 이 프로세스를 크게 단순화하여 개발자가 더 적은 노력으로 더 복잡하고 안정적인 에이전트를 구축할 수 있도록 하려고 합니다.

에이전트 SDK

에이전트 SDK란 무엇입니까?

OpenAI는 Agents SDK를 출시하면서 대대적으로 오픈 소스로 돌아왔습니다. Agents SDK는 개발자가 에이전트 워크플로를 관리, 조정, 최적화하는 데 도움이 되는 툴킷입니다. 여기에는 경쟁사인 Anthropic과 Google이 제공하는 다른 비 OpenAI 모델이나 DeepSeek, Qwen, Mistral, Meta의 Llama 제품군과 같은 오픈 소스 모델을 사용하여 에이전트를 구축하는 것도 포함됩니다.

Agents SDK를 사용하는 이유

SDK에는 두 가지 주요 설계 원칙이 있습니다.

  1. 사용할 만한 기능은 충분하지만, 빠르게 배울 수 있을 만큼 기본적인 기능은 적습니다.
  2. 바로 사용해도 잘 작동하지만, 정확히 무슨 일이 일어나는지 사용자 지정할 수 있습니다.

SDK의 주요 기능은 다음과 같습니다.

  • 에이전트 루프: 도구 호출, LLM에 결과 전송, LLM이 완료될 때까지 반복하는 내장 에이전트 루프입니다.
  • Python 우선: 새로운 추상화를 배울 필요 없이 내장된 언어 기능을 사용하여 에이전트를 조정하고 연결합니다.
  • 핸드오프: 여러 에이전트 간의 조정과 위임을 위한 강력한 기능입니다.
  • 가드레일: 에이전트와 병렬로 입력 검증 및 검사를 실행하고, 검사에 실패하면 조기에 중단합니다.
  • 함수 도구: 자동 스키마 생성 및 Pydantic 기반 검증 기능을 통해 모든 Python 함수를 도구로 전환합니다.
  • 추적: 워크플로를 시각화, 디버깅, 모니터링하고 OpenAI의 평가, 미세 조정, 정제 도구 모음을 사용할 수 있는 추적 기능이 내장되어 있습니다.

이용 방법 Openai 에이전트 SDK

  1. Python 환경 설정
python -m venv env
source env/bin/activate
  1. 에이전트 SDK 설치
pip install openai-agents
  1. 설정 OPENAI_API_KEY 환경 변수

자유로이 설정 OPENAI_API_KEY CometAPI의 API

  • 로그인코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 액세스 자격 증명 API 키 가져오기 인터페이스의. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키: sk-xxxxx를 가져와 제출합니다.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/
  • 선택 OPENAI_API_KEY API 요청을 보내고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 다음에서 가져옵니다. 우리 웹사이트 API 문서. 저희 웹사이트는 귀하의 편의를 위해 Apifox 테스트도 제공합니다.
  1. 에이전트 설정

AI가 사용할 수 있는 도구를 정의합니다. 활성화하고 싶다고 가정해 보겠습니다. 웹 서핑 및  파일 검색:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

이제 귀하의 에이전트는 웹을 검색하고 문서를 가져오는 방법을 알게 되었습니다.

5. 달리다

기존의 챗봇과 달리 이 AI는 사용자 입력에 따라 어떤 도구를 사용할지 결정합니다.:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

수동 개입 없음 - 단지 자율 실행.

에이전트 루프

전화 할 때 Runner.run()SDK는 최종 출력을 얻을 때까지 루프를 실행합니다.

  1. LLM은 에이전트의 모델과 설정, 메시지 기록을 사용하여 호출됩니다.
  2. LLM은 도구 호출을 포함할 수 있는 응답을 반환합니다.
  3. 응답에 최종 출력이 있으면 루프가 종료되고 해당 출력이 반환됩니다.
  4. 응답에 핸드오프가 있는 경우 에이전트는 새 에이전트로 설정되고 루프는 1단계부터 계속됩니다.
  5. 도구 호출이 처리되고(있는 경우) 도구 응답 메시지가 추가됩니다. 그런 다음 루프는 1단계에서 계속됩니다.

당신은을 사용할 수 있습니다 max_turns 루프 실행 횟수를 제한하는 매개변수입니다.

â € <최종 출력

최종 출력은 루프에서 에이전트가 생성하는 마지막 항목입니다.

  • 만약 당신이 설정한다면 output_type 에이전트에서 최종 출력은 LLM이 구조화된 출력을 사용하여 해당 유형의 무언가를 반환할 때입니다.
  • 없으면 output_type (즉, 일반 텍스트 응답) 도구 호출이나 핸드오프가 없는 첫 번째 LLM 응답이 최종 출력으로 간주됩니다.

Hello world 예제

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

OpenAI의 Agents SDK 풀기: 가이드

기술 구조

“OpenAI Agents SDK는 'Triage Agent'나 'CRM Agent'와 같은 다양한 에이전트가 도구 상호 작용과 위임 메커니즘을 통해 작업을 완료하기 위해 어떻게 협업할 수 있는지 보여주는 개념적 프레임워크를 목표로 합니다.”

Agents SDK의 핵심 구성 요소 및 아키텍처

OpenAI Agents SDK는 간결하면서도 강력한 원칙 집합을 기반으로 구축되었습니다. 핵심에는 다음 개념이 있습니다. 에이전트, 특정 지침으로 맞춤화되고 다양한 도구를 사용하도록 장착된 언어 모델의 인스턴스를 나타냅니다. 에이전트는 질문이나 작업 정의와 같은 사용자 요청을 수신한 다음 이러한 작업을 미리 정의된 도구를 사용하여 최종적으로 완전한 응답을 제공하는 하위 작업으로 나눕니다. 이러한 도구 호출 가능한 함수로 기능적으로 설명됩니다. Agents SDK를 활용하면 모든 Python 함수가 Pydantic을 통해 제공되는 입력 및 출력에 대한 자동 스키마 검증을 통해 원활하게 도구로 사용될 수 있습니다. 예를 들어, 데이터베이스 쿼리 도구 또는 웹 검색 도구를 나타내는 Python 함수는 에이전트의 툴킷에 직접 통합될 수 있습니다.

Agents SDK의 또 다른 핵심 부분은 다음과 같습니다. 에이전트 루프, 반복적인 작업 해결 프로세스를 정의합니다. 쿼리에 답하려는 초기 시도로 시작하여 에이전트는 충분한 정보가 있는지 또는 외부 작업을 수행해야 하는지 평가합니다. 필요한 경우 에이전트는 관련 도구를 호출하고 출력을 처리하고 작업을 다시 평가합니다. 이 주기는 에이전트가 "완료" 응답으로 작업 완료를 나타낼 때까지 반복됩니다. Agents SDK는 이 프로세스를 자율적으로 관리하여 도구 호출, 결과 처리 및 반복적 재시도와 같은 반복적인 작업을 자동화하여 개발 프로세스를 간소화합니다. 이를 통해 개발자는 기본 메커니즘에 대해 걱정하지 않고 워크플로 및 에이전트 기능을 정의하는 데 더 집중할 수 있습니다. OpenAI는 이 접근 방식을 다음과 같이 설명합니다. 파이썬-퍼스트, 도메인별 언어(DSL)보다 루프, 조건문, 함수 호출과 같은 익숙한 Python 구문 사용을 강조합니다. 이러한 유연성을 통해 개발자는 네이티브 Python 구문에 의존하면서 상호 연결된 에이전트를 조율할 수 있습니다.

핸드오프 및 멀티 에이전트 아키텍처

SDK의 기능은 개별 에이전트를 넘어섭니다. 핸드 오프, 작업은 여러 에이전트 간에 전송될 수 있으므로 원활하게 협업할 수 있습니다. 예를 들어, "Triage Agent"는 들어오는 쿼리의 특성을 결정하여 다른 전문 에이전트에게 위임하거나 한 에이전트의 출력이 다른 에이전트의 입력으로 작용할 수 있습니다. 이 시스템은 전문 에이전트가 더 광범위한 작업의 개별 부분을 실행하는 워크플로를 지원하여 복잡한 다중 에이전트 아키텍처를 강화합니다. OpenAI는 고객 지원 자동화, 연구 프로세스, 다단계 프로젝트, 콘텐츠 생성, 영업 운영 또는 심지어 코드 검토와 같은 확장 가능한 애플리케이션을 위한 툴킷을 설계했습니다. 또한, 가드 레일 에이전트 입력 또는 출력에 검증 규칙을 부과하여 신뢰성을 향상시킵니다. 예를 들어, 가드레일은 매개변수 형식 준수를 강제하거나 이상이 감지되면 루프를 조기에 종료하여 비효율적인 실행이나 실제 운영에서 바람직하지 않은 동작과 같은 위험을 줄일 수 있습니다.

오케스트레이션 및 모니터링

작업 실행을 넘어 Agents SDK에는 강력한 기능이 포함되어 있습니다. 오케스트레이션 기능을 통해 도구 실행, 데이터 흐름 및 루프 관리를 담당합니다. 높은 수준의 자동화에도 불구하고 OpenAI는 투명성을 우선시하여 개발자에게 에이전트 활동을 실시간으로 모니터링할 수 있는 도구를 제공합니다. 내장된 트레이싱 OpenAI 대시보드에서 액세스할 수 있는 기능을 통해 개발자는 도구가 호출되는 시점, 사용하는 입력 및 반환되는 출력을 관찰하여 워크플로를 단계별로 시각화할 수 있습니다. 이 플랫폼은 OpenAI의 모니터링 인프라를 활용하여 에이전트 로직의 실행을 추적 및 범위로 구분하여 에이전트 동작에 대한 세부적인 통찰력을 제공합니다. 이를 통해 개발자는 병목 현상을 진단하고, 문제를 디버깅하고, 워크플로를 최적화하고, 성능을 추적할 수 있습니다. 또한 추적 아키텍처는 정교한 평가를 지원하여 시간이 지남에 따라 에이전트 성능을 미세 조정하고 개선할 수 있습니다.

장점

OpenAI Agents SDK는 개별 개발자를 위한 것이 아니라 AI 에이전트 기반 제품을 구축하는 회사에도 상당한 이점을 제공합니다. 장점부터 시작해 보겠습니다.

빠른 프로토타입 제작 및 생산: Agents SDK는 최소한의 코드와 구성으로 복잡한 에이전트 동작을 구현하여 아이디어에서 제품으로의 주기를 단축합니다. 예를 들어, 주류 암호화폐 플랫폼인 Coinbase는 SDK를 사용하여 다중 에이전트 지원 시스템을 빠르게 프로토타입화하고 배포합니다. 마찬가지로 엔터프라이즈 검색 어시스턴트와 같은 분야에서 회사는 SDK의 웹 및 파일 검색 도구를 통합하여 가치를 빠르게 제공할 수 있습니다. 오케스트레이션 세부 정보를 오프로드함으로써 개발자는 제품별 기능에 집중할 수 있습니다.

개발 비용 절감: 처음부터 에이전트 시스템을 구축하려면 상당한 엔지니어링 투자가 필요합니다. Agents SDK는 루프 관리, API 호출 동기화, 오류 처리, LLM을 위한 포맷된 도구 출력 등 일반적인 요구 사항에 대한 기성 솔루션을 제공하여 비용을 절감합니다. 오픈 소스이므로 회사의 요구 사항을 충족하도록 사용자 정의할 수도 있습니다. 이는 스타트업에게 큰 도움이 되며, 제한된 리소스로 강력한 에이전트 중심 제품을 만들 수 있습니다.

추적성 및 디버깅: SDK의 통합 추적 대시보드는 비즈니스 애플리케이션을 혁신합니다. AI가 "블랙박스"라는 업계의 우려로 인해 이제 모든 에이전트 단계를 기록하고 감사할 수 있습니다. 고객 지원 에이전트가 잘못된 답변을 제공하면 추적은 어떤 도구 호출 또는 단계가 실패했는지 보여줍니다. OpenAI 플랫폼의 로그/추적 화면은 에이전트의 감사 가능성을 개선합니다. 이는 규제 또는 내부 감사를 받는 산업에서 매우 중요합니다. 이를 통해 회사는 필요할 때 결과를 설명할 수 있다는 것을 알고 더욱 확신을 가지고 AI를 통합할 수 있습니다.

OpenAI의 최신 모델과 도구에 액세스: Agents SDK를 사용한다는 것은 OpenAI의 최고 모델(예: GPT-4)과 현재 도구(웹 검색, 코드 실행)를 활용하는 것을 의미합니다. 이는 약한 모델에 의존할 수 있는 대안을 구축하는 것보다 품질 면에서 유리합니다. 높은 정확도나 최신 정보가 필요한 애플리케이션(예: 연구 지원자, 재무 분석 에이전트)의 경우 OpenAI 모델의 성능은 큰 이점입니다. OpenAI가 도구를 추가함에 따라(향후 더 많은 통합을 암시) SDK 사용자는 도구를 쉽게 채택할 수 있습니다.

CometAPI는 OpenAI 인터페이스 프로토콜과 완벽하게 호환되어 원활한 통합을 보장합니다. 모델 및 서비스 종속성(잠금 위험)을 피하고, 데이터 개인 정보 보호 및 보안 문제를 줄이고, 비용을 절감할 수 있습니다. OpenAI의 강력한 모델과 도구를 활용하면 비용이 많이 들고 때로는 성능이 제한될 수 있습니다. CometAPI는 더 저렴한 가격을 제공합니다.

관련 주제 CometAPI: 궁극의 AI 모델 통합 플랫폼

결론

OpenAI는 Responses API와 같은 혁신적인 제안을 통해 AI 역량을 발전시키는 데 전념합니다. 이러한 도구를 도입함으로써 기업과 개발자는 보다 스마트하고 적응력이 뛰어나며 신뢰성이 높은 AI 솔루션을 구축할 수 있는 기회를 얻습니다. 이러한 발전은 인공 지능이 계속해서 산업 전반에 걸쳐 영향력 있는 변화를 주도하고 새로운 가능성을 열어주는 미래를 보여줍니다.

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인