OpenAI는 Responses API, 웹 및 파일 검색용 내장 도구, 컴퓨터 사용 도구, 그리고 오픈 소스 Agents SDK 등 여러 신규 오퍼링을 출시하고 있다. Responses API는 개발자가 자사 기술 위에 에이전트를 구축하도록 돕고, Agents SDK는 에이전트를 다른 웹 도구와 프로세스에 연결해 사용자나 비즈니스가 원하는 “워크플로우”를 자율적으로 수행하도록 해준다.
2025년은 흔히 “에이전트의 해”로 불리며, OpenAI의 이번 조치는 업계를 위한 핵심적인 단계로 여겨진다. Agents SDK는 향상된 추론, 멀티모달 상호작용, 새로운 안전 기법 등 OpenAI의 최신 성과를 현실 세계의 다단계 시나리오에서 쉽게 활용할 수 있게 한다. LLM 개발자와 AI 에이전트 빌더에게 Agents SDK는 자율형 AI 시스템을 만들고 관리하기 위한 일련의 “빌딩 블록”을 제공한다.
Agents SDK의 의의는 프로덕션 환경에 AI 에이전트를 배포할 때 직면하는 과제를 해결하는 데 있다. 전통적으로 강력한 LLM 기능을 다단계 워크플로우로 변환하려면 많은 수작업, 규칙 작성, 순차 프롬프트 설계, 그리고 적절한 가시성 도구 없이 시행착오를 반복해야 했다. Agents SDK와 Responses API 같은 관련 신규 API 도구를 통해 OpenAI는 이 과정을 크게 단순화하여, 개발자가 더 적은 노력으로 더 복잡하고 신뢰할 수 있는 에이전트를 구축할 수 있도록 한다.

Agents SDK란 무엇인가
OpenAI는 Agents SDK를 공개하며 오픈 소스로의 복귀에 속도를 내고 있다. 이 툴킷은 개발자가 에이전트 워크플로우를 관리, 조정, 최적화하도록 설계되었으며, 경쟁사인 Anthropic과 Google의 모델이나 DeepSeek, Qwen, Mistral, Meta의 Llama 제품군 같은 오픈 소스 모델로 구동되는 에이전트까지도 구축할 수 있게 해준다.
왜 Agents SDK를 사용하나
이 SDK는 두 가지 핵심 설계 원칙을 따른다:
- 쓸 만한 기능은 충분히 제공하되, 학습이 빠르도록 원시 구성 요소는 적게.
- 바로 써도 훌륭하게 작동하지만, 원하는 동작을 정확히 커스터마이즈 가능.
SDK의 주요 기능은 다음과 같다:
- 에이전트 루프: 도구 호출, 결과를 LLM에 전달, LLM이 완료될 때까지 반복을 처리하는 내장 루프.
- Python 우선: 새로운 추상화를 배울 필요 없이, 내장 언어 기능으로 에이전트를 오케스트레이션하고 체이닝.
- 핸드오프: 여러 에이전트 간 조정과 위임을 가능하게 하는 강력한 기능.
- 가드레일: 입력 검증과 체크를 에이전트와 병렬로 실행하며, 실패 시 조기에 중단.
- 함수 도구: 어떤 Python 함수든 자동 스키마 생성과 Pydantic 기반 검증으로 도구로 변환.
- 트레이싱: 워크플로우를 시각화·디버그·모니터링하고, OpenAI의 평가·파인튜닝·증류 도구를 활용할 수 있는 내장 트레이싱.
OpenAI Agents SDK 사용 방법
- Python 환경 설정
python -m venv env
source env/bin/activate
- Agents SDK 설치
pip install openai-agents
OPENAI_API_KEY환경 변수를 설정
CometAPI에서 OPENAI_API_KEY API를 자유롭게 설정
- 로그인 하여 cometapi.com에 접속하세요. 아직 사용자라면 먼저 등록해 주세요.
- 인터페이스의 액세스 자격 API 키 받기. 개인 센터의 API token에서 “Add Token”을 클릭해 토큰 키 sk-xxxxx를 발급받아 제출합니다.
- 사이트 URL 받기: https://api.cometapi.com/
OPENAI_API_KEY엔드포인트를 선택해 API 요청을 전송하고 요청 본문을 설정합니다. 요청 방식과 요청 본문은 우리 웹사이트 API 문서에서 확인할 수 있습니다. 편의를 위해 Apifox 테스트도 제공합니다.
- 에이전트 설정
AI가 사용할 수 있는 도구를 정의합니다. 예를 들어, 웹 검색과 파일 검색을 활성화해 봅시다:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=)
이제 에이전트가 웹을 검색하고 문서를 가져올 수 있습니다.
5. 실행
기존 챗봇과 달리, 이 AI는 사용자 입력에 따라 사용할 도구를 스스로 결정합니다:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("Latest AI research papers")
print(response)
수동 개입 없음 — 오직 자율 실행.
에이전트 루프
Runner.run()을 호출하면, SDK는 최종 출력이 나올 때까지 루프를 실행합니다:
- 에이전트의 모델과 설정, 메시지 히스토리로 LLM을 호출합니다.
- LLM이 응답을 반환하며, 여기에 도구 호출이 포함될 수 있습니다.
- 응답이 최종 출력을 포함하면, 루프는 종료되고 이를 반환합니다.
- 응답에 핸드오프가 있으면, 에이전트가 새 에이전트로 전환되고 1단계부터 루프를 이어갑니다.
- 도구 호출이 있으면 처리하고 도구 응답 메시지를 추가합니다. 그런 다음 1단계부터 루프를 계속합니다.
max_turns 파라미터로 루프 실행 횟수를 제한할 수 있습니다.
최종 출력
최종 출력은 루프에서 에이전트가 마지막으로 생성하는 것입니다:
- 에이전트에
output_type을 설정했다면, LLM이 구조화된 출력으로 해당 타입을 반환할 때가 최종 출력입니다. output_type이 없으면(즉, 일반 텍스트 응답), 도구 호출이나 핸드오프 없이 처음 반환되는 LLM 응답이 최종 출력으로 간주됩니다.
Hello world 예제
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

기술 구조
“OpenAI Agents SDK는 ‘분류 에이전트(Triage Agent)’나 ‘CRM 에이전트’ 같은 서로 다른 에이전트가 도구 상호작용과 위임 메커니즘을 통해 협업하여 작업을 완수하는 방식을 보여주는 개념적 프레임워크를 지향합니다.”
Agents SDK의 핵심 구성 요소와 아키텍처
OpenAI Agents SDK는 간결하면서도 견고한 원칙 위에 구축되었다. 핵심에는 특정 지침으로 맞춤화되고 다양한 도구를 사용할 수 있는 언어 모델 인스턴스를 나타내는 에이전트(Agent) 개념이 있다. 에이전트는 사용자 요청(질문이나 작업 정의 등)을 받은 뒤 이를 미리 정의된 도구 사용이 수반될 수 있는 하위 작업으로 분해하고, 최종적으로 완결된 응답을 제공한다. 도구(Tools) 는 호출 가능한 함수로 기능적으로 기술되며, Agents SDK를 활용하면 어떤 Python 함수든 도구로 매끄럽게 사용할 수 있고, Pydantic을 통해 입력과 출력에 대한 자동 스키마 검증이 제공된다. 예를 들어 데이터베이스 쿼리 도구나 웹 검색 도구를 나타내는 Python 함수를 에이전트 툴킷에 직접 통합할 수 있다.
Agents SDK의 또 다른 중심 요소는 에이전트 루프(Agent Loop) 로, 작업을 해결하는 반복적 프로세스를 정의한다. 초기 질의 응답 시도에서 시작해, 에이전트는 충분한 정보가 있는지 혹은 외부 작업이 필요한지를 평가한다. 필요할 경우 관련 도구를 호출하고, 출력을 처리한 뒤 작업을 재평가한다. 이 사이클은 에이전트가 “I’m done” 응답으로 완료를 표시할 때까지 반복된다. Agents SDK는 도구 호출, 결과 처리, 반복 재시도 같은 반복 업무를 자동화해 이 과정을 자율적으로 관리한다. 덕분에 개발자는 내부 메커니즘을 걱정하기보다 워크플로우와 에이전트 능력 정의에 더 집중할 수 있다. OpenAI는 이를 Python 우선(Python-first) 접근으로 설명하며, 도메인 특화 언어(DSL)보다 루프, 조건문, 함수 호출 같은 친숙한 Python 구문을 강조한다. 이 유연성을 통해 개발자는 네이티브 Python 문법에 의존하면서 상호 연결된 에이전트들을 오케스트레이션할 수 있다.
핸드오프와 멀티 에이전트 아키텍처
SDK의 역량은 단일 에이전트를 넘어선다. 핸드오프(Handoff) 기능을 통해 여러 에이전트 간에 작업을 전환할 수 있어 매끄러운 협업이 가능하다. 예를 들어 “분류 에이전트”가 들어오는 질의의 성격을 파악해 다른 특화 에이전트에 위임할 수 있고, 한 에이전트의 출력이 다른 에이전트의 입력으로 작동할 수 있다. 이 시스템은 특화 에이전트들이 광범위한 작업의 각 부분을 수행하는 워크플로우를 지원하여 복잡한 멀티 에이전트 아키텍처를 가능하게 한다. 또한 가드레일(Guardrails) 은 에이전트 입력 또는 출력에 대한 검증 규칙을 부여해 신뢰성을 높인다. 예를 들어 가드레일은 파라미터 형식 준수를 강제하거나 이상이 감지될 때 루프를 조기에 종료해, 비효율적 실행이나 바람직하지 않은 동작 같은 실제 운영상의 위험을 줄인다.
오케스트레이션과 모니터링
작업 실행을 넘어, Agents SDK는 도구 실행, 데이터 흐름, 루프 관리를 책임지는 강력한 오케스트레이션 기능을 제공한다. 높은 수준의 자동화에도 불구하고 OpenAI는 투명성을 중시하며, 개발자가 에이전트 활동을 실시간으로 모니터링할 수 있는 도구를 제공한다. OpenAI 대시보드에서 접근 가능한 내장 트레이싱(Tracing) 을 통해 개발자는 도구가 언제 호출되었는지, 어떤 입력을 사용했는지, 어떤 출력을 반환했는지를 단계별로 시각화할 수 있다. 이 플랫폼은 에이전트 로직의 실행을 트레이스와 스팬으로 분해하는 OpenAI의 모니터링 인프라를 활용하여, 에이전트 행동에 대한 세밀한 통찰을 제공한다. 이를 통해 병목을 진단하고, 문제를 디버그하며, 워크플로우를 최적화하고, 성능을 추적할 수 있다. 더 나아가 트레이싱 아키텍처는 정교한 평가를 지원하여, 시간에 따른 에이전트 성능의 파인튜닝과 개선을 가능하게 한다.
장점
OpenAI Agents SDK는 개인 개발자뿐 아니라 에이전트 기반 제품을 구축하는 기업에도 큰 이점을 제공한다. 다음은 그 장점들이다:
빠른 프로토타이핑과 프로덕션: Agents SDK는 최소한의 코드와 구성으로 복잡한 에이전트 동작을 구현해 아이디어에서 제품까지의 사이클을 단축한다. 예를 들어, 대표적 크립토 플랫폼 Coinbase는 SDK를 사용해 멀티 에이전트 지원 시스템을 신속히 프로토타이핑하고 배포한다. 유사하게 엔터프라이즈 검색 어시스턴트 분야에서도, 기업은 SDK의 웹 및 파일 검색 도구를 통합해 빠르게 가치를 전달할 수 있다. 오케스트레이션 세부 구현을 덜어주므로, 개발자는 제품 고유 기능에 집중할 수 있다.
개발 비용 절감: 에이전트 시스템을 처음부터 구축하려면 상당한 엔지니어링 투자가 필요하다. Agents SDK는 루프 관리, API 호출 동기화, 에러 처리, LLM용 포맷된 도구 출력 등 공통 요구에 대한 기성 솔루션을 제공하여 비용을 줄인다. 오픈 소스이므로 기업의 요구에 맞게 커스터마이즈할 수도 있다. 이는 제한된 자원으로 강력한 에이전트 기반 제품을 만들려는 스타트업에 큰 도움이 된다.
추적 가능성과 디버깅: SDK의 통합 추적 대시보드는 비즈니스 애플리케이션을 변화시킨다. AI가 “블랙박스”라는 업계 우려에 대해, 이제 모든 에이전트 단계를 기록하고 감사할 수 있다. 고객 지원 에이전트가 오답을 내면, 어떤 도구 호출 혹은 단계가 실패했는지 트레이스가 보여준다. OpenAI 플랫폼의 로그/트레이스 화면은 에이전트의 감사 가능성을 개선하며 — 규제나 내부 감사를 받는 산업에서 특히 중요하다. 기업은 필요할 때 결과를 설명할 수 있다는 확신을 갖고 AI를 더 자신 있게 통합할 수 있다.
OpenAI 최신 모델과 도구 접근: Agents SDK를 사용하면 OpenAI의 최상급 모델(예: GPT-4)과 최신 도구(웹 검색, 코드 실행 등)를 활용할 수 있다. 이는 성능이 약한 모델에 의존할 수 있는 대안 대비 품질 상의 이점을 제공한다. 최신 정보가 필요한 애플리케이션(예: 연구 어시스턴트, 재무 분석 에이전트)에서는 OpenAI 모델의 성능이 큰 장점이다. OpenAI가 더 많은 통합을 예고하며 도구를 추가함에 따라, SDK 사용자는 손쉽게 이를 채택할 수 있다.
CometAPI는 OpenAI 인터페이스 프로토콜과 완전히 호환되어 매끄러운 통합을 보장한다. 이를 통해 모델과 서비스 종속(락인) 위험을 피하고, 데이터 프라이버시 및 보안 우려를 줄이며, 비용을 절감할 수 있다. OpenAI의 강력한 모델과 도구를 활용하는 것은 비용이 높거나 때로 성능에 제약이 될 수 있다. CometAPI는 더 저렴한 가격을 제공한다.
결론
OpenAI는 Responses API와 같은 혁신적 오퍼링으로 AI 역량을 발전시키는 데 전념하고 있다. 이러한 도구의 도입으로 기업과 개발자는 더욱 스마트하고, 적응력이 뛰어나며, 고신뢰의 AI 솔루션을 구축할 수 있는 기회를 얻게 된다. 이 변화는 인공지능이 다양한 산업 전반에서 의미 있는 변화를 주도하고 새로운 가능성을 열어 가는 미래를 예고한다.
