OpenAI представляет несколько новых предложений: Responses API, встроенные инструменты для поиска в Интернете и файлах, инструмент для использования компьютера и Agents SDK с открытым исходным кодом. В то время как Responses API позволяет разработчикам создавать агентов поверх своей технологии, Agents SDK может помочь им связать агентов с другими веб-инструментами и процессами, выполняя «рабочие процессы», которые делают то, что нужно пользователю или бизнесу, автономно.
2025 год часто называют «Годом агентов», а действия OpenAI рассматриваются как ключевой шаг для отрасли. Agents SDK позволяет разработчикам легко использовать последние достижения OpenAI (такие как улучшенное рассуждение, мультимодальные взаимодействия и новые методы безопасности) в реальных многошаговых сценариях. Для разработчиков LLM и создателей агентов ИИ Agents SDK предоставляет набор «строительных блоков» для создания и управления собственными автономными системами ИИ.
Значимость Agents SDK заключается в его способности решать проблемы развертывания агентов ИИ в производственных средах. Традиционно перевод мощных возможностей LLM в многошаговые рабочие процессы был трудоемким, требующим написания большого количества пользовательских правил, последовательного проектирования подсказок, проб и ошибок без надлежащего инструментария для наблюдения. С помощью Agents SDK и связанных с ним новых инструментов API, таких как Responses API, OpenAI стремится значительно упростить этот процесс, позволяя разработчикам создавать более сложные и надежные агенты с меньшими усилиями.

Что такое Agents SDK
OpenAI активно возвращается к открытому исходному коду с выпуском Agents SDK — набора инструментов, призванного помочь разработчикам управлять, координировать и оптимизировать рабочие процессы агентов — даже создавать агентов на основе других, не-OpenAI-моделей, таких как модели конкурентов Anthropic и Google, или моделей с открытым исходным кодом от DeepSeek, Qwen, Mistral и семейства Llama компании Meta.
Зачем использовать Agents SDK
SDK имеет два основных принципа проектирования:
- Достаточно функций, чтобы их можно было использовать, но недостаточно примитивов, чтобы их можно было быстро освоить.
- Работает отлично сразу из коробки, но вы можете настроить все под себя.
Вот основные возможности SDK:
- Цикл агента: встроенный цикл агента, который обрабатывает вызовы инструментов, отправляет результаты в LLM и выполняет цикл до тех пор, пока LLM не завершит работу.
- Python-first: используйте встроенные функции языка для организации и объединения агентов в цепочку вместо необходимости изучать новые абстракции.
- Передача полномочий: мощная функция координации и делегирования полномочий между несколькими агентами.
- Ограничения: проводите проверки и валидацию входных данных параллельно с вашими агентами, прерывая работу на ранней стадии, если проверки не пройдены.
- Инструменты функций: превратите любую функцию Python в инструмент с помощью автоматической генерации схемы и проверки на базе Pydantic.
- Трассировка: встроенная трассировка, которая позволяет визуализировать, отлаживать и контролировать рабочие процессы, а также использовать набор инструментов OpenAI для оценки, тонкой настройки и дистилляции.
Как это работает? Openai Agents SDK
- Настройте среду Python
python -m venv env
source env/bin/activate
- Установить агенты SDK
pip install openai-agents
- установите
OPENAI_API_KEYпеременная среды
Свободно установите OPENAI_API_KEY API от CometAPI
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API для доступа к учетным данным интерфейса. Нажмите «Добавить токен» в API-токене в личном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
- Выберите
OPENAI_API_KEYконечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получаются из наш веб-сайт API документ. Для вашего удобства наш сайт также предлагает тест Apifox.
- Настройте своего агента
Определите, какие инструменты может использовать ваш ИИ. Допустим, мы хотим включить веб-поиск и поиск файла:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=)
Теперь ваш агент знает, как искать в Интернете и получать документы.
5. запустить
В отличие от традиционных чат-ботов, этот ИИ решает, какой инструмент использовать, основываясь на данных, полученных от пользователя:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("Latest AI research papers")
print(response)
Никакого ручного вмешательства — просто автономное исполнение.
Цикл Агента
Когда вы звоните Runner.run(), SDK выполняет цикл, пока не получит конечный результат:
- LLM вызывается с использованием модели и настроек агента, а также истории сообщений.
- LLM возвращает ответ, который может включать вызовы инструментов.
- Если ответ имеет окончательный вывод, цикл завершается и возвращает его.
- Если ответ содержит передачу обслуживания, агент переключается на нового агента, и цикл продолжается с шага 1.
- Вызовы инструментов обрабатываются (если есть) и добавляются сообщения об ответах инструментов. Затем цикл продолжается с шага 1.
Вы можете использовать max_turns параметр для ограничения количества выполнений цикла.
Окончательный вывод
Конечный вывод — это последнее, что агент производит в цикле:
- Если вы установите
output_typeна агенте конечный результат — это когда LLM возвращает что-то подобное, используя структурированные результаты. - Если нет
output_type(т.е. ответы в виде простого текста), то первый ответ LLM без каких-либо вызовов инструментов или передач считается окончательным результатом.
Привет, мир, пример
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

Техническая структура
«SDK OpenAI Agents призван стать концептуальной структурой, демонстрирующей, как различные агенты, такие как «агент сортировки» или «агент CRM», могут сотрудничать для выполнения задач посредством взаимодействия инструментов и механизмов делегирования».
Основные компоненты и архитектура Agents SDK
OpenAI Agents SDK построен на кратком, но надежном наборе принципов. В его основе лежит концепция Агент, который представляет собой пример языковой модели, адаптированной под конкретные инструкции и оснащенной для использования различных инструментов. Агенты начинают с получения запросов пользователей — таких как вопросы или определения задач — затем разбивают эти задачи на подзадачи, которые могут включать использование предопределенных инструментов, в конечном итоге предоставляя полный ответ. Эти Инструменты функционально описываются как вызываемые функции; используя Agents SDK, любая функция Python может легко служить инструментом с автоматической проверкой схемы для входов и выходов, предоставляемой через Pydantic. Например, функции Python, представляющие инструмент запроса базы данных или инструмент веб-поиска, могут быть напрямую интегрированы в набор инструментов агента.
Еще одной центральной частью Agents SDK является Агент Луп, который определяет итеративный процесс разрешения задач. Начиная с первой попытки ответить на запрос, агент оценивает, достаточно ли у него информации или необходимо выполнить внешние действия. При необходимости агент вызывает соответствующий инструмент, обрабатывает вывод и повторно оценивает задачу. Этот цикл повторяется до тех пор, пока агент не подтвердит завершение задачи ответом «Я закончил». Agents SDK управляет этим процессом автономно, упрощая процесс разработки за счет автоматизации повторяющихся задач, таких как вызов инструмента, обработка результатов и итеративные повторные попытки. Это позволяет разработчикам больше сосредоточиться на определении рабочих процессов и возможностей агента, не беспокоясь о базовой механике. OpenAI описывает этот подход как Python-первый, подчеркивая использование знакомых конструкций Python — таких как циклы, условные операторы и вызовы функций — по сравнению с доменно-специфичными языками (DSL). Благодаря этой гибкости разработчики могут организовывать взаимосвязанные агенты, полагаясь на собственный синтаксис Python.
Передача обслуживания и многоагентная архитектура
Возможности SDK выходят за рамки отдельных агентов. Благодаря функции, известной как Передать, задачи могут передаваться между несколькими агентами, что позволяет им беспрепятственно сотрудничать. Например, «агент сортировки» может определять характер входящего запроса, делегируя его другому специализированному агенту, или выходные данные одного агента могут служить входными данными для другого. Эта система поддерживает рабочие процессы, в которых специализированные агенты выполняют отдельные части более широкой задачи, расширяя возможности сложных многоагентных архитектур. OpenAI разработала набор инструментов для масштабируемых приложений, таких как автоматизация поддержки клиентов, исследовательские процессы, многошаговые проекты, создание контента, операции по продажам или даже обзоры кода. Кроме того, защитное ограждение повышают надежность, налагая правила проверки на входы или выходы агента. Например, ограничители могут обеспечивать соответствие формату параметров или завершать цикл на ранней стадии при обнаружении аномалий, снижая такие риски, как неэффективное выполнение или нежелательное поведение в реальных операциях.
Оркестровка и мониторинг
Помимо выполнения задач, Agents SDK включает в себя надежные оркестровка функции, беря на себя ответственность за выполнение инструмента, потоки данных и управление циклами. Несмотря на высокий уровень автоматизации, OpenAI отдает приоритет прозрачности, предоставляя разработчикам инструменты для мониторинга активности агентов в реальном времени. Благодаря встроенному трассировка Функция, доступная на панели инструментов OpenAI, позволяет разработчикам визуализировать рабочие процессы шаг за шагом, наблюдая за тем, когда вызываются инструменты, какие входные данные они используют и какие выходные данные они возвращают. Платформа использует инфраструктуру мониторинга OpenAI для разбиения выполнения логики агента на трассировки и интервалы, предлагая детальное понимание поведения агента. Это позволяет разработчикам диагностировать узкие места, устранять неполадки, оптимизировать рабочие процессы и отслеживать производительность. Более того, архитектура трассировки поддерживает сложные оценки, позволяя со временем настраивать и улучшать производительность агента.
Наши преимущества
OpenAI Agents SDK предназначен не только для индивидуальных разработчиков, он также обеспечивает значительные преимущества компаниям, создающим продукты на основе агентов ИИ. Начнем с преимуществ:
Быстрое прототипирование и производство: Agents SDK реализует сложное поведение агентов с минимальным кодом и конфигурацией, сокращая цикл от идеи до продукта. Например, популярная криптоплатформа Coinbase использует SDK для быстрого прототипирования и развертывания многоагентных систем поддержки. Аналогичным образом, в таких областях, как помощники по поиску на предприятии, компании могут интегрировать веб- и файловые инструменты поиска SDK для быстрого предоставления ценности. Разгружая детали оркестровки, разработчики могут сосредоточиться на функциях, специфичных для продукта.
Снижение затрат на разработку: Создание агентской системы с нуля требует значительных инженерных инвестиций. Agents SDK снижает затраты, предоставляя готовые решения для общих потребностей — управление циклами, синхронизация вызовов API, обработка ошибок и форматированный вывод инструмента для LLM. Будучи открытым исходным кодом, он также допускает настройку в соответствии с потребностями компании. Это благо для стартапов, позволяя им создавать мощные продукты на основе агентов с ограниченными ресурсами.
Прослеживаемость и отладка: Интегрированная панель отслеживания SDK преобразует бизнес-приложения. Отраслевые опасения относительно того, что ИИ является «черным ящиком», теперь позволяют регистрировать и проверять каждый шаг агента. Если агент службы поддержки клиентов дает неправильный ответ, трассировка показывает, какой вызов инструмента или шаг не удался. Экран журнала/трассировки платформы OpenAI повышает проверяемость агентов, что критически важно в отраслях, подлежащих регулированию или внутреннему аудиту. Это позволяет компаниям с большей уверенностью интегрировать ИИ, зная, что они могут объяснить результаты при необходимости.
Доступ к новейшим моделям и инструментам OpenAI: Использование Agents SDK означает использование лучших моделей OpenAI (например, GPT-4) и текущих инструментов (веб-поиск, выполнение кода). Это обеспечивает качественное преимущество по сравнению с созданием альтернатив, которые могут полагаться на более слабые модели. Для приложений, которым требуется высокая точность или актуальная информация (например, научные сотрудники, агенты финансового анализа), производительность моделей OpenAI является большим преимуществом. Поскольку OpenAI добавляет инструменты (намекая на большее количество интеграций в будущем), пользователи SDK могут легко их принять.
CometAPI полностью совместим с интерфейсным протоколом OpenAI, что обеспечивает бесшовную интеграцию. Вы можете избежать зависимостей моделей и служб (риск блокировки), уменьшить проблемы конфиденциальности и безопасности данных и сократить расходы. Использование мощных моделей и инструментов OpenAI может быть дорогим и иногда ограничивать производительность. CometAPI предлагает более низкие цены.
Похожие темы CometAPI: лучшая платформа для интеграции моделей ИИ
Заключение
OpenAI стремится развивать возможности ИИ с помощью инновационных предложений, таких как API Responses. Внедряя эти инструменты, компании и разработчики получают возможность создавать более умные, адаптивные и высоконадежные решения ИИ. Эти разработки указывают на будущее, в котором искусственный интеллект продолжит вносить существенные изменения и открывать новые возможности в различных отраслях.



