OpenAI с радостью выпускает ChatGPT Agent

Компания OpenAI официально представила свою новейшую разработку в области повышения производительности на основе искусственного интеллекта: ChatGPT Agent. Эта новая функция превращает ChatGPT из голосового помощника в проактивного цифрового агента, способного автономно выполнять сложные многоэтапные задачи от имени пользователей. Анонс, сделанный во время прямой трансляции с участием генерального директора Сэма Альтмана, позиционирует ChatGPT Agent как значительный шаг вперед в развитии ИИ-инструментов и знаменует собой поворотный момент в развитии интеллектуальных помощников.

Ключевые возможности

Агент ChatGPT интегрирует среду «виртуального компьютера», позволяя ему анализировать, планировать и выполнять задачи в веб-интерфейсах, документах и сторонних сервисах без ручного вмешательства. Основные функции включают:

Просмотр веб-страниц и исследования: Проводит углубленные исследования общедоступных веб-сайтов и загруженных файлов, собирая и обобщая информацию.
Заполнение форм и транзакции: заполняет онлайн-формы, размещает заказы и управляет бронированиями (например, бронированием авиабилетов, бронированием ужинов) с помощью одобренных пользователем действий.
Генерация документов и слайдов: Создает редактируемые презентации PowerPoint и электронные таблицы Excel, позволяя пользователям получать полностью отформатированные результаты непосредственно от агента.

Как это работает

Пользователи могут активировать ChatGPT Agent с помощью переключателя «Режим агента» в раскрывающемся меню инструментов интерфейса ChatGPT. После включения агент комментирует свои действия в режиме реального времени, обеспечивая прозрачность каждого этапа процесса. В любой момент пользователи сохраняют полный контроль: разрешения явно запрашиваются перед любым последующим действием (например, отправкой электронных писем, совершением покупок), а задачи можно прерывать или перенаправлять в ходе выполнения.

Эта функция использует «коннекторы» для взаимодействия с учётными записями пользователей и сторонними приложениями. Коннекторы оптимизируют рабочие процессы (например, управление календарём или составление сводки по входящим сообщениям), а запросы на ручной вход обеспечивают надёжную защиту безопасности и конфиденциальности данных.

Эволюция от оператора и глубокого исследования

ChatGPT Agent основан на более ранних инструментах OpenAI — Operator и Deep Research, — объединяя их сильные стороны в единую платформу. Браузерная автоматизация Operator была интегрирована в виртуальный браузер Agent, а автономный веб-анализ Deep Research теперь является неотъемлемой частью инструментария агента. Поскольку автономный интерфейс Operator будет устарел в ближайшие недели, пользователи перейдут на более универсальную среду Agent для всех задач агента.

Наличие и доступ

ChatGPT Agent изначально доступен подписчикам на Pro, Дополнительная и Команду Уровни ChatGPT. Активация так же проста, как выбор «Режим агента» в раскрывающемся списке инструментов или ввод /agent Команды в любом сеансе чата. Внедрение для пользователей Plus и Team может быть растянуто на несколько дней, а полная доступность в Европейской экономической зоне (ЕЭЗ) и Швейцарии ожидается позднее летом 2025 года. Клиенты Enterprise и Education могут рассчитывать на доступ в ближайшем будущем в рамках поэтапной стратегии развертывания OpenAI.

Меры безопасности и конфиденциальности

Решая проблемы, связанные с автономными действиями ИИ, компания OpenAI встроила в агент ChatGPT несколько уровней безопасности:

Явное согласие: Любое действие, влияющее на реальные системы, требует четкого запроса на разрешение.
Прерываемость: Пользователи могут останавливать или отменять задачи на любом этапе, обеспечивая соответствие своим целям.
Отметка риска: Система помечает потенциально опасные или неэтичные запросы, приостанавливая выполнение и уведомляя пользователей о необходимости подтверждения.

Эти меры подчеркивают приверженность OpenAI ответственному внедрению ИИ и направлены на минимизацию ошибок или неправильного использования в сложных рабочих процессах.

Первые шаги

CometAPI предоставляет унифицированный интерфейс REST, который объединяет сотни моделей ИИ — в рамках единой конечной точки, со встроенным управлением ключами API, квотами использования и панелями выставления счетов. Вместо жонглирования несколькими URL-адресами поставщиков и учетными данными.

Во время ожидания разработчики могут получить доступ O4-Mini API ,API O3 и API GPT-4.1 через CometAPI, последние модели указаны на дату публикации статьи. Для начала изучите возможности модели в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.

Заключение

ChatGPT Agent от OpenAI представляет собой поворотный момент в развитии разговорного ИИ, превращая пассивные диалоговые системы в проактивных цифровых партнёров, способных выполнять сквозные задачи. Объединяя возможности глубокого исследования с безопасными действиями, основанными на разрешениях, OpenAI стремится создать помощника нового поколения, способного критически мыслить и принимать решительные меры от имени пользователей. По мере внедрения этой функции в тарифных планах Pro, Plus и Team, а в конечном итоге и в корпоративном секторе, более широкая технологическая экосистема будет внимательно следить за тем, как агентный ИИ меняет производительность, нормы конфиденциальности и динамику конкуренции в сфере программного обеспечения. Для полной реализации потенциала ChatGPT Agent и защиты от непредвиденных последствий будет необходимо постоянно уделять особое внимание мерам безопасности и этическим нормам.