OpenAI DevDay 2025: руководство для разработчиков по новому операционному уровню ИИ

CometAPI
AnnaOct 8, 2025
OpenAI DevDay 2025: руководство для разработчиков по новому операционному уровню ИИ

OpenAI DevDay 2025 — это динамичная выставка разработчиков (состоявшаяся в начале октября 2025 года), на которой OpenAI представила широкий спектр продуктов, наборов инструментов, SDK и релизов моделей, призванных превратить компанию из поставщика моделей в оператора платформы: приложения, работающие в ChatGPT, конструктор агентов с функцией перетаскивания (AgentKit), общедоступный Codex для рабочих процессов разработчиков и новый набор уровней моделей (включая GPT-5 Pro и Sora 2 для видео), предназначенных непосредственно для интеграции на уровне производства. Теперь давайте рассмотрим, что OpenAI представила на этой конференции, и какие прорывы она привнесет в современную индустрию ИИ. Это также руководство для разработчиков.

Почему OpenAI DevDay 2025 важен?

DevDay 2025 важен, поскольку он меняет представление о том, где и как будут создаваться и распространяться приложения в мире искусственного интеллекта. Вместо того, чтобы рассматривать модели как бэкенд-функции, вызываемые разработчиками через API, OpenAI использует уровень пользовательского опыта — ChatGPT — в качестве платформы для размещения интерактивных приложений. Этот сдвиг имеет три последствия:

  1. Распространение: Разработчики могут охватить огромную аудиторию ChatGPT непосредственно в чате, а не полагаться только на традиционные магазины приложений или веб-каналы.
  2. Состав: Приложения, агенты и модели становятся компонуемыми строительными блоками. Вы можете объединить модель специалиста по предметной области, агента, объединяющего этапы задач, и диалоговый пользовательский интерфейс в единый продукт.
  3. Переписывание инженерной парадигмы: От «написания кода для создания функций» до «организации интеллектуальных агентов + автоматизированной оценки» процесс разработки стал детализированным, визуализированным и стандартизированным.

Что такое новый Apps SDK и что он позволяет?

Что такое Apps SDK?

Apps SDK — это набор инструментов разработчика OpenAI для создания интерактивные приложения, которые находятся внутри ChatGPT. Вместо ссылок на веб-страницы или возврата статических данных приложения, созданные с помощью SDK, можно вызывать из беседы, отображать интерактивный пользовательский интерфейс внутри ChatGPT, принимать последующие запросы и, что особенно важно, сохранять контекст в течение всего сеанса чата, чтобы приложение и языковая модель могли бесперебойно взаимодействовать.

Особенность:

  • Встраивание приложения в чат: Приложения отображаются внутри ChatGPT, что позволяет пользователям выполнять многоэтапные задачи (например, создать постер в Canva, а затем превратить его в презентацию), не выходя из беседы.
  • Контекстуальная непрерывность: Приложения получают структурированный контекст (через Model Context Protocol / MCP), поэтому они ведут себя как полноценные участники чата, а не как разовые интеграции.
  • Режим разработчика и предварительный просмотр: Разработчики могут тестировать приложения в режиме разработчика, быстро выполнять итерации и отправлять на проверку по мере готовности.
  • Сантехника для коммерции и монетизации (скоро): OpenAI обозначил коммерческие возможности, благодаря которым приложения могут продавать товары/услуги в чате, а разработчики в конечном итоге смогут монетизировать свои приложения.
  • Инструменты для данных и разрешений: SDK определяет шаблоны для запроса у пользователя подключения учетных записей и предоставления доступа к данным, когда стороннему приложению необходимо выполнить действие или прочитать данные, со встроенными потоками для согласия и обмена токенами.

Почему Apps SDK так важен

Используя ChatGPT в качестве среды размещения для сторонних приложений, OpenAI переосмысливает продукт из голосового помощника в время выполнения — «операционная система» для диалогового взаимодействия. Для разработчиков это снижает нагрузку: вместо создания отдельного пользовательского интерфейса и воронки распространения они могут писать простую логику приложения и использовать возможности ChatGPT для поиска и диалогового взаимодействия. Для команд разработчиков и предприятий это меняет подход к архитектуре функций: вместо встраивания модели в веб-сайт можно встроить продукт в диалоговую структуру, которая поддерживает последующие действия, уточнения и мультимодальные результаты.

OpenAI пытается превратить «естественный язык» в новый универсальный уровень пользовательского интерфейса. В рамках этого уровня приложение определяется не как «набор страниц», а как «набор возможностей + контекст + транзакционные возможности». Это эквивалентно объединению «браузера + магазина приложений + оформления заказа + SDK» в диалог. Целью OpenAI является не замена нативных приложений, а реструктуризация цепочки: размещение «первого контакта» в ChatGPT и резервирование «глубокого использования» для внешних приложений (полноэкранный режим, перенаправления).

Что такое AgentKit и как он меняет разработку агентов?

Что такое AgentKit?

AgentKit — это новый набор инструментов OpenAI для создания, развертывания и оптимизации агентных приложений — программных агентов, которые могут планировать, действовать и взаимодействовать автономно от имени пользователей. AgentKit объединяет примитивы разработчика для декомпозиции задач, использования инструментов и оценки поведения агентов. OpenAI позиционирует AgentKit как «инфраструктуру для агентов», позволяющую разработчикам создавать надежные, проверяемые и простые в итерациях агенты.

Каковы основные функции AgentKit?

  • Визуальный конструктор агентов: холст для соединения логических узлов, определения потоков и координации нескольких агентов без ручного кодирования каждой детали координации.
  • Соединители инструментов и API: готовые адаптеры для связи агентов с внешними службами (API, базы данных, веб-перехватчики), позволяющие выполнять реальные действия.
  • Оценка и ограждения: Интегрированные функции оценки и трассировки позволяют группам оценивать трассировки агентов, обнаруживать регрессии и настраивать поведение подсказок/цепочки.
  • Развертывание и наблюдаемость: встроенные примитивы развертывания и телеметрия для мониторинга производительности агентов и сбоев в производстве.

Почему AgentKit так важен?

На практике проблемы с агентами связаны с надёжностью и безопасностью — как обеспечить агенту возможность действовать в реальном мире без непредвиденных побочных эффектов. AgentKit стремится сделать эти вопросы приоритетными для инженеров: предоставляя стандартизированные шаблоны для доступа к инструментам, управления контекстом и оценки, мы снижаем непредсказуемость и сокращаем циклы разработки. Для организаций, создающих автоматизированные рабочие процессы, помощников клиентов или системы поддержки принятия решений, AgentKit служит основой, превращающей хрупкие прототипы агентов в сервисы промышленного уровня.

Что такое Codex и что изменилось на DevDay?

Что такое Кодекс?

Codex — это специализированный продукт OpenAI для помощи разработчикам в написании кода: набор возможностей моделирования, инструментов CLI и интеграций (плагинов редактора, CI-хуков), предназначенных для ускорения разработки, проверки и поддержки кода. На DevDay OpenAI объявила Кодекс общедоступный, переведя его из категории предварительного просмотра/внутреннего использования в категорию поддержки производства для инженерных групп.

Каковы основные функции Codex после обновления?

  • Генерация контекстно-зависимого кода: Codex может генерировать код на основе полного контекста репозитория (а не только короткого окна подсказки) и следовать ограничениям стиля и архитектуры.
  • Циклы редактирования в реальном времени и обратной связи с разработчиками: Разработчики могут итерировать код, указав Codex провести рефакторинг, добавить тесты или реализовать функции с помощью демонстраций с живой перезагрузкой в ​​песочницах разработки.
  • Интеграция с приложениями и агентами: Codex может вызываться агентами или приложениями для написания связующего кода, реагирования на ошибки времени выполнения или автоматического синтеза клиентов API.
  • Специализированные модели: Запускать на GPT5-CODEX, преуспевают в рефакторинге и обзоре кода, а также могут корректировать «время обдумывания» в зависимости от сложности задачи.
  • Длительные задачи: Способен выполнять задачи непрерывно в течение более десяти минут и дольше.
  • Совместная работа с несколькими терминалами: унифицированная IDE, терминал, GitHub и облако; недавно добавленная интеграция со Slack и Codex SDK (подключение к CI/CD, операциям и обслуживанию, а также конвейерам данных).

Почему эволюция Кодекса имеет значение?

Это важно, поскольку устраняет два основных недостатка производительности в разработке программного обеспечения с участием LLM: сохранение контекстной точности в больших кодовых базах и замыкание цикла от предложения до внедрения изменений. Когда модель может анализировать весь репозиторий и применять изменения на месте, и когда эта модель интегрирована в инструменты развертывания, разработчики могут перейти от написания кода-шаффолда к принятию решений по продукту более высокого уровня.

Официальный релиз Codex GA нацелен не только на повышение эффективности автодополнения. Самым интригующим аспектом демонстрации был не объём написанного кода, а то, как Codex самостоятельно ориентировался в протоколах, читал документацию, настраивал MCP-сервер, модифицировал интерфейс, подключал периферийные устройства и непрерывно выполнял «долгосрочные задачи» в облаке.

Какие обновления модели и API анонсировала OpenAI?

Какие обновления моделей были анонсированы на DevDay?

На DevDay компания OpenAI подчеркнула обновление и расширение своего модельного ряда, что позволило более высокая точность и рентабельным варианты:

  • ГПТ-5 Про — более производительное предложение семейства GPT-5, оптимизированное для глубоких рассуждений, длинных контекстов и производственных рабочих нагрузок (описано на страницах модели платформы).
  • Сора 2 — флагманская модель генерации видео и звука, обеспечивающая создание коротких реалистичных видеороликов с синхронизированными диалогами и улучшенным физическим реализмом. OpenAI позиционировала Sora 2 как следующий шаг в развитии генеративного видео.
  • Меньшие и более дешевые голосовые/реальновременные модели — «мини»-варианты (например, мини-модели реального времени/аудио), предназначенные для обеспечения малозадерживаемого, доступного голосового взаимодействия или взаимодействия в реальном времени.

GPT-5 Pro: что это такое, для чего он нужен и почему это важно

Что это: GPT-5 Pro — это высокоточная конфигурация семейства GPT-5, предназначенная для корпоративных и критически важных задач. Она предлагает расширенные контекстные окна, улучшенное следование инструкциям и сниженную частоту галлюцинаций при решении сложных задач. Модель Pro позиционируется как оптимальное решение для высокоточных задач, где задержка и стоимость являются приемлемым компромиссом в пользу производительности.

Почему это важно: Для таких приложений, как юридический анализ, научное реферирование или многоэтапное принятие решений, требующих точности и обширного контекста, уровень Pro меняет экономику разработки с использованием LLM: вместо того, чтобы сводить задачи к узким системам правил, команды могут полагаться на модель, предназначенную для сквозного анализа и повышения доверия. Доступность платного уровня Pro в API также делает решения по закупкам и архитектуре более понятными для предприятий.

OpenAI DevDay 2025: руководство для разработчиков по новому операционному уровню ИИ

Sora 2: что это такое и что оно делает

Что это: Sora 2 — это второе поколение модели OpenAI для преобразования текста в видео, которая позволяет создавать короткие реалистичные клипы с синхронизированным звуком и диалогами, улучшенной физической реалистичностью и удобными для создателей элементами управления. OpenAI выпустила Sora 2 вместе с пользовательским приложением Sora и API-интерфейсами для разработчиков для интеграции.

Что она делает: Sora 2 создаёт короткие видеоролики на основе текстовых подсказок, может расширять существующие короткие клипы и интегрировать звук, соответствующий движению губ и акустике сцены. Sora 2 предназначен для творческого производства, быстрого прототипирования и новых социальных форматов, в которых короткие клипы, созданные с помощью ИИ, служат основой для создания коротких видеороликов.

Модели в реальном времени и мини-модели: доступный опыт в реальном времени

OpenAI также сделала акцент на более дешёвых вариантах моделей с низкой задержкой (семейство Realtime/Mini), предназначенных для реализации голосового и интерактивного взаимодействия по цене, составляющей лишь малую часть от прежней. Это позволяет командам разработчиков добавлять голосовых помощников, недорогие чат-боты и встроенные офлайн-функции без чрезмерно высокой стоимости за токен, расширяя спектр возможных вариантов использования.

API GPT-image-1-mini

gpt-image-1-mini - это оптимизированная по стоимости мультимодальная модель изображения от OpenAI, который принимает ввод текста и изображений и производит выходы изображений. Он позиционируется как меньший и более дешёвый аналог полного семейства GPT-Image-1 от OpenAI, предназначенный для высокопроизводительного производства, где стоимость и задержка являются важными ограничениями. Модель предназначена для таких задач, как генерация текста в изображение, редактирование изображений / инрисовкаи рабочие процессы, включающие эталонные изображения.

Как получить доступ к API Sora 2 и GPT-5 Pro по доступной цене?

CometAPI — это унифицированная платформа API, которая объединяет более 500 моделей ИИ от ведущих поставщиков, таких как серия GPT OpenAI, Gemini от Google, Claude от Anthropic, Midjourney, Suno и других, в единый, удобный для разработчиков интерфейс. Предлагая последовательную аутентификацию, форматирование запросов и обработку ответов, CometAPI значительно упрощает интеграцию возможностей ИИ в ваши приложения. Независимо от того, создаете ли вы чат-ботов, генераторы изображений, композиторов музыки или конвейеры аналитики на основе данных, CometAPI позволяет вам выполнять итерации быстрее, контролировать расходы и оставаться независимыми от поставщика — и все это при использовании последних достижений в экосистеме ИИ.

Разработчики могут получить доступ к API gpt-5-codex (gpt-5-codex), ГПТ-5 Про( gpt-5-pro-2025-10-06; gpt-5-pro) и API Сора 2(sora-2-hd; sora-2) через CometAPI, последняя версия модели Всегда обновляется на официальном сайте. Для начала изучите возможности модели в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.


Как эти обновления сочетаются друг с другом? Какова стратегическая схема?

В совокупности эти заявления демонстрируют три преднамеренных шага:

  1. Платформизация ChatGPT: Приложения внутри ChatGPT + каталог приложений = новый уровень распространения и коммерции для сторонних разработчиков. Это выводит ChatGPT из категории продукта в категорию платформы.
  2. Агент как примитивный продукт первого класса: AgentKit упрощает создание, тестирование и мониторинг многошаговых агентов, использующих инструменты, что стимулирует практическую автоматизацию в различных отраслях.
  3. От демонстрационных моделей до серийных моделей: Модели Codex GA и Pro (GPT-5 Pro, Sora 2) демонстрируют стремление решать корпоративные задачи — надежность, масштабируемость, инструменты безопасности и различные компромиссы между ценой и производительностью.

Эта закономерность не случайна: OpenAI создает маховик разработки, где модели приводят в действие приложения и агенты, приложения обеспечивают распространение и монетизацию, а агенты предоставляют программируемое поведение, которое опирается как на модели, так и на интеграцию приложений.

Заключение — станет ли DevDay 2025 началом новой эры платформ?

OpenAI DevDay 2025 был посвящен не столько изолированным функциям, сколько их объединению в целостную платформу: приложениям, предоставляемым в диалоговой ОС, автономным агентам с чётким маршрутом производства, расширенному Кодексу для реальных рабочих процессов разработчиков и обновлениям моделей, расширяющим возможности медиа. Для разработчиков вывод практический: новые примитивы снижают стоимость интеграции и ускоряют вывод продуктов на рынок, но также повышают требования к управлению и операционной дисциплине.

Читать далее

500+ моделей в одном API

Скидка до 20%