Доступ к API Sora в 2026 году: цены, ограничения на частоту запросов и что на самом деле доступно через агрегаторы

CometAPI
AnnaMay 21, 2026
Доступ к API Sora в 2026 году: цены, ограничения на частоту запросов и что на самом деле доступно через агрегаторы

Sora 2 — первая общедоступная модель text-to-video от OpenAI, доступная программно как через официальный OpenAI API, так и через растущее число маршрутов‑агрегаторов. Модель тарификации нетипична по сравнению с текстовыми моделями (оплата — за секунду сгенерированного видео, а не за токены), и практические вопросы, которые разработчики задают перед интеграцией, отличаются от вопросов для LLM API. Сколько на самом деле стоит клип? Сколько занимает генерация? Каковы лимиты? Что меняется, если вы используете Sora через агрегатор, а не напрямую у OpenAI?

Эта статья — тот самый справочник, которого нам не хватало, когда мы начинали прорабатывать собственные функции генерации видео. Материал структурирован для разработчика, который уже прошел этап «Sora интересна?» и перешел к «сколько это будет стоить, сколько займет интеграция и что нужно знать перед коммитом?»

Кратко: Sora 2 (стандартная модель) стоит $0.10 за секунду сгенерированного видео при 720p. Sora 2 Pro — $0.30 за секунду при 720p или $0.50 за секунду при 1024p. Типичный 10‑секундный клип стоит $1.00 на стандартной модели и $5.00 на Pro в HD. Генерация асинхронная; ожидайте 30–90 секунд времени «стены» для ролика в 5–10 секунд. Доступ требует платного аккаунта OpenAI с минимум tier 2 по использованию.

Состояние доступа к Sora API в 2026 году

Sora 2 появилась в OpenAI API 7 октября 2025 года, и доступ к ней с тех пор поддерживается непрерывно. Идентификатор модели — sora-2 (с текущим snapshot ID sora-2-2025-12-08), а вариант повышенной точности — sora-2-pro. Обе поддерживают text-to-video и image-to-video генерацию с синхронизированным аудио. С 10 января 2026 бесплатный доступ для потребителей через продукт ChatGPT был прекращен, вследствие чего разработческий трафик Sora сместился либо на платные подписки ChatGPT, либо на прямой API‑доступ.

Есть три пути программного использования Sora:

  • Прямой API OpenAI. Канонический маршрут. Посекундная тарификация, только платный доступ, требуется минимум $10 пополнения, чтобы достичь usage tier 2 и разблокировать модели Sora. Поддерживаются SDK и REST API.
  • Azure OpenAI. Корпоративный маршрут Microsoft, зеркалирующий официальные ставки OpenAI с добавлением издержек подписки Azure и enterprise‑функций соответствия. Та же посекундная тарификация; иной операционный периметр.
  • Агрегаторы. Сервисы, которые проксируют Sora за своим унифицированным API. Большинство агрегаторов транслируют посекундные ставки OpenAI без наценки; ценность — операционная (одни учетные данные, один счет, тот же SDK, что и для вашего трафика текстовых моделей). Некоторые агрегаторы предлагают собственные тарифные сетки — обсудим их далее.

Тарифы Sora 2 за секунду видео

Тарифы Sora завязаны на уровень модели и разрешение. Посекундная ставка умножается на длительность клипа и дает стоимость генерации. Подтверждено по официальной странице цен OpenAI на май 2026:

МодельРазрешениеПоддерживаемые длительностиЦена за секунду10-секундный клип
Sora 2 (стандартная)720p4s, 8s, 12s$0.10$1.00
Sora 2 Pro720p10s, 15s, 25s$0.30$3.00
Sora 2 Pro1024p (1792×1024)10s, 15s, 25s$0.50$5.00

Примечания к структуре тарифов. Оплата — за выход, не за вход; нет биллинга по токенам для Sora, как у текстовых моделей. Image conditioning (передача референс‑изображения для якорения генерации) не меняет посекундную ставку. Опции длительности фиксированы для каждого уровня модели: вы не можете запросить 7‑секундный клип на стандартной модели, только 4, 8 или 12 секунд.

Две практические импликации, которые стоит проговорить. Во‑первых, модель тарификации ближе к счету за рендеринг видео, чем к счету за LLM. Стоимость определяется длительностью выхода, а не сложностью промпта или количеством токенов. Во‑вторых, разница в стоимости между Sora 2 и Sora 2 Pro в HD — 5х за секунду: 10‑секундный клип стоит $1.00 на стандартной и $5.00 на Pro при 1024p. Выбор правильного уровня под задачу — основной рычаг экономии; стоит осознанно решать, где действительно нужна более высокая детализация Pro.

Лимиты скорости и квоты

Лимиты Sora организованы вокруг стандартной системы usage tiers OpenAI. Существенные детали именно для Sora:

  • Минимальный требуемый tier: Tier 2, достигается пополнением минимум на $10 API‑кредитов. Tier 1 (дефолт для новых аккаунтов) не включает доступ к моделям Sora.
  • Лимиты параллельной генерации: По документации по rate limit OpenAI, параллельная генерация видео ограничена уровнем, обычно это небольшое количество «в полете» на низких tier, с масштабированием по мере роста tier. Точный потолок задается для аккаунта и виден в панели OpenAI. Для высоких объемов планируйте tier‑3 или tier‑4 с первого дня.
  • Запрос квот: Более высокую параллельность сверх дефолтных потолков tier можно запросить через форму повышения лимитов OpenAI. Одобрение зависит от нагрузки и не моментально; для продакшен‑запусков с предсказуемыми пиками спроса подавайте запрос за несколько недель до запуска.

Важно: лимиты Sora «пуллируются» иначе, чем лимиты текстовых моделей на том же аккаунте. Команда с тяжелым трафиком Sora не влияет на доступный бюджет лимитов для вызовов GPT‑5.5. И наоборот, большой трафик GPT‑5.5 не «съедает» бюджет Sora. Планируйте их как две отдельные емкости.

Время генерации: чего реально ожидать

Sora по дизайну асинхронна. Вы отправляете запрос на генерацию, получаете ID задания и поллите (или ждете webhook) завершение. Время «стены» между запросом и завершением зависит от длительности и разрешения выхода, текущей нагрузки инфраструктуры OpenAI и от того, стоит ли задание в очереди за другими на вашем аккаунте.

Реалистичные ожидания на основе наблюдений:

ВыходТипичное время «стены»Примечания
Sora 2 стандартная, 4 с @ 720p20–45 секундСамый быстрый путь; хорошо для итераций
Sora 2 стандартная, 8 с @ 720p40–90 секундНаиболее частая длительность в продакшене
Sora 2 стандартная, 12 с @ 720p60–120 секундДлинный формат для социальных сетей
Sora 2 Pro, 10 с @ 720p60–150 секундПремиум‑качество; ~3х дороже стандартной
Sora 2 Pro, 15 с @ 1024p120–240 секундПолный HD, на пиках чаще наблюдается очередь
Sora 2 Pro, 25 с @ 1024p200–360 секундМаксимальная длительность; цена растет линейно

Две операционные последствия:

  • Пользовательские ожидания по латентности нужно переосмыслить. Если ваш продукт предполагает отклик генерации видео на действие пользователя, диапазон 30–90 секунд для коротких роликов требует соответствующего UX: индикаторы прогресса, параллельные действия для пользователя на время ожидания, или предгенерация для предсказуемых сценариев. Трактовать Sora как синхронный API — самая частая архитектурная ошибка.
  • Polling против webhook имеет значение. Наивный polling (частые запросы статуса) расходует и ваш лимит, и вычислительные ресурсы модели. Используйте экспоненциальную задержку с джиттером или настройте webhook‑обратные вызовы, если это возможно. Паттерн polling’а, хорошо работающий в проде: опрашивать раз в 10 секунд в первую минуту, затем раз в 30 секунд дальше, с жестким таймаутом на верхнюю границу ожидания для выбранной длительности.

Поддерживаемые параметры и структура промпта

API Sora намеренно проще по сравнению с моделями генерации изображений вроде DALL‑E 3. Ручек меньше, но те, что есть, важны. Существенные параметры:

  • model: sora-2 или sora-2-pro. Выбор определяет и цены, и доступные опции по длительности/разрешению, как в таблице выше.
  • prompt: Свободный текст, описывающий сцену. Sora понимает кинематографические указания (ракурсы, движение камеры, свет), действия персонажей и детали окружения. Модель чувствительна к структуре промпта: сначала ввод сцены, затем действие, затем технические указания — это надежнее, чем один плотный абзац.
  • image: Необязательное референс‑изображение для image-to-video генерации. Служит якорем первого кадра; модель генерирует движение от этой отправной точки. Полезно для демо продуктов, сохранения континуитета персонажей и сценариев, где внешний вид субъекта нельзя менять.
  • duration: Длительность в секундах. Ограничено дискретными опциями для выбранной модели (4/8/12 для sora-2, 10/15/25 для sora-2-pro). Стоимость растет линейно с длительностью.
  • size: Разрешение. 720x1280 (портрет) или 1280x720 (альбом) на стандартной модели; на Pro добавляются 1024x1792 / 1792x1024. Соотношение сторон следует из выбора размера.

Чего нет. В публичном API Sora сейчас не выставляет seed‑контроль (поэтому воспроизводимость между запусками не гарантируется), а также не дает отдельных стилевых регуляторов, как Midjourney или другие модели изображений. Модель «с мнением»; основной рычаг — инжиниринг промпта, а не тюнинг параметров.

Простой пример запроса генерации Sora 2 с использованием OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Создать задание на генерацию видеоjob = client.videos.create(model="sora-2",prompt=("Широкоугольный план заснеженной горы на рассвете. ""Камера медленно уходит влево, когда первый свет касается вершины. ""Кинематографично, золотой час, освещение качества 4K."),size="1280x720",duration=8,)# Опрос статуса до завершенияwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Генерация не удалась: {job.error}")print(f"Текущий статус: {job.status}")time.sleep(10)print(f"Видео готово: {video_url}")

Примеры расчета стоимости

Посекундная тарификация делает стоимость предсказуемой, но только после того, как вы понимаете профиль нагрузки. Три репрезентативных сценария:

Сценарий 1: Короткое продуктовое демо для лендинга SaaS

5‑секундный клип с демонстрацией UI продукта, генерируется один раз и используется как hero‑видео на маркетинговом сайте. Ожидаете 5–10 итераций, чтобы получить клип нужного качества перед публикацией.

Стоимость на Sora 2 стандартной при 720p: 5s × $0.10 = $0.50 за генерацию. При 8 итерациях до финала: $4.00. Стоимость на Sora 2 Pro при 1024p для финальной публикации: 5s × $0.50 = $2.50 (один прогон). Итого по проекту: около $6.50 за итерации плюс финал в HD.

Сценарий 2: Пакет из 50 клипов для маркетинговой кампании

50 уникальных 8‑секундных продуктовых клипов, каждый по отдельному описанию фичи, все на Sora 2 стандартной при 720p. Бюджет на итерации отсутствует; принимаете первый результат.

Стоимость: 50 × 8s × $0.10 = $40.00. Добавьте 30% бюджета на итерации для клипов, которые «не попадут» с первого раза (50 × 0.30 = 15 повторов × 8s × $0.10 = $12). Итого: около $52.00 за кампанию.

Сценарий 3: Функция пользовательской генерации видео в потребительском продукте

Пользователи в вашем приложении по запросу генерируют 6‑секундные клипы на Sora 2 стандартной при 720p. Среднее использование: 1 000 клипов в день. Вы берете с пользователя $0.50 за генерацию и принимаете разницу в себестоимости как единичную маржу.

Себестоимость клипа: 6s × $0.10 = $0.60. При пользовательской цене $0.50 нагрузка убыточна на стандартном уровне: каждая генерация стоит на $0.10 больше, чем платит пользователь. Для 720p стандартной точки безубыточности нужна цена минимум $0.65 до учета накладных расходов. При 30 000 клипов в месяц: ежемесячный счет Sora составит $18 000. Это тот самый юнит‑экономический чек, который стоит сделать до запуска любой пользовательской видео‑фичи.

Вывод по трем сценариям: генерация видео действительно доступна для маркетинговых и разовых контентных задач, где число итераций ограничено и важна цена за финальный актив. Существенно сложнее — для пользовательских фич на масштабе, где цена за генерацию должна покрывать пользовательскую оплату плюс издержки продукта. Будьте точны в том, какую нагрузку вы ценообразуете, прежде чем коммититься.

Прямой доступ OpenAI против доступа через агрегатор

Поскольку Sora доступна разными маршрутами, практический вопрос для большинства команд — какой выбрать. Честный ответ зависит от остального стека.

Что одинаково

Качество выхода, время генерации на уровне модели, поддерживаемые параметры и посекундная тарификация обычно идентичны независимо от маршрута, поскольку большинство агрегаторов транслируют цены OpenAI без наценки, а сама модель одна и та же. Если выбирать только по качеству выхода — разницы нет.

Что отличается

  • Плоскость биллинга. Прямой доступ OpenAI биллится через ваш аккаунт OpenAI; агрегаторы — через их собственные кредиты или подписку. Для команд, которые уже ведут биллинг OpenAI за текстовые модели, прямой маршрут ничего нового не добавляет. Для команд с мульти‑провайдерной нагрузкой (LLM от Anthropic, изображения от Black Forest Labs, видео от Sora) агрегатор сводит все в один счет.
  • Наблюдаемость. Дашборд OpenAI аккуратно показывает использование Sora на уровне запросов. Дашборды агрегаторов варьируются по тому, насколько хорошо они обращаются с видео‑нагрузками; у одних есть спец‑наблюдаемость под видео, другие считают видео «обычным API‑вызовом». Стоит проверить заранее, если наблюдаемость — приоритет.
  • Пуллинг лимитов. При прямом доступе OpenAI лимиты Sora привязаны к вашему аккаунту и tier. У агрегатора лимиты иногда пуллируются на уровень всей клиентской базы, а иногда выделяются на клиента. Для высоконагруженных продов спросите у агрегатора, как они аллоцируют лимиты, прежде чем интегрироваться.
  • География и соответствие. Прямой OpenAI обрабатывается на инфраструктуре OpenAI с вариантами размещения данных, которые они предоставляют. Некоторые агрегаторы базируются в юрисдикциях с иными правилами резидентности; другие все равно маршрутизируют запросы через инфраструктуру OpenAI в США. Для регулируемых нагрузок это решающий фактор — и это тот случай, когда стоит попросить у sales агрегатора письменное подтверждение.

Как CometAPI вписывается

CometAPI выставляет Sora 2 и Sora 2 Pro рядом с 500+ другими моделями за единым OpenAI‑совместимым endpoint’ом, с одними учетными данными и унифицированным биллингом. Цены на Sora через CometAPI соответствуют посекундным ставкам OpenAI; операционная ценность — консолидация использования Sora с прочим трафиком моделей в один счет. Для команд со смешанной нагрузкой (текстовые модели от нескольких провайдеров, генерация изображений и видео Sora) это ключевой аргумент. Если вы используете только Sora и одну‑две текстовые модели, операционная выгода меньше, и прямой доступ OpenAI — вполне оправданный выбор.

Продакшен‑соображения

Несколько паттернов, которые стоит правильно реализовать, прежде чем Sora попадет к продакшен‑трафику:

  • Асинхронный жизненный цикл задания. Рассматривайте каждую генерацию Sora как долговыполняемое задание, а не запрос. Сохраняйте ID задания сразу при создании; переживайте перезапуск сервера с возможностью возобновить polling для «висящих» заданий; обрабатывайте случай, когда задание завершилось, пока ваш воркер был офлайн. Это базовая гигиена распределенных систем, но ее часто пропускают сначала, потому что Sora — первый асинхронный API команды.
  • Fallback на вебхуки. Если платформа поддерживает вебхуки для событий завершения (OpenAI API — да), используйте их. Вебхуки снимают необходимость polling’а и снижают давление на лимиты и лишнюю нагрузку от частых проверок статуса. Polling — fallback для сред, где нельзя выставить endpoint вебхука.
  • Режимы отказов, которые стоят денег. OpenAI не берет плату за неудавшиеся генерации, но частичные завершения и ретраи, завершившиеся успехом со второй попытки, уже стоят денег. В проде логируйте стоимость каждого ретрая и алертите, если доля ретраев превышает ожидания — обычно это сигнал о проблеме с политиками контента и промптами; дешевле исправить на уровне промптов, чем покрывать счетом.
  • Политика контента и прод‑деплой. На Sora распространяются политики использования OpenAI, ограничивающие определенные категории контента. Для продакшен‑деплоев (особенно пользовательских, где промпт частично под контролем пользователя) изучите официальную политику контента OpenAI и спроектируйте защитные меры «выше по течению». Ссылка на политику OpenAI — правильная отсылка; это источник истины, который обновляется чаще, чем эта статья.

Что строить в первую очередь

Честная оценка: какие нагрузки Sora готовы для продакшена сегодня, какие на грани и какие преждевременны:

Готово к продакшену сегодня

Маркетинговые и креативные нагрузки, где число итераций ограничено, а метрика — стоимость за финальный актив. Демо‑видео продукта, контент для соцкампаний, hero‑видео для лендингов, внутренние обучающие материалы. Экономика сходится, отказоустойчивость понятна, и латентность (30–90 секунд для коротких роликов) приемлема, если «человек в петле» — контент‑команда, а не конечный пользователь.

На грани

Пользовательские функции генерации видео, где цена за клип должна перекрывать пользовательскую оплату. Это возможно, но требует аккуратной юнит‑экономики: ограничьте длительность, доступную пользователю, по умолчанию используйте Sora 2 стандартную при 720p, назначьте цену с маржой над себестоимостью клипа. Большинство потребительских видео‑приложений волны начала 2026 — здесь, и устойчивые проекты осознанно ограничивают, что пользователи могут генерировать.

Преждевременно

Длинные видео на масштабе (все, что сверх 25 секунд — текущий потолок Sora), высокообъемные сценарии реального времени, где важнее латентность, чем деньги, и приложения, требующие покадрового контроля или воспроизводимости на seed. Эти нагрузки стоит переоценить, когда поверхность возможностей Sora расширится, а не пытаться впихнуть сегодня.

Формулировка: Sora 2 действительно готова к продакшену для контентных задач с человеком в петле. Она работоспособна для пользовательских фич при осознанной юнит‑экономике. Она преждевременна для длинного видео и случаев, требующих параметров, которых Sora пока не выставляет. Стройте под то, что готово сегодня; отслеживайте то, что пока нет.

Попробуйте на своей нагрузке: Все варианты Sora 2 и Sora 2 Pro доступны на CometAPI рядом с текстовыми моделями, которыми вы уже можете пользоваться. Бесплатный кредит на пробу позволяет сгенерировать несколько клипов по стандартным ценам без какой‑либо настройки, кроме указания существующему OpenAI‑совместимому клиенту endpoint’а CometAPI.

Готовы сократить затраты на AI-разработку на 20%?

Начните бесплатно за несколько минут. Пробные кредиты включены. Карта не нужна.

Читать далее