Veo 3.1 скоро выйдет(и какие ходят слухи): что мы знаем и что это принесёт?

Veo 3.1 на подходе: Veo — это семейство моделей Google для генерации видео с ИИ (актуальны Veo 3 / Veo 3 Fast). Недавно Google выпустила крупные улучшения Veo 3 (вертикальное 9:16, 1080p, Veo 3 Fast, снижение цен), и есть слухи / посты в соцсетях, что Veo 3.1 выйдет совсем скоро — но Google пока не опубликовала официальный бюллетень релиза Veo 3.1. Ниже — подтверждённые факты, вероятные/ожидаемые изменения и прямое сравнение с Sora 2 от OpenAI.

Что такое Veo

Veo — это линейка генеративных видеомоделей Google (DeepMind / Google Cloud / семейство Gemini), которые преобразуют текст или изображения в короткие видео — и (в Veo 3) нативно генерируют аудио (звуковые эффекты, фоновое звучание и диалоги). Модель доступна в Google Cloud (Vertex AI / Gemini API) для разработчиков и предприятий и включает встроенные средства подтверждения происхождения/водяные знаки SynthID на выходах.

Что уже принесла Veo 3

Возможности текст → видео и изображение → видео (включая предварительный просмотр image-to-video).
Нативная генерация аудио (музыка, фоновые звуки, диалог) — Veo 3 впервые внедрила «первоклассное» аудио.
Два варианта: высококачественная Veo 3 и Veo 3 Fast (оптимизирована под скорость/итерации).
Доступность платформы: доступна в Vertex AI / Gemini API (оплачиваемый предпросмотр → обновления до общей доступности в середине 2025 года).
Безопасность/происхождение: водяные знаки SynthID и определённые механизмы контроля/одобрения генерации с участием людей/детей.

Так что же ожидается в Veo 3.1?

Статус: На текущий момент у Google нет официальной страницы продукта Veo 3.1 с полными примечаниями к выпуску. Однако несколько постов разработчиков Google/сообщества и твитов указывают на скорый инкрементальный апдейт (с меткой «Veo 3.1»), который, вероятно, сфокусируется на итеративных улучшениях аудио, качества и поддержки форматов, а не на полном переписывании поколения.

Вот некоторые выводы, сделанные на основе поста в X и характеристик Veo 3:

Улучшенное нативное аудио (диалог, синхронизация губ для нескольких голосов) — более чистые диалоги, лучшая миксовка SFX и пространственная обработка. Veo 3 уже нативно генерирует аудио; Veo 3.1 может улучшить реалистичность диалогов и языковую поддержку, чтобы соответствовать недавним достижениям конкурентов.
Более быстрые/более дешёвые режимы для некоторых типовых выводов (больше паритета с Veo 3 Fast и оптимизаций).
Улучшенная достоверность image→video и лучшая согласованность персонажей/поз в многокадровых клипах.
Расширенные параметры соотношения сторон / управления разрешением (более гибкие 9:16/16:9 и 1080p для разных конфигураций). Google уже добавила вертикаль + 1080p; Veo 3.1 может расширить эти настройки.
Более длинные клипы / ослабление 8-секундного ограничения — сообщество долго просит, и прежняя дорожная карта Google предполагает, что увеличение длительности — вероятная цель (сейчас Veo 3 оптимизирована под 8-секундные клипы).
Лучшая достоверность image→video и расширенная поддержка image-to-video (улучшения реалистичности, непрерывности движения), развивая предпросмотр image→video в Veo 3.

Veo 3.1 скоро выйдет(и какие ходят слухи): что мы знаем и что это принесёт?

Сравнение Veo 3 / (ожидаемая) Veo 3.1 → OpenAI Sora 2

Основной фокус

Veo 3 (Google): короткие, высококачественные 8-секундные видео по текстовым/визуальным промптам; нативное аудио; интеграция в Gemini/Gemini API и Vertex AI; оптимизация под продакшн и разработку через API.
Sora 2 (OpenAI): флагманская видеомодель с аудио, делающая упор на физический реализм, согласованное движение, синхронизированные диалоги и звук, а также сопровождающее социальное приложение (Sora) с системой камео/согласия для интеграции образов пользователей и акцентом на реализм и средства контроля безопасности.

Сильные стороны

Veo (сейчас): сильная интеграция для разработчиков/предприятий (Vertex AI, Gemini API), варианты ценообразования для продакшна, понятный путь для клиентов в облаке, вертикаль/1080p + быстрый вариант. Подходит бизнесам, встраивающим в пайплайны.
Sora 2: впечатляющая физическая точность и мультимодальная синхронизация (диалог + визуал), и приложение для потребителей, интегрированное в соц-процессы (функция камео, модерация). Отлично подходит создателям, желающим реалистичных сцен и экосистемы приложения.

Как получить доступ к Veo сейчас — и как подготовиться к Veo 3.1

Попробовать в Gemini (потребительское / веб / мобильное): генерация Veo доступна в приложениях Gemini (тапните «видео» в строке промпта). Уровень доступа (Pro / Ultra) влияет на доступные варианты Veo.
Программно / для предприятий: используйте API в CometAPI (идентификаторы моделей Veo доступны в документации модели). CometAPI предоставляет veo3-pro, veo3-fast и veo3. Подробности см. на странице Veo 3 и в её документации.

Практический совет (для разработчиков): чтобы запросить вертикальный вывод, установите параметр aspectRatio (например, "9:16") и проверьте конфигурацию модели (Veo 3 vs Veo 3 Fast) и ваш план на ограничения по разрешению (720p vs 1080p).

Как получить доступ к Sora 2 (сегодня)

Приложение Sora: Sora 2 вышла вместе с приложением Sora (раскатка по приглашениям, на старте в США и Канаде). OpenAI заявила о дальнейшем расширении доступа и API. Если хотите попробовать Sora 2 сейчас, посетите страницу Sora 2 у CometAPI. CometAPI уже поддерживает API Sora 2 и генерирует ~10-секундные соц‑клипы с акцентом на реализм движения людей.

Начало работы

CometAPI — это унифицированная платформa API, агрегирующая более 500 моделей ИИ от ведущих провайдеров — таких как OpenAI GPT, Google Gemini, Anthropic Claude, Midjourney, Suno и другие — в единый интерфейс, удобный для разработчиков. Предлагая унифицированные аутентификацию, форматирование запросов и обработку ответов, CometAPI существенно упрощает интеграцию ИИ‑возможностей в ваши приложения. Создаёте ли вы чат‑ботов, генераторы изображений, музыкальные композиторы или аналитические пайплайны, CometAPI позволяет быстрее итератировать, контролировать затраты и оставаться независимыми от вендоров — при этом используя последние достижения экосистемы ИИ.

Разработчики могут получить доступ к Veo 3.1 API через CometAPI, последняя версия модели всегда синхронизируется с официальным сайтом. Для начала изучите возможности модели в Playground и обратитесь к руководству по API за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цены значительно ниже официальных, чтобы помочь вам с интеграцией.

Готовы начать?→ Зарегистрируйтесь в CometAPI уже сегодня !

Veo 3.1 скоро выйдет(и какие ходят слухи): что мы знаем и что это принесёт?

Что такое Veo

Что уже принесла Veo 3

Так что же ожидается в Veo 3.1?

Сравнение Veo 3 / (ожидаемая) Veo 3.1 → OpenAI Sora 2

Основной фокус

Сильные стороны

Как получить доступ к Veo сейчас — и как подготовиться к Veo 3.1

Как получить доступ к Sora 2 (сегодня)

Начало работы

Готовы сократить затраты на AI-разработку на 20%?

Читать далее