Veo 3.1 на подходе: Veo — это семейство моделей Google для генерации видео с ИИ (актуальны Veo 3 / Veo 3 Fast). Недавно Google выпустила крупные улучшения Veo 3 (вертикальное 9:16, 1080p, Veo 3 Fast, снижение цен), и есть слухи / посты в соцсетях, что Veo 3.1 выйдет совсем скоро — но Google пока не опубликовала официальный бюллетень релиза Veo 3.1. Ниже — подтверждённые факты, вероятные/ожидаемые изменения и прямое сравнение с Sora 2 от OpenAI.
Что такое Veo
Veo — это линейка генеративных видеомоделей Google (DeepMind / Google Cloud / семейство Gemini), которые преобразуют текст или изображения в короткие видео — и (в Veo 3) нативно генерируют аудио (звуковые эффекты, фоновое звучание и диалоги). Модель доступна в Google Cloud (Vertex AI / Gemini API) для разработчиков и предприятий и включает встроенные средства подтверждения происхождения/водяные знаки SynthID на выходах.
Что уже принесла Veo 3
- Возможности текст → видео и изображение → видео (включая предварительный просмотр image-to-video).
- Нативная генерация аудио (музыка, фоновые звуки, диалог) — Veo 3 впервые внедрила «первоклассное» аудио.
- Два варианта: высококачественная Veo 3 и Veo 3 Fast (оптимизирована под скорость/итерации).
- Доступность платформы: доступна в Vertex AI / Gemini API (оплачиваемый предпросмотр → обновления до общей доступности в середине 2025 года).
- Безопасность/происхождение: водяные знаки SynthID и определённые механизмы контроля/одобрения генерации с участием людей/детей.
Так что же ожидается в Veo 3.1?
Статус: На текущий момент у Google нет официальной страницы продукта Veo 3.1 с полными примечаниями к выпуску. Однако несколько постов разработчиков Google/сообщества и твитов указывают на скорый инкрементальный апдейт (с меткой «Veo 3.1»), который, вероятно, сфокусируется на итеративных улучшениях аудио, качества и поддержки форматов, а не на полном переписывании поколения.
Вот некоторые выводы, сделанные на основе поста в X и характеристик Veo 3:
- Улучшенное нативное аудио (диалог, синхронизация губ для нескольких голосов) — более чистые диалоги, лучшая миксовка SFX и пространственная обработка. Veo 3 уже нативно генерирует аудио; Veo 3.1 может улучшить реалистичность диалогов и языковую поддержку, чтобы соответствовать недавним достижениям конкурентов.
- Более быстрые/более дешёвые режимы для некоторых типовых выводов (больше паритета с Veo 3 Fast и оптимизаций).
- Улучшенная достоверность image→video и лучшая согласованность персонажей/поз в многокадровых клипах.
- Расширенные параметры соотношения сторон / управления разрешением (более гибкие 9:16/16:9 и 1080p для разных конфигураций). Google уже добавила вертикаль + 1080p; Veo 3.1 может расширить эти настройки.
- Более длинные клипы / ослабление 8-секундного ограничения — сообщество долго просит, и прежняя дорожная карта Google предполагает, что увеличение длительности — вероятная цель (сейчас Veo 3 оптимизирована под 8-секундные клипы).
- Лучшая достоверность image→video и расширенная поддержка image-to-video (улучшения реалистичности, непрерывности движения), развивая предпросмотр image→video в Veo 3.

Сравнение Veo 3 / (ожидаемая) Veo 3.1 → OpenAI Sora 2
Основной фокус
- Veo 3 (Google): короткие, высококачественные 8-секундные видео по текстовым/визуальным промптам; нативное аудио; интеграция в Gemini/Gemini API и Vertex AI; оптимизация под продакшн и разработку через API.
- Sora 2 (OpenAI): флагманская видеомодель с аудио, делающая упор на физический реализм, согласованное движение, синхронизированные диалоги и звук, а также сопровождающее социальное приложение (Sora) с системой камео/согласия для интеграции образов пользователей и акцентом на реализм и средства контроля безопасности.
Сильные стороны
- Veo (сейчас): сильная интеграция для разработчиков/предприятий (Vertex AI, Gemini API), варианты ценообразования для продакшна, понятный путь для клиентов в облаке, вертикаль/1080p + быстрый вариант. Подходит бизнесам, встраивающим в пайплайны.
- Sora 2: впечатляющая физическая точность и мультимодальная синхронизация (диалог + визуал), и приложение для потребителей, интегрированное в соц-процессы (функция камео, модерация). Отлично подходит создателям, желающим реалистичных сцен и экосистемы приложения.
Как получить доступ к Veo сейчас — и как подготовиться к Veo 3.1
- Попробовать в Gemini (потребительское / веб / мобильное): генерация Veo доступна в приложениях Gemini (тапните «видео» в строке промпта). Уровень доступа (Pro / Ultra) влияет на доступные варианты Veo.
- Программно / для предприятий: используйте API в CometAPI (идентификаторы моделей Veo доступны в документации модели). CometAPI предоставляет veo3-pro, veo3-fast и veo3. Подробности см. на странице Veo 3 и в её документации.
Практический совет (для разработчиков): чтобы запросить вертикальный вывод, установите параметр aspectRatio (например, "9:16") и проверьте конфигурацию модели (Veo 3 vs Veo 3 Fast) и ваш план на ограничения по разрешению (720p vs 1080p).
Как получить доступ к Sora 2 (сегодня)
Приложение Sora: Sora 2 вышла вместе с приложением Sora (раскатка по приглашениям, на старте в США и Канаде). OpenAI заявила о дальнейшем расширении доступа и API. Если хотите попробовать Sora 2 сейчас, посетите страницу Sora 2 у CometAPI. CometAPI уже поддерживает API Sora 2 и генерирует ~10-секундные соц‑клипы с акцентом на реализм движения людей.
Начало работы
CometAPI — это унифицированная платформa API, агрегирующая более 500 моделей ИИ от ведущих провайдеров — таких как OpenAI GPT, Google Gemini, Anthropic Claude, Midjourney, Suno и другие — в единый интерфейс, удобный для разработчиков. Предлагая унифицированные аутентификацию, форматирование запросов и обработку ответов, CometAPI существенно упрощает интеграцию ИИ‑возможностей в ваши приложения. Создаёте ли вы чат‑ботов, генераторы изображений, музыкальные композиторы или аналитические пайплайны, CometAPI позволяет быстрее итератировать, контролировать затраты и оставаться независимыми от вендоров — при этом используя последние достижения экосистемы ИИ.
Разработчики могут получить доступ к Veo 3.1 API через CometAPI, последняя версия модели всегда синхронизируется с официальным сайтом. Для начала изучите возможности модели в Playground и обратитесь к руководству по API за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цены значительно ниже официальных, чтобы помочь вам с интеграцией.
Готовы начать?→ Зарегистрируйтесь в CometAPI уже сегодня !
