Google Major представляет модели Imagen 4, Imagen 4 Ultra и Veo 3 на Google I/O 2025

Google готовится представить модели генеративного искусственного интеллекта следующего поколения.Изображение 4, Имидж 4 Ультра и Вео 3— во время ежегодной конференции разработчиков Google I/O 20 мая, 2025. Ранние утечки идентификаторов предварительного просмотра (например, imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) сигнализируют о поэтапном развертывании и нескольких уровнях возможностей в доменах синтеза изображений и видео. Imagen 4 нацелен на достижение значительного прироста в фотореализме, точности подсказок и стилистической согласованности по сравнению с Imagen 3, в то время как вариант «Ultra» может предложить даже более высокое разрешение или специализированные режимы производительности. Что касается видео, Veo 3 обещает более последовательную непрерывность от клипа к клипу и надежное соблюдение стиля по сравнению с Veo 2. Ожидается, что все три модели будут тесно интегрированы с экосистемой Gemini AI от Google, обеспечивая плавные переходы от текстовых подсказок к изображениям или видео в рамках одного рабочего процесса.

Предварительный просмотр идентификаторов и стратегия развертывания

Поэтапные предварительные просмотры: внутренние ссылки, такие как

imagen-4.0-generate-preview-05-20
imagen-4.0-ultra-generate-exp-05-20
veo-3.0-generate-preview

Google Major представляет модели Imagen 4, Imagen 4 Ultra и Veo 3 на Google I/O 2025

Появились в репозиториях кода и предварительных версиях API, что указывает на намерение Google предложить как стандартный, так и «ультра» уровни производительности для генерации изображений, а также расширенный предварительный просмотр видеомодели для первых тестировщиков.

Запуск Google I/O:

Эти идентификаторы убедительно свидетельствуют о том, что Google продемонстрирует и потенциально предоставит разработчикам предварительный доступ на конференции I/O 20 мая, 2025, что является зеркальным отражением предыдущих выпусков для Imagen 3 и Veo 2.

Что нового в Imagen 4

Фотореализм и точность

Улучшенный рендеринг: Imagen 4, как сообщается, достигает большей фотореалистичной детализации, уменьшая артефакты и улучшая точность цветопередачи. Ранние слухи предполагают улучшения в понимании сложных подсказок, таких как нюансное освещение или отражения.
Быстрое соблюдение: Ожидается, что модель будет точнее следовать инструкциям пользователя, предоставляя изображения, которые лучше соответствуют как содержанию, так и стилю (например, «масляная картина заката над горами»).

Последовательность стиля

Сплоченность нескольких образов: Imagen 4 разработан для поддержания единого визуального стиля в различных выходных данных, что выгодно для таких случаев использования, как раскадровка или создание каталога продукции, где единообразие имеет решающее значение.
Ультра вариант: Уровень «Ультра» (imagen‑4.0‑ultra) скорее всего предлагает более высокое разрешение выходных данных или специализированную оптимизацию (например, сверхвысокую точность для печатных носителей) для предприятий и творческих профессионалов.

Что нового в Veo 3

Улучшенная согласованность

Непрерывность от клипа к клипу: Veo 3 нацелен на создание видеопоследовательностей, в которых последовательные кадры поддерживают единообразное кадрирование, освещение и внешний вид персонажей, устраняя ограничения Veo 2, связанные с визуальным дрейфом с течением времени.
Верность стилю: Модель фокусируется на более точном воспроизведении художественных или кинематографических стилей, что упрощает создание видеороликов в желаемой эстетике (например, нуар, пастельная анимация).

Интеграция водяных знаков SynthID

Цифровой водяной знак: Используя технологию SynthID от DeepMind (представленную в Veo 2), Veo 3 будет встраивать незаметные водяные знаки, которые помогут идентифицировать контент, созданный с помощью ИИ, и пресечь его неправомерное использование.

Интеграция с ИИ Gemini

Беспрепятственный доступ: Ожидается, что Imagen 4 и Veo 3 будут доступны напрямую через интерфейсы Gemini от Google, что позволит пользователям создавать изображения или видео с помощью чат-подсказок или через интерфейсы продуктов, такие как Google Photos и Google Slides.
Драгоценные камни Близнецов: Настраиваемые «самоцветы» ИИ могут включать эти модели, позволяя пользователям создавать специализированных помощников (например, самоцвет для планирования путешествий, который генерирует изображения маршрутов и обзорные видео) и делиться ими на торговой площадке, аналогичной магазину GPT ChatGPT.

Доступность и дальнейшие шаги

Просмотр общественности: Разработчики и корпоративные тестировщики могут получать приглашения для экспериментов с Imagen 4 (стандартный и Ultra) и Veo 3, начиная с 20 мая, 2025 на конференции Google I/O, с более широким внедрением в Labs и Vertex AI в последующие недели.

Обратная связь и итерация: Как и в случае с предыдущими запусками, Google, скорее всего, запросит отзывы пользователей для улучшения фильтров безопасности, надежности водяных знаков и оптимизации производительности перед выпуском общедоступного продукта.

Смотреть это пространство: заинтересованные разработчики должны следить за CometAPI.

Новый API модели будет перечислен на CometAPI, и обещают предоставить более низкие цены, чем Google, чтобы облегчить вашу интеграцию. Пожалуйста, продолжайте уделять внимание API документ.