МоделиЦеныПредприятие
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Компания
О насПредприятие
Ресурсы
AI МоделиБлогЖурнал измененийПоддержка
Условия обслуживанияПолитика конфиденциальности
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

В секунду:$0.05
Veo 3.1 — инкрементальное, но существенное обновление Google для семейства Veo «текст и изображение→видео», которое добавляет более богатое нативное аудио, более длинные и лучше контролируемые видеоролики, а также более тонкое редактирование и управление на уровне сцен.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API
Версии

Основные возможности

Veo 3.1 сосредоточен на практических функциях создания контента:

  • Нативная генерация аудио (диалоги, фоновые звуки, SFX), интегрированная в результаты. Veo 3.1 генерирует нативное аудио (диалоги + фон + SFX), синхронизированное с визуальной временной шкалой; модель стремится сохранять синхронизацию губ и аудио‑визуальное выравнивание для диалогов и сценических подсказок.
  • Более длинные видео (поддержка до ~60 секунд / 1080p по сравнению с очень короткими клипами Veo 3,8s) и многопромптовые последовательности многокадровых сцен для сохранения повествовательной целостности.
  • Режимы Scene Extension и First/Last Frame, которые расширяют или интерполируют отснятый материал между ключевыми кадрами.
  • Вставка объектов и (скоро) удаление объектов и базовые операции редактирования внутри Flow.

Каждый пункт выше призван сократить ручную работу по VFX: аудио и непрерывность сцен теперь являются первоклассными результатами, а не второстепенным дополнением.

Технические детали (поведение модели и входы)

Семейство моделей и варианты: Veo относится к семейству Google Veo-3; ID предварительной модели обычно veo3.1-pro; veo3.1 (документация CometAPI). Принимает текстовые промпты, референсы изображений (один кадр или последовательности) и структурированные схемы с несколькими промптами для многокадровой генерации.

Разрешение и длительность: Документация предварительной версии описывает результаты в 720p/1080p с вариантами более длительной длительности (до ~60s в некоторых настройках предпросмотра) и более высокой детализацией по сравнению с ранними версиями Veo.

Соотношения сторон: 16:9 (поддерживается) и 9:16 (поддерживается, за исключением некоторых потоков с опорными изображениями).

Язык промптов: английский (предпросмотр).

Ограничения API: типичные лимиты предпросмотра включают макс. 10 запросов к API/мин на проект, макс. 4 видео на запрос и длины видео, выбираемые из 4, 6 или 8 секунд (потоки с опорными изображениями поддерживают 8s).

Результаты в бенчмарках

Внутренние и публично резюмированные оценки Google сообщают о сильном предпочтении результатов Veo 3.1 по сравнению с другими в сравнениях с участием людей по таким метрикам, как соответствие тексту, визуальное качество и аудио‑визуальная согласованность (задачи text→video и image→video).

Veo 3.1 показала передовые результаты во внутренних сравнениях с участием людей по нескольким объективным аспектам — общее предпочтение, соответствие промпту (text→video и image→video), визуальное качество, аудио‑видео выравнивание и «визуально реалистичная физика» на бенчмарках, таких как MovieGenBench и VBench.

Ограничения и соображения безопасности

Ограничения:

  • Артефакты и непоследовательность: несмотря на улучшения, определённые условия освещения, тонкая физика и сложные окклюзии всё ещё могут приводить к артефактам; согласованность image→video (особенно на длинных отрезках) улучшена, но далека от идеала.
  • Риски дезинформации/дипфейков: более богатое аудио + вставка/удаление объектов повышают риск злоупотреблений (реалистичное фейковое аудио и удлинённые клипы). Google отмечает меры смягчения (политики, защитные механизмы), а более ранние релизы Veo ссылались на водяные знаки/SynthID для подтверждения происхождения; однако технические меры полностью не устраняют риск злоупотреблений.
  • Ограничения по стоимости и пропускной способности: высокое разрешение и длинные видео вычислительно затратны и сейчас доступны в платном предпросмотре — ожидайте более высокую задержку и стоимость по сравнению с моделями для изображений. Сообщения сообщества и темы на форумах Google обсуждают окна доступности и резервные стратегии.

Механизмы безопасности: Veo 3.1 имеет встроенные контент‑политики, маркировку водяными знаками/сигнализацию SynthID в ранних релизах Veo и контроль доступа в предварительной версии; клиентам рекомендуется следовать политике платформы и организовать человеческую проверку для результатов с повышенным риском.

Практические сценарии использования

  • Быстрое прототипирование для креаторов: раскадровки → многокадровые клипы и аниматики с нативными диалогами для раннего креативного ревью.
  • Маркетинг и короткие форматы: продуктовые ролики на 15–60 секунд, клипы для соцсетей и тизеры концепций, где скорость важнее идеальной фотореалистичности.
  • Адаптация image→video: превращение иллюстраций, персонажей или пары кадров в плавные переходы или анимированные сцены с помощью First/Last Frame и Scene Extension.
  • Усиление инструментов: интеграция в Flow для итеративного редактирования (вставка/удаление объектов, пресеты освещения), что сокращает количество ручных VFX‑проходов.

Сравнение с другими ведущими моделями

Veo 3.1 vs Veo 3 (предшественник): Veo 3.1 делает акцент на улучшенном соответствии промпту, качестве аудио и многокадровой согласованности — постепенные, но значимые улучшения, направленные на снижение артефактов и повышение удобства редактирования.

Veo 3.1 vs OpenAI Sora 2: компромиссы, описанные в прессе: Veo 3.1 делает упор на контроль повествования в длинных форматах, встроенное аудио и интеграцию с редактированием в Flow; Sora 2 (по пресс‑сравнениям) фокусируется на других сильных сторонах (скорость, иные пайплайны редактирования). Материалы TechRadar и других изданий позиционируют Veo 3.1 как нацеленного конкурента Google для Sora 2 в области повествовательной и более длинной видеогенерации. Независимое параллельное тестирование пока ограничено.

Функции для Veo 3.1

Изучите ключевые функции Veo 3.1, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для Veo 3.1

Изучите конкурентоспособные цены на Veo 3.1, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Veo 3.1 может улучшить ваши проекты, сохраняя при этом управляемые расходы.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Пример кода и API для Veo 3.1

Получите доступ к исчерпывающим примерам кода и ресурсам API для Veo 3.1, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал Veo 3.1 в ваших проектах.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Версии Veo 3.1

Причина наличия нескольких снимков Veo 3.1 может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.
ID моделиОписаниеДоступностьЦенаЗапрос
veo3.1-allИспользуется неофициальная технология, генерация нестабильна и т. п.✅$0.2 / за запросЧат формат
veo3.1Рекомендуется, указывает на последнюю модель✅$0.4/ за запросАсинхронная генерация

Больше моделей

D

Doubao-Seedance-2-0

В секунду:$0.07
Seedance 2.0 — это базовая мультимодальная модель для видео нового поколения компании ByteDance, ориентированная на кинематографическую генерацию многокадровых повествовательных видео. В отличие от однокадровых демонстраций text-to-video, Seedance 2.0 делает упор на управление на основе референсов (изображения, короткие клипы, аудио), последовательную согласованность персонажа и стиля между кадрами и нативную синхронизацию аудио/видео — с целью сделать видео на основе ИИ полезным для профессиональных творческих и превизуализационных рабочих процессов.
O

Sora 2

В секунду:$0.08
Сверхмощная модель для генерации видео со звуковыми эффектами, поддерживает формат чата.
M

mj_fast_video

За запрос:$0.6
Генерация видео в Midjourney
X

Grok Imagine Video

В секунду:$0.04
Создавайте видео на основе текстовых подсказок, анимируйте статические изображения или редактируйте существующие видео с помощью естественного языка. API позволяет настраивать длительность, соотношение сторон и разрешение создаваемых видео — при этом SDK автоматически выполняет асинхронный опрос.
G

Veo 3.1 Pro

В секунду:$0.25
Veo 3.1-Pro обозначает доступ/конфигурацию с расширенными возможностями семейства Veo 3.1 от Google — поколения видеомоделей короткой формы с поддержкой аудио, которые добавляют более богатый встроенный звук, улучшенные средства управления повествованием и монтажом, а также инструменты расширения сцен.
G

Veo 3 Pro

G

Veo 3 Pro

В секунду:$0.25
Veo 3 pro обозначает производственный уровень использования видеомодели Veo 3 (высокая точность, нативное аудио и расширенный инструментарий)

Связанные блоги

Kling 3.0 против Veo 3.1: Решающее противостояние генераторов видео на базе ИИ 2026 года
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 против Veo 3.1: Решающее противостояние генераторов видео на базе ИИ 2026 года

Kling 3.0 в настоящее время лидирует благодаря нативному 4K, многосценному сторителлингу и превосходному контролю камеры. Veo 3.1 отличается фотореалистичной физикой, нативной синхронизацией аудио и интеграцией с экосистемой Google, что делает его идеальным для кинематографических или корпоративных проектов. Для большинства пользователей выбор зависит от приоритетов: Kling 3.0 — ради скорости, согласованности и стоимости; Veo 3.1 — ради премиального реализма и аудио.
Что такое Google Veo 3.1 Lite?
Apr 1, 2026
veo-3-1

Что такое Google Veo 3.1 Lite?

Что такое Veo 3.1 Lite? Veo 3.1 Lite — новейшая экономичная модель генерации видео от Google для разработчиков, выпущенная 31 марта 2026 года. Она поддерживает преобразование текста в видео и изображения в видео, генерирует видео со звуком и предназначена для сценариев с большим объемом генерации. По словам Google, она стоит менее половины стоимости Veo 3.1 Fast при сохранении той же скорости и поддерживает выходные форматы 16:9 и 9:16, а также разрешение 720p/1080p.
Как получить Grok Imagine бесплатно: доступ, цены и альтернативы
Mar 25, 2026
grok-imagine-video

Как получить Grok Imagine бесплатно: доступ, цены и альтернативы

Grok Imagine Video недоступен бесплатно на официальных платформах xAI/Grok по состоянию на март 2026 года (бесплатный тариф был удалён из-за высокого спроса и опасений по поводу злоупотреблений), но вы можете получить к нему доступ недорого — или с бесплатными стартовыми кредитами — через сторонние агрегаторы, такие как CometAPI. CometAPI предлагает модель всего за $0.04 в секунду (480p), при регистрации новые пользователи часто получают $1–$5 бесплатных кредитов.
Как редактировать видео через Veo 3.1
Mar 5, 2026
veo-3-1

Как редактировать видео через Veo 3.1

В середине октября 2025 года Google публично представила Veo 3.1 (и вариант Veo 3.1 Fast) как улучшенную модель преобразования текста в видео, которая позволяет создавать короткие видеоролики с более высоким качеством.
Что такое vidu Q3? Возможно, это лучшая модель ИИ для видео в 2026 году.
Jan 31, 2026
vidu-q3

Что такое vidu Q3? Возможно, это лучшая модель ИИ для видео в 2026 году.

Vidu Q3 в начале 2026 года вошёл в повестку как один из самых очевидных сигналов того, что генерация видео на основе ИИ смещается от коротких, ради новизны создаваемых роликов к подлинно нарративному, многокадровому повествованию. За месяцы с момента широкого релиза Vidu Q3 стал неотъемлемой частью рабочих процессов создателей контента, исследовательских и коммерческих пилотных проектов — и на то есть веские причины: он продвигает продолжительность, аудиовизуальную интеграцию и межкадровую согласованность дальше, чем большинство более ранних моделей, одновременно предлагая ориентированный на разработчиков API для программного использования.