Veo 3.1

Par Seconde:$0.05

Veo 3.1 est une mise à jour incrémentale mais significative de Google pour sa famille Veo texte-et-image→vidéo, ajoutant un son natif plus riche, des sorties vidéo plus longues et plus facilement contrôlables, ainsi que des outils de montage plus précis et des contrôles au niveau des scènes.

Nouveau

Usage commercial

Playground

Aperçu

Fonctionnalités

Tarification

API

Versions

Fonctionnalités principales

Veo 3.1 se concentre sur des fonctionnalités pratiques de création de contenu :

Génération audio native (dialogue, ambiance sonore, SFX) intégrée aux sorties. Veo 3.1 génère de l’audio natif (dialogue + ambiance + SFX) aligné sur la chronologie visuelle ; le modèle vise à préserver la synchronisation labiale et l’alignement audio‑visuel pour le dialogue et les repères de scène.
Sorties plus longues (prise en charge jusqu’à ~60 secondes / 1080p, contre les très courts clips de Veo 3, 8 s), et séquences multi‑plans multi‑prompt pour une continuité narrative.
Des modes Scene Extension et First/Last Frame qui étendent ou interpolent des images entre des images clés.
Insertion d’objets et (à venir) suppression d’objets et primitives d’édition dans Flow.

Chaque point ci‑dessus est conçu pour réduire le travail VFX manuel : l’audio et la continuité de scène sont désormais des sorties de premier ordre plutôt que des éléments secondaires.

Détails techniques (comportement du modèle et entrées)

Famille de modèles et variantes : Veo appartient à la famille Veo‑3 de Google ; l’ID du modèle d’aperçu est généralement veo3.1-pro ; veo3.1 (documentation CometAPI). Il accepte des invites textuelles, des références d’images (image unique ou séquences), et des mises en page structurées multi‑prompt pour une génération multi‑plans.

Résolution et durée : La documentation d’aperçu décrit des sorties en 720p/1080p avec des options pour des durées plus longues (jusqu’à ~60 s dans certains paramètres d’aperçu) et une fidélité supérieure aux variantes Veo antérieures.

Rapports d’aspect : 16:9 (pris en charge) et 9:16 (pris en charge sauf dans certains flux d’images de référence).

Langue des invites : Anglais (aperçu).

Limites API : les limites d’aperçu typiques incluent max 10 requêtes API/min par projet, max 4 vidéos par requête, et des durées vidéo sélectionnables parmi 4, 6 ou 8 secondes (les flux à image de référence prennent en charge 8 s).

Performances de référence

Les évaluations internes de Google et leurs synthèses publiques rapportent une forte préférence pour les sorties de Veo 3.1 dans les comparaisons menées par des évaluateurs humains sur des métriques telles que l’alignement au texte, la qualité visuelle, et la cohérence audio‑visuelle (tâches texte→vidéo et image→vidéo).

Veo 3.1 a obtenu des résultats de pointe sur les comparaisons internes menées par des évaluateurs humains selon plusieurs axes objectifs — préférence globale, alignement aux invites (texte→vidéo et image→vidéo), qualité visuelle, alignement audio‑vidéo, et « physique visuellement réaliste » sur des jeux de référence tels que MovieGenBench et VBench.

Limites et considérations de sécurité

Limites :

Artefacts et incohérences : malgré les améliorations, certains éclairages, une physique fine et des occlusions complexes peuvent encore produire des artefacts ; la cohérence image→vidéo (surtout sur de longues durées) est améliorée mais pas parfaite.
Désinformation / risque de deepfake : un audio plus riche et l’insertion/suppression d’objets augmentent le risque d’usage abusif (audio truqué réaliste et clips allongés). Google mentionne des atténuations (politique, garde‑fous) et des versions antérieures de Veo faisaient référence au filigranage/SynthID pour aider à la traçabilité ; toutefois, les garde‑fous techniques n’éliminent pas le risque d’abus.
Contraintes de coût et de débit : des vidéos haute résolution et longues sont coûteuses en calcul et actuellement soumises à un aperçu payant — attendez‑vous à une latence et un coût plus élevés que les modèles d’images. Des publications communautaires et des fils sur les forums Google discutent des fenêtres de disponibilité et des stratégies de repli.

Contrôles de sécurité : Veo3.1 intègre des politiques de contenu, un signalement de filigranage/SynthID mentionné dans des versions précédentes de Veo, et des contrôles d’accès en aperçu ; il est recommandé aux clients de suivre la politique de la plateforme et de mettre en place une revue humaine pour les contenus à risque élevé.

Cas d’usage pratiques

Prototypage rapide pour les créatifs : storyboards → clips multi‑plans et animatics avec dialogue natif pour une revue créative précoce.
Marketing et formats courts : spots produit de 15–60 s, clips sociaux et teasers de concept où la rapidité prime sur un photoréalisme parfait.
Adaptation image→vidéo : transformation d’illustrations, de personnages ou de deux images en transitions fluides ou scènes animées via First/Last Frame et Scene Extension.
Augmentation des outils : intégrée à Flow pour l’édition itérative (insertion/suppression d’objets, préréglages d’éclairage) qui réduit les passes VFX manuelles.

Comparaison avec d’autres modèles de premier plan

Veo 3.1 vs Veo 3 (prédécesseur) : Veo 3.1 met l’accent sur une meilleure conformité aux invites, la qualité audio, et la cohérence multi‑plans — des mises à jour incrémentales mais impactantes visant à réduire les artefacts et à améliorer la facilité d’édition.

Veo 3.1 vs OpenAI Sora 2 : compromis rapportés dans la presse : Veo 3.1 met en avant le contrôle narratif longue forme, l’audio intégré, et l’intégration d’édition Flow ; Sora 2 (dans les comparaisons médiatiques) se concentre sur d’autres atouts (vitesse, pipelines d’édition différents). TechRadar et d’autres médias présentent Veo 3.1 comme le concurrent ciblé de Google face à Sora 2 pour la narration et la prise en charge de vidéos plus longues. Les tests comparatifs indépendants côte‑à‑côte restent limités.

Tarification pour Veo 3.1

Découvrez des tarifs compétitifs pour Veo 3.1, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Veo 3.1 peut améliorer vos projets tout en maîtrisant les coûts.

veo3.1（videos）

Model name	Tags	Calculate price
veo3.1-all	videos	$0.20000
veo3.1	videos	$0.40000

Exemple de code et API pour Veo 3.1

Accédez à des exemples de code complets et aux ressources API pour Veo 3.1 afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Veo 3.1 dans vos projets.

POST

/v1/videos

Python
JavaScript
Curl

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Versions de Veo 3.1

La raison pour laquelle Veo 3.1 dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.

ID du modèle	description	Disponibilité	Prix	Requête
veo3.1-all	La technologie utilisée n'est pas officielle et la génération est instable, etc.	✅	$0.2 / par	Chat format
veo3.1	Recommandé, renvoie vers le modèle le plus récent	✅	$0.4/ par	Génération asynchrone

Plus de modèles

Blogs connexes

Apr 20, 2026

Kling 3.0 vs Veo 3.1 : le duel ultime des générateurs de vidéos par IA en 2026

Kling 3.0 mène actuellement grâce à une narration multi-plans en 4K natif et à un contrôle de caméra supérieur. Veo 3.1 excelle dans la physique photoréaliste, la synchronisation audio native et l’intégration à l’écosystème Google, ce qui le rend idéal pour des projets cinématographiques ou d’entreprise. Pour la plupart des utilisateurs, le choix dépend des priorités : Kling 3.0 pour la vitesse, la cohérence et le coût ; Veo 3.1 pour le réalisme haut de gamme et l’audio.

Apr 1, 2026

Qu'est-ce que Google Veo 3.1 Lite ?

Qu’est-ce que Veo 3.1 Lite ? Veo 3.1 Lite est le tout dernier modèle de génération vidéo à coût optimisé de Google, destiné aux développeurs, lancé le 31 mars 2026. Il prend en charge le texte‑vers‑vidéo et l’image‑vers‑vidéo, génère des vidéos avec audio et est conçu pour des applications à fort volume. Google indique qu’il coûte moins de la moitié de Veo 3.1 Fast tout en conservant la même vitesse, avec des formats de sortie 16:9 et 9:16 et la prise en charge des résolutions 720p/1080p.

Mar 25, 2026

Comment obtenir Grok Imagine gratuitement : accès, tarifs et alternatives

Grok Imagine Video n'est pas gratuit sur les plateformes officielles xAI/Grok à partir de mars 2026 (le palier gratuit a été supprimé en raison d'une forte demande et de préoccupations liées aux abus), mais vous pouvez y accéder à un prix abordable — ou avec des crédits de départ gratuits — via des agrégateurs tiers comme CometAPI. CometAPI propose le modèle à seulement $0.04 par seconde (480p), les nouveaux utilisateurs recevant souvent $1–$5 de crédits gratuits lors de l'inscription.

Mar 5, 2026

Comment monter des vidéos avec Veo 3.1

Google a présenté publiquement Veo 3.1 (et une variante Veo 3.1 Fast) mi-octobre 2025 comme un modèle de conversion texte-vidéo amélioré produisant des vidéos courtes de plus haute qualité.

Jan 31, 2026

Qu'est-ce que vidu Q3 ? C'est peut-être le meilleur modèle vidéo d'IA en 2026.

Vidu Q3 est apparu début 2026 comme l’un des signes les plus clairs à ce jour que la génération de vidéos par l’IA est en train de passer de courts clips de nouveauté à un véritable récit narratif multi-plans. Dans les mois qui ont suivi sa mise à disposition à grande échelle, Vidu Q3 est devenu un incontournable des flux de travail des créateurs, des pilotes de recherche et des pilotes commerciaux — et pour de bonnes raisons : il repousse plus loin que la plupart des modèles antérieurs la durée, l’intégration audiovisuelle et la cohérence multi-plans, tout en offrant une API destinée aux développeurs pour une utilisation programmatique.