ModèlesTarificationEntreprise
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Entreprise
À proposEntreprise
Ressources
Modèles d'IABlogJournal des modificationsSupport
Conditions d'utilisationPolitique de confidentialité
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3
G

Veo 3

Par Seconde:$0.05
Google DeepMind-тің Veo 3-і мәтіннен бейне генерациялау саласының ең озық деңгейін білдіреді, әрі ірі ауқымды генеративті ЖИ моделі алғаш рет жоғары сапалы бейнені ілескен аудиомен — диалог, дыбыстық эффектілер және қоршаған орта дыбыстары — мінсіз түрде синхрондайды.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Fonctionnalités et capacités essentielles

  • Clips vidéo de 8 secondes: Génère des séquences allant jusqu’à huit secondes avec des transitions de plans et un assemblage fluides.
  • Génération audio intégrée: Produit des dialogues, des bruits d’ambiance, des effets sonores et une musique de fond en un seul passage.
  • Sortie haute définition: Prend en charge des résolutions jusqu’au 4K (3840 × 2160) avec un éclairage homogène, une physique réaliste et des textures de scène détaillées.
  • Entrées multimodales: Accepte des invites texte‑vers‑vidéo et image‑vers‑vidéo, permettant des flux de création polyvalents.

Ces capacités permettent aux créateurs de concevoir des récits quasi cinématographiques sans post‑production audio séparée ni pipelines de montage complexes .

Détails techniques

L’architecture de Veo 3 s’appuie sur un transformeur multimodal entraîné sur des millions de vidéos YouTube. Son architecture encodeur–décodeur traite les invites textuelles via une couche de tokenisation vidéo, générant des caractéristiques spatio‑temporelles qui alimentent le module de synthèse visuelle. Parallèlement, une branche de synthèse audio produit des sorties sonores alignées. Un mécanisme d’attention intermodale garantit que les modalités visuelle et audio restent étroitement couplées, réduisant les artefacts de désynchronisation. L’entraînement a impliqué des milliards de mises à jour de paramètres, optimisées via des clusters GPU en précision mixte sur la plateforme Vertex AI de Google Cloud .

Performances de référence

Dans des benchmarks internes, Veo 3 présente :

  • PSNR (rapport signal‑bruit de crête) de 38 dB sur des jeux de données vidéo standard, surpassant Veo 2 de 4 dB.
  • SSIM (indice de similarité structurelle) de 0.92, indiquant une grande fidélité visuelle.
  • Erreur de synchronisation audio‑vidéo inférieure à 15 ms, garantissant un décalage imperceptible entre le son et le mouvement.
  • Vitesse d’inférence : ~12 images par seconde sur un GPU NVIDIA A100, permettant une génération quasi en temps réel pour des clips courts.
    Ces mesures placent Veo 3 à l’avant‑garde de l’IA vidéo générative, surpassant des contemporains comme Sora et les modèles vidéo récents de Meta, tant en termes de qualité que de synchronisation.
  • Comment accéder à l’API Veo 3

Étape 1 : Inscrivez-vous pour obtenir une clé API

Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur chez nous, veuillez vous inscrire d’abord. Connectez-vous à votre console CometAPI. Récupérez la clé API d’accès à l’interface. Cliquez sur « Add Token » au niveau du jeton API dans le centre personnel, obtenez la clé de jeton : sk-xxxxx et soumettez.

Étape 2 : Envoyez des requêtes à l’API Veo 3

Sélectionnez le point de terminaison “\Veo 3 \” pour envoyer la requête API et définir le corps de la requête. La méthode de requête et le corps de la requête sont fournis dans la documentation API de notre site Web. Notre site Web propose également des tests via Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. l’URL de base est Veo3 Async Generation(https://api.cometapi.com/v1/videos).

Insérez votre question ou votre requête dans le champ content — c’est à cela que le modèle répondra . Traitez la réponse de l’API pour obtenir le résultat généré.

Étape 3 : Récupérez et vérifiez les résultats

Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API renvoie le statut de la tâche et les données de sortie.

Tarification pour Veo 3

Découvrez des tarifs compétitifs pour Veo 3, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Veo 3 peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)Remise
Par Seconde:$0.05
Par Seconde:$0.0625
-20%

Exemple de code et API pour Veo 3

Accédez à des exemples de code complets et aux ressources API pour Veo 3 afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Veo 3 dans vos projets.
POST
/v1/videos

Versions de Veo 3

La raison pour laquelle Veo 3 dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.
veo3
veo3-framesLe modèle veo3-frames est spécifiquement optimisé pour la génération de séquences d’images. Le modèle veo3-frames est spécifiquement optimisé pour la génération de séquences d’images et comprend un schéma prenant en charge la première et la dernière image.