API de Veo 3

CometAPI
AnnaNov 13, 2025
API de Veo 3

La API de Veo 3 es un punto final RESTful en Google Vertex AI que permite a los desarrolladores generar clips de audio y video sincronizados y de alta resolución a partir de indicaciones de texto o imágenes (con filtros de seguridad integrados y marcas de agua imperceptibles) en una sola solicitud.

DeepMind de Google Veo 3 representa la vanguardia de generación de texto a video, lo que marca la primera vez que un modelo de IA generativa a gran escala se sincroniza sin problemas vídeo de alta fidelidad con audio acompañante—incluyendo diálogos, efectos de sonido y paisajes sonoros ambientales.

Nuestras Caracteristicas y capacidades

  • Videoclips de 8 segundos:Genera secuencias de hasta ocho segundos con transiciones de tomas fluidas y uniones.
  • Generación de audio integrada: Produce diálogos, ruido ambiental, efectos de sonido y música de fondo en una sola pasada.
  • Salida de alta definición:Admite resoluciones de hasta 4K (3840 × 2160) con iluminación consistente, física realista y texturas de escena detalladas.
  • Entradas multimodales:Acepta ambos texto a vídeo y imagen a vídeo indicaciones, lo que permite flujos de trabajo creativos versátiles.

Estas capacidades permiten a los creadores crear narrativas casi cinematográficas sin necesidad de posproducción de audio separada ni procesos de edición complejos.

Detalles técnicos

La arquitectura de Veo 3 aprovecha una transformador multimodal entrenado en millones de vídeos de YouTube. Su marco codificador-decodificador procesa indicaciones de texto a través de un capa de tokenización de vídeo, generando características espaciotemporales que impulsan la módulo de síntesis visual. Simultáneamente, un rama de síntesis de audio produce salidas de sonido alineadas. A mecanismo de atención intermodal asegura que visual y audio Las modalidades se mantienen estrechamente acopladas, lo que reduce los artefactos de desincronización. El entrenamiento implicó miles de millones de actualizaciones de parámetros, optimizado mediante clústeres de GPU de precisión mixta en Google Cloud Vértice AI plataforma.

Rendimiento de referencia

En evaluaciones comparativas internas, Veo 3 demuestra:

  • PSNR (Relación señal-ruido pico) de 38 dB en conjuntos de datos de vídeo estándar, superando a Veo 2 por 4 dB.
  • SSIM (Índice de similitud estructural) puntuaciones de 0.92, lo que indica una alta fidelidad visual.
  • Error de sincronización de audio y vídeo a continuación 15 ms, garantizando un desfase imperceptible entre el sonido y el movimiento.
  • Velocidad de inferencia: ~12 cuadros por segundo en una GPU NVIDIA A100, lo que permite la generación casi en tiempo real de clips cortos.
    Estas métricas posicionan a Veo 3 a la vanguardia de la IA de video generativo, eclipsando a modelos de video contemporáneos como Sora y Meta recientes en ambos. y sincronización.

Versiones del modelo y evolución

  • Veo 1 (Mayo de 2024): Lanzado en Google I/O 2024, presentado Vídeo silencioso de 1080p Generación de más de un minuto.
  • Veo 2 (Diciembre de 2024): Actualizado a Soporte 4K y la mejora de dinámica física comprensión .
  • Veo 3 (Mayo de 2025): Añadido síntesis de audio, realismo mejorado e Salida 4K, lo que marca un salto significativo en generación multimodal.

Cómo llamar a la API de Veo 3 desde CometAPI

Veo 3 Precios de la API en CometAPI, inferiores al precio oficial:

Nombre del modeloPrecio
veo3-pro$2
veo3-rápido$0.4
veo3$2
marcos veo3-pro$0.4

veo3,veo3-pro,veo3-fast,**veo3-pro-frames**Es el último modelo de generación de video lanzado oficialmente por Google. Los videos generados tienen sonido. Es el único modelo de video con sonido del mundo. veo3-pro-frames Admite el modo de primer cuadro. Este modelo sigue el formato de llamada estándar de OpenAI Chat.

Pasos requeridos

  • Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
  • Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
  • Obtenga la URL de este sitio: https://api.cometapi.com/

Ejemplo de código

  1. Seleccione la opción "**veo3-pro**Punto final "etc. para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad.
  2. Modificar el BASE_URL en su aplicación a nuestra dirección de interfaz.La URL está determinada por las necesidades específicas de su aplicación.
  3. Reemplazar con su clave CometAPI real de su cuenta.

Si tiene alguna pregunta sobre la convocatoria o alguna sugerencia para nosotros, contáctenos a través de las redes sociales y la dirección de correo electrónico. soporte@cometapi.com.

Casos de uso:

Enviar tarea de generación de video (Doc: disponible aquí): https://api.cometapi.com/veo/v1/video/create

Consultar el estado de generación del vídeo: https://api.cometapi.com/veo/v1/video/query/{taskId}

Ejemplo de uso del código API de CometAPI

import requests
def main():
url = " https://api.cometapi.com/veo/v1/video/create"
payload = {
"model": "veo3-pro",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if name == "main":
main()

Vea también 3 métodos para usar Google Veo 3 en 2025

SHARE THIS BLOG

500+ Modelos en Una API

Hasta 20% de Descuento