API do Veo 3

CometAPI
AnnaNov 13, 2025
API do Veo 3

A API Veo 3 é um ponto de extremidade RESTful no Google Vertex AI que permite aos desenvolvedores gerar clipes de vídeo e áudio sincronizados e de alta resolução a partir de prompts de texto ou imagem, completos com filtros de segurança integrados e marcas d'água imperceptíveis, em uma única solicitação.

Google DeepMind Veo 3 representa a vanguarda da geração de texto para vídeo, marcando a primeira vez que um modelo de IA generativo em larga escala sincroniza perfeitamente vídeo de alta fidelidade com áudio de acompanhamento—incluindo diálogos, efeitos sonoros e paisagens sonoras ambientes.

Setores de Recursos e Capacidades

  • Clipes de vídeo de 8 segundos: Gera sequências de até oito segundos com transições de tomadas e costuras perfeitas.
  • Geração de Áudio Integrada: Produz diálogos, ruído ambiente, efeitos sonoros e música de fundo em uma única passagem.
  • Saída de alta definição: Suporta resoluções de até 4K (3840 × 2160) com iluminação consistente, física realista e texturas de cena detalhadas.
  • Entradas multimodais: Aceita ambos texto para vídeo e imagem para vídeo prompts, permitindo fluxos de trabalho criativos versáteis.

Esses recursos permitem que os criadores criem narrativas quase cinematográficas sem pós-produção de áudio separada ou processos de edição complexos.

Detalhes Técnicos

A arquitetura do Veo 3 aproveita uma transformador multimodal treinado em milhões de vídeos do YouTube. Sua estrutura codificador-decodificador processa prompts de texto por meio de um camada de tokenização de vídeo, gerando características espaço-temporais que impulsionam o módulo de síntese visual. Simultaneamente, um ramo de síntese de áudio produz saídas sonoras alinhadas. A mecanismo de atenção intermodal Assegura que visual e auditivo as modalidades permanecem fortemente acopladas, reduzindo artefatos de dessincronização. O treinamento envolveu bilhões de atualizações de parâmetros, otimizado via clusters de GPU de precisão mista no Google Cloud Vertex AI plataforma.

Desempenho de referência

Em benchmarks internos, o Veo 3 demonstra:

  • PSNR (Relação sinal-ruído de pico) de 38 dB em conjuntos de dados de vídeo padrão, superando o Veo 2 em 4 dB.
  • SSIM (Índice de Similaridade Estrutural) pontuações de 0.92, indicando alta fidelidade visual.
  • Erro de sincronização de áudio e vídeo abaixo 15 ms, garantindo um atraso imperceptível entre som e movimento.
  • Velocidade de inferência:~12 quadros por segundo em uma GPU NVIDIA A100, permitindo geração quase em tempo real para clipes curtos.
    Essas métricas posicionam o Veo 3 na vanguarda da IA ​​de vídeo generativa, eclipsando contemporâneos como Sora e os modelos de vídeo recentes da Meta em ambos qualidade e Sincronização.

Versões e Evolução do Modelo

  • Veo 1 (Maio de 2024): Lançado no Google I/O 2024, introduzido Vídeo silencioso 1080p geração ao longo de um minuto.
  • Veo 2 (Dezembro de 2024): Atualizado para Suporte 4K e melhorado dinâmica física entendimento .
  • Veo 3 (Maio de 2025): Adicionado síntese de áudio, realismo aprimorado e Saída 4K, marcando um salto significativo em geração multimodal.

Como chamar a API Veo 3 do CometAPI

Veo 3 Preço da API no CometAPI, menor que o preço oficial:

Nome do modeloPreço
veo3-pro$2
veo3-rápido$0.4
veo3$2
quadros veo3-pro$0.4

veo3,veo3-pro,veo3-fast,veo3-pro-frames:É o modelo de última geração de vídeo lançado oficialmente pelo Google. Os vídeos gerados têm som. É o único modelo de vídeo com som no mundo. veo3-pro-frames suporta o modo de primeiro quadro. Este modelo segue o formato padrão de chamada de chat do OpenAI

Etapas Necessárias

  • Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
  • Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
  • Obtenha a URL deste site: https://api.cometapi.com/

Exemplo de Código

  1. Selecione a opção "veo3-pro”etc endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência.
  2. Modifique o BASE_URL em sua aplicação para nosso endereço de interface.O URL é determinado pelas necessidades específicas da sua aplicação.
  3. Substituir com sua chave CometAPI real da sua conta.

Se você tiver alguma dúvida sobre a chamada ou tiver alguma sugestão para nós, entre em contato conosco pelas redes sociais e pelo endereço de e-mail support@cometapi.com.

Casos de uso:

Enviar tarefa de geração de vídeo (Documento: disponíveis aqui): https://api.cometapi.com/veo/v1/video/create

Consultar status de geração de vídeo: https://api.cometapi.com/veo/v1/video/query/{taskId}

Exemplo de uso do código API CometAPI

import requests
def main():
url = " https://api.cometapi.com/veo/v1/video/create"
payload = {
"model": "veo3-pro",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if name == "main":
main()

Veja também 3 métodos para usar o Google Veo 3 em 2025

SHARE THIS BLOG

500+ Modelos em Uma API

Até 20% de Desconto