📘 Especificações técnicas do Grok Imagine Video
| Especificação | Detalhes |
|---|---|
| ID do modelo | grok-imagine-video |
| Provedor | xAI |
| Tipo | IA de geração e edição de vídeo |
| Tipos de entrada | Texto (prompt); imagem ou vídeo opcionais Prompts de texto (linguagem natural); entrada de imagem opcional (imagem→vídeo); video_url opcional para editar clipes existentes. As durações máximas do vídeo de entrada para edição diferem por endpoint — relatado ~8.7s em alguns fluxos de edição. |
| Tipos de saída | Vídeo .mp4 via URL temporária |
| Intervalo de duração (geração) | 1–15 segundos |
| Resolução | 480p, 720p (configurável) |
| Proporções | 1:1, 16:9, 9:16 |
| Suporte a edição | Sim — anima e modifica vídeos de até 8.7s |
| Moderação | Moderação de conteúdo incluída |
| Preços | Cobrança por segundo, varia conforme a resolução |
🚀 O que é Grok Imagine Video?
Grok Imagine Video é o modelo avançado de IA de geração e edição de vídeo da xAI exposto via CometAPI. Ele permite que desenvolvedores gerem vídeos curtos e personalizados a partir de prompts em linguagem natural e, opcionalmente, animem imagens estáticas ou editem clipes existentes. O modelo suporta comprimento, resolução e proporção de imagem configuráveis, com moderação de conteúdo integrada para garantir conformidade com as políticas.
🧠 Principais recursos (o que diferencia o Grok Imagine)
- Áudio nativo + sincronização labial: Gera áudio ambiente sincronizado, efeitos e fala/narração curta com sincronização labial aproximada.
- Imagem→Vídeo / edição por prompt: Anima uma imagem fixa ou edita filmagens existentes via prompts de texto (remover/substituir objetos, ajustar tempo, mudar estilo).
- Iteração rápida e baixa latência: Projetado para ciclos de feedback rápidos adequados a fluxos criativos e prototipagem de produtos.
- API de produção: Imagine API expõe endpoints programáticos para geração em lote, integração em pipelines de edição e controles empresariais.
- Vários “modos” / estilos: Modos voltados ao usuário (exemplos relatados: Normal / Fun / Spicy ou presets semelhantes) para orientar os resultados em termos de estilo ou permissividade (observação: o modo “Spicy” historicamente habilitava NSFW).
| Modelo (empresa) | Resolução máx. (público) | Comprimento máx. do clipe (público) | Áudio nativo? | Pontos fortes | Observações |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sim | Iteração rápida, bom custo/latência, edição integrada, áudio nativo | Limite de 720p; preocupações de moderação; fidelidade variável no mundo real |
| Sora (OpenAI) | 720p–1080p (depende do nível) | curto (6–15s) | Sim | Alta fidelidade visual; forte integração com o stack da OpenAI | Mais caro; moderação/controles mais restritos |
| Veo (Google DeepMind) | Até 1080p+ | curto (varia) | Sim | Fotorrealismo forte, movimento estável | Custo mais alto; menos experimentação pública |
| Runway Gen-4.5 | 1080p+ | curto (varia) | Sim | Adoção na indústria para fluxos criativos, alta fidelidade | Mais caro; focado em ferramentas criativas |
| Vidu / Kling / Pika (vários especialistas) | até 1080p | curto (varia) | Misto | Alguns oferecem recursos de nicho (Smart Cuts, encadeamento multi-shot) | Suporte de áudio variado; maturidade de API diferente |
⚠️ Limitações
- O comprimento máximo do vídeo é limitado a 15 segundos.
- A edição mantém o comprimento do vídeo de entrada (≤ 8.7s).
- As URLs geradas são efêmeras — faça o download prontamente.
Como acessar e integrar o Grok Imagine Video
Etapa 1: Inscreva-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu console do CometAPI. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API Grok Imagine Video
Selecione o endpoint “grok-imagine-video” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação da API em nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. Onde chamar: GROK Geração de vídeo e Edição de vídeo.
Etapa 3: Envie solicitações para a API Grok Imagine Video
Insira texto ou envie uma imagem (você pode opcionalmente fornecer uma imagem de origem para animar). A Grok Imagine AI API analisa sua entrada e prepara o conteúdo para URL. São suportadas conversões de texto para vídeo e de imagem para vídeo.
A imagem de origem pode ser fornecida como:
- Uma URL pública apontando para uma imagem
- Um data URI codificado em base64 (por exemplo,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Etapa 4: Recupere e verifique os resultados
Procese a resposta da API para obter o resultado gerado. Após o processamento, a API responde com o status da tarefa e os dados de saída. Ela retorna um request_id imediatamente após o envio; use o endpoint GET para verificar o status e recuperar o vídeo gerado. A edição de vídeo é assíncrona; pode ser necessário consultar esse endpoint várias vezes até a conclusão da tarefa. Faça o download prontamente.