📘 Especificações técnicas do Grok Imagine Video
| Especificação | Detalhes |
|---|---|
| ID do modelo | grok-imagine-video |
| Provedor | xAI |
| Tipo | IA de geração e edição de vídeo |
| Tipos de entrada | Texto (prompt); imagem ou vídeo opcionais Prompts de texto (linguagem natural); entrada de imagem opcional (imagem→vídeo); video_url opcional para editar clipes existentes. As durações máximas do vídeo de entrada para edição diferem por endpoint — relatado ~8.7s para alguns fluxos de edição. |
| Tipos de saída | Vídeo .mp4 via URL temporária |
| Faixa de duração (geração) | 1–15 segundos |
| Resolução | 480p, 720p (configurável) |
| Proporções de tela | 1:1, 16:9, 9:16 |
| Suporte a edição | Sim — anima e modifica vídeos de até 8.7s |
| Moderação | Moderação de conteúdo incluída |
| Preço | Cobrado por segundo, varia conforme a resolução |
🚀 O que é o Grok Imagine Video?
Grok Imagine Video é o avançado modelo de IA de geração e edição de vídeo da xAI disponibilizado por meio da CometAPI. Ele permite que desenvolvedores gerem vídeos curtos e personalizados a partir de prompts em linguagem natural e, opcionalmente, animem imagens estáticas ou editem clipes existentes. O modelo oferece suporte a duração de saída, resolução e proporção de tela configuráveis, com moderação de conteúdo integrada para garantir conformidade com políticas.
🧠Principais recursos (o que diferencia o Grok Imagine)
- Áudio nativo + sincronização labial: Gera áudio ambiente sincronizado, efeitos e fala curta / narração com sincronização labial aproximada.
- Imagem→Vídeo / edição por prompt: Anime uma imagem estática ou edite filmagens existentes por meio de prompts de texto (remover/substituir objetos, reajustar tempo, mudar o estilo).
- Iteração rápida e baixa latência: Projetado para ciclos rápidos de feedback, adequados para fluxos de trabalho criativos e prototipagem de produtos.
- API de produção: A Imagine API expõe endpoints programáticos para geração em lote, integração em pipelines de edição e controles corporativos.
- Múltiplos “modos” / estilos: Modos voltados ao usuário (exemplos relatados: Normal / Fun / Spicy ou presets semelhantes) para orientar as saídas em termos de estilo ou permissividade (observação: o modo “Spicy” historicamente permitia NSFW).
| Modelo (empresa) | Resolução máx. (pública) | Duração máx. do clipe (pública) | Áudio nativo? | Pontos fortes | Ressalvas |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sim | Iteração rápida, boa relação custo/latência, edição integrada, áudio nativo | Limite de 720p; preocupações com moderação; fidelidade variável no uso real |
| Sora (OpenAI) | 720p–1080p (depende do plano) | curta (6–15s) | Sim | Alta fidelidade visual; forte integração com o ecossistema OpenAI | Mais caro; moderação/controles mais restritos |
| Veo (Google DeepMind) | Até 1080p+ | curta (varia) | Sim | Forte fotorrealismo, movimento estável | Custo mais alto; menos experimentação pública |
| Runway Gen-4.5 | 1080p+ | curta (varia) | Sim | Adoção pela indústria para fluxos criativos, alta fidelidade | Mais caro; focado em ferramentas criativas |
| Vidu / Kling / Pika (vários especialistas) | até 1080p | curta (varia) | Misto | Alguns oferecem recursos de nicho (Smart Cuts, encadeamento de múltiplos takes) | Suporte de áudio variado; maturidade de API diferente |
⚠️ Limitações
- O comprimento máximo do vídeo é limitado a 15 segundos.
- A edição mantém a duração do vídeo de entrada (≤ 8.7s).
- As URLs geradas são efêmeras — faça o download rapidamente.
Como acessar e integrar o Grok Imagine Video
Etapa 1: Cadastre-se para obter uma chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu console da CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API Grok Imagine Video
Selecione o endpoint “grok-imagine-video” para enviar a solicitação de API e definir o corpo da solicitação. O método da solicitação e o corpo da solicitação podem ser obtidos na documentação de API do nosso site. Nosso site também fornece testes no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI da sua conta. Onde chamá-la: GROKVideo Generation e Video Edit.
Etapa 3: Envie solicitações para a API Grok Imagine Video
Insira texto ou carregue uma imagem(Você pode opcionalmente fornecer uma imagem de origem para animar.). A API Grok Imagine AI analisa sua entrada e prepara o conteúdo para a URL. Há suporte tanto para conversão de texto em vídeo quanto de imagem em vídeo.
A imagem de origem pode ser fornecida como:
- Uma URL pública apontando para uma imagem
- Um URI de dados codificado em base64 (por exemplo,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Etapa 4: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída. Ela retorna um request_id imediatamente após o envio; use o endpoint GET para verificar o status e recuperar o vídeo gerado. A edição de vídeo é assíncrona, e talvez seja necessário consultar esse endpoint várias vezes até que a tarefa seja concluída. Faça o download rapidamente.




