Como faço para gerar um vídeo usando a API grok-imagine-video?

Você envia uma solicitação POST com o modelo 'grok-imagine-video', incluindo um prompt de texto e uma fonte opcional de imagem/vídeo; ela retorna um ID de tarefa e, em seguida, você consulta esse ID até que o status do vídeo seja 'done'.

Quais formatos de entrada o grok-imagine-video aceita?

Ele aceita um prompt em linguagem natural e URLs de imagem opcionais (ou imagens em base64) para animação; para edição, é fornecida uma URL de vídeo.

Quais são a duração máxima do vídeo e as opções de resolução?

O modelo oferece suporte à geração de vídeos de até 15 segundos e resoluções de até 720p, com proporções configuráveis como 16:9 ou 1:1.

Posso animar uma imagem estática em um vídeo com este modelo?

Sim, você pode animar uma imagem estática para criar movimento com base no seu prompt, usando URLs de imagem ou imagens codificadas na solicitação.

O grok-imagine-video oferece suporte à edição de vídeos existentes?

Sim — forneça a URL do vídeo de origem e suas instruções de edição; a saída mantém a duração e a resolução originais do vídeo.

Como funciona a moderação nas saídas do grok-imagine-video?

Os vídeos gerados estão sujeitos à moderação de conteúdo; conteúdos sinalizados podem ser filtrados ou bloqueados durante a geração.

A geração de vídeo é assíncrona?

Sim, a API retorna um ID de solicitação que você consulta para verificar quando o vídeo está pronto para download.

Como devo lidar com URLs de vídeo expiradas?

Os vídeos baixados devem ser salvos rapidamente; URLs temporárias podem expirar e se tornar inacessíveis após a geração.

API Grok Imagine Video Acessível | image-to-video

📘 Especificações técnicas do Grok Imagine Video

Especificação	Detalhes
ID do modelo	grok-imagine-video
Provedor	xAI
Tipo	IA de geração e edição de vídeo
Tipos de entrada	Texto (prompt); imagem ou vídeo opcionais Prompts de texto (linguagem natural); entrada de imagem opcional (imagem→vídeo); `video_url` opcional para editar clipes existentes. As durações máximas do vídeo de entrada para edição diferem por endpoint — relatado ~8.7s para alguns fluxos de edição.
Tipos de saída	Vídeo .mp4 via URL temporária
Faixa de duração (geração)	1–15 segundos
Resolução	480p, 720p (configurável)
Proporções de tela	1:1, 16:9, 9:16
Suporte a edição	Sim — anima e modifica vídeos de até 8.7s
Moderação	Moderação de conteúdo incluída
Preço	Cobrado por segundo, varia conforme a resolução

🚀 O que é o Grok Imagine Video?

Grok Imagine Video é o avançado modelo de IA de geração e edição de vídeo da xAI disponibilizado por meio da CometAPI. Ele permite que desenvolvedores gerem vídeos curtos e personalizados a partir de prompts em linguagem natural e, opcionalmente, animem imagens estáticas ou editem clipes existentes. O modelo oferece suporte a duração de saída, resolução e proporção de tela configuráveis, com moderação de conteúdo integrada para garantir conformidade com políticas.

🧠Principais recursos (o que diferencia o Grok Imagine)

Áudio nativo + sincronização labial: Gera áudio ambiente sincronizado, efeitos e fala curta / narração com sincronização labial aproximada.
Imagem→Vídeo / edição por prompt: Anime uma imagem estática ou edite filmagens existentes por meio de prompts de texto (remover/substituir objetos, reajustar tempo, mudar o estilo).
Iteração rápida e baixa latência: Projetado para ciclos rápidos de feedback, adequados para fluxos de trabalho criativos e prototipagem de produtos.
API de produção: A Imagine API expõe endpoints programáticos para geração em lote, integração em pipelines de edição e controles corporativos.
Múltiplos “modos” / estilos: Modos voltados ao usuário (exemplos relatados: Normal / Fun / Spicy ou presets semelhantes) para orientar as saídas em termos de estilo ou permissividade (observação: o modo “Spicy” historicamente permitia NSFW).

Modelo (empresa)	Resolução máx. (pública)	Duração máx. do clipe (pública)	Áudio nativo?	Pontos fortes	Ressalvas
Grok Imagine (xAI)	720p	6–15s	Sim	Iteração rápida, boa relação custo/latência, edição integrada, áudio nativo	Limite de 720p; preocupações com moderação; fidelidade variável no uso real
Sora (OpenAI)	720p–1080p (depende do plano)	curta (6–15s)	Sim	Alta fidelidade visual; forte integração com o ecossistema OpenAI	Mais caro; moderação/controles mais restritos
Veo (Google DeepMind)	Até 1080p+	curta (varia)	Sim	Forte fotorrealismo, movimento estável	Custo mais alto; menos experimentação pública
Runway Gen-4.5	1080p+	curta (varia)	Sim	Adoção pela indústria para fluxos criativos, alta fidelidade	Mais caro; focado em ferramentas criativas
Vidu / Kling / Pika (vários especialistas)	até 1080p	curta (varia)	Misto	Alguns oferecem recursos de nicho (Smart Cuts, encadeamento de múltiplos takes)	Suporte de áudio variado; maturidade de API diferente

⚠️ Limitações

O comprimento máximo do vídeo é limitado a 15 segundos.
A edição mantém a duração do vídeo de entrada (≤ 8.7s).
As URLs geradas são efêmeras — faça o download rapidamente.

Como acessar e integrar o Grok Imagine Video

Etapa 1: Cadastre-se para obter uma chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu console da CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API `Grok Imagine Video`

Selecione o endpoint “grok-imagine-video” para enviar a solicitação de API e definir o corpo da solicitação. O método da solicitação e o corpo da solicitação podem ser obtidos na documentação de API do nosso site. Nosso site também fornece testes no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI da sua conta. Onde chamá-la: GROKVideo Generation e Video Edit.

Etapa 3: Envie solicitações para a API `Grok Imagine Video`

Insira texto ou carregue uma imagem(Você pode opcionalmente fornecer uma imagem de origem para animar.). A API Grok Imagine AI analisa sua entrada e prepara o conteúdo para a URL. Há suporte tanto para conversão de texto em vídeo quanto de imagem em vídeo.

A imagem de origem pode ser fornecida como:

Uma URL pública apontando para uma imagem
Um URI de dados codificado em base64 (por exemplo, data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Etapa 4: Recupere e verifique os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída. Ela retorna um request_id imediatamente após o envio; use o endpoint GET para verificar o status e recuperar o vídeo gerado. A edição de vídeo é assíncrona, e talvez seja necessário consultar esse endpoint várias vezes até que a tarefa seja concluída. Faça o download rapidamente.

Preços para Grok Imagine Video

Explore preços competitivos para Grok Imagine Video, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Grok Imagine Video pode aprimorar seus projetos mantendo os custos gerenciáveis.

Pricing Overview

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Note: When generating video via API, you are charged per second. You will also be charged when using video or images as input.

Código de exemplo e API para Grok Imagine Video

Acesse código de exemplo abrangente e recursos de API para Grok Imagine Video para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do Grok Imagine Video em seus projetos.

Python
JavaScript
Curl

import os
import time
import requests

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/grok/v1"

headers = {
    "Authorization": f"Bearer {COMETAPI_KEY}",
    "Content-Type": "application/json",
}

# ============================================================
# Step 1: Create Video Generation Task
# ============================================================
print("Step 1: Creating video generation task...")

create_payload = {
    "model": "grok-imagine-video",
    "prompt": "A glowing crystal-powered rocket launching from the red dunes of Mars, ancient alien ruins lighting up in the background as it soars into a sky full of unfamiliar constellations",
    "duration": 10,
    "aspect_ratio": "16:9",
    "resolution": "720p",
}

create_response = requests.post(
    f"{BASE_URL}/videos/generations", headers=headers, json=create_payload
)

create_result = create_response.json()
print(f"Create response: {create_result}")

# Extract task ID from the response
task_id = create_result.get("request_id") or create_result.get("id")
if not task_id:
    print("Error: Failed to get task ID from response")
    exit(1)

print(f"Task ID: {task_id}")

# ============================================================
# Step 2: Poll for Task Status
# ============================================================
print("
Step 2: Polling task status...")

while True:
    query_response = requests.get(
        f"{BASE_URL}/videos/{task_id}", headers=headers
    )
    query_result = query_response.json()

    data = query_result.get("data", {})
    status = data.get("status", "unknown")
    progress = data.get("progress", "0%")
    print(f"Status: {status}, Progress: {progress}")

    if status in ["FAILURE", "failed"]:
        print("Video generation failed!")
        print(f"Reason: {data.get('fail_reason')}")
        exit(1)

    if status == "SUCCESS":
        video_url = data.get("data", {}).get("video", {}).get("url")
        print(f"Video generation completed!")
        print(f"Video URL: {video_url}")
        break

    time.sleep(10)

Python Code Example

import os
import time
import requests

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/grok/v1"

headers = {
    "Authorization": f"Bearer {COMETAPI_KEY}",
    "Content-Type": "application/json",
}

# ============================================================
# Step 1: Create Video Generation Task
# ============================================================
print("Step 1: Creating video generation task...")

create_payload = {
    "model": "grok-imagine-video",
    "prompt": "A glowing crystal-powered rocket launching from the red dunes of Mars, ancient alien ruins lighting up in the background as it soars into a sky full of unfamiliar constellations",
    "duration": 10,
    "aspect_ratio": "16:9",
    "resolution": "720p",
}

create_response = requests.post(
    f"{BASE_URL}/videos/generations", headers=headers, json=create_payload
)

create_result = create_response.json()
print(f"Create response: {create_result}")

# Extract task ID from the response
task_id = create_result.get("request_id") or create_result.get("id")
if not task_id:
    print("Error: Failed to get task ID from response")
    exit(1)

print(f"Task ID: {task_id}")

# ============================================================
# Step 2: Poll for Task Status
# ============================================================
print("\nStep 2: Polling task status...")

while True:
    query_response = requests.get(
        f"{BASE_URL}/videos/{task_id}", headers=headers
    )
    query_result = query_response.json()

    data = query_result.get("data", {})
    status = data.get("status", "unknown")
    progress = data.get("progress", "0%")
    print(f"Status: {status}, Progress: {progress}")

    if status in ["FAILURE", "failed"]:
        print("Video generation failed!")
        print(f"Reason: {data.get('fail_reason')}")
        exit(1)

    if status == "SUCCESS":
        video_url = data.get("data", {}).get("video", {}).get("url")
        print(f"Video generation completed!")
        print(f"Video URL: {video_url}")
        break

    time.sleep(10)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/grok/v1";

const headers = {
  "Authorization": `Bearer ${api_key}`,
  "Content-Type": "application/json",
};

// ============================================================
// Step 1: Create Video Generation Task
// ============================================================
console.log("Step 1: Creating video generation task...");

const createPayload = {
  model: "grok-imagine-video",
  prompt: "A glowing crystal-powered rocket launching from the red dunes of Mars, ancient alien ruins lighting up in the background as it soars into a sky full of unfamiliar constellations",
  duration: 10,
  aspect_ratio: "16:9",
  resolution: "720p",
};

const createResponse = await fetch(`${base_url}/videos/generations`, {
  method: "POST",
  headers: headers,
  body: JSON.stringify(createPayload),
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.request_id || createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task ID from response");
  process.exit(1);
}

console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 2: Poll for Task Status
// ============================================================
console.log("\nStep 2: Polling task status...");

const sleep = (ms) => new Promise((resolve) => setTimeout(resolve, ms));

while (true) {
  const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
    method: "GET",
    headers: headers,
  });

  const queryResult = await queryResponse.json();
  const data = queryResult?.data || {};
  const status = data?.status || "unknown";
  const progress = data?.progress || "0%";
  console.log(`Status: ${status}, Progress: ${progress}`);

  if (["FAILURE", "failed"].includes(status)) {
    console.log("Video generation failed!");
    console.log(`Reason: ${data?.fail_reason}`);
    process.exit(1);
  }

  if (status === "SUCCESS") {
    const videoUrl = data?.data?.video?.url;
    console.log("Video generation completed!");
    console.log(`Video URL: ${videoUrl}`);
    break;
  }

  await sleep(10000);
}

Curl Code Example

#!/bin/bash

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/grok/v1"

# ============================================================
# Step 1: Create Video Generation Task
# ============================================================
echo "Step 1: Creating video generation task..."

CREATE_RESPONSE=$(curl -s --location --request POST "${BASE_URL}/videos/generations" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data-raw '{
    "model": "grok-imagine-video",
    "prompt": "A glowing crystal-powered rocket launching from the red dunes of Mars, ancient alien ruins lighting up in the background as it soars into a sky full of unfamiliar constellations",
    "duration": 10,
    "aspect_ratio": "16:9",
    "resolution": "720p"
  }')

echo "Create response: $CREATE_RESPONSE"

# Extract task ID using jq (install with: brew install jq)
TASK_ID=$(echo "$CREATE_RESPONSE" | jq -r '.request_id // .id')

if [ "$TASK_ID" == "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task ID from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 2: Poll for Task Status
# ============================================================
echo ""
echo "Step 2: Polling task status..."

while true; do
  QUERY_RESPONSE=$(curl -s --location --request GET "${BASE_URL}/videos/${TASK_ID}" \
    --header "Authorization: Bearer $COMETAPI_KEY")

  STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
  PROGRESS=$(echo "$QUERY_RESPONSE" | jq -r '.data.progress')
  echo "Status: $STATUS, Progress: $PROGRESS"

  if [ "$STATUS" == "FAILURE" ] || [ "$STATUS" == "failed" ]; then
    echo "Video generation failed!"
    echo "$QUERY_RESPONSE" | jq -r '.data.fail_reason'
    exit 1
  fi

  if [ "$STATUS" == "SUCCESS" ]; then
    VIDEO_URL=$(echo "$QUERY_RESPONSE" | jq -r '.data.data.video.url')
    echo "Video generation completed!"
    echo "Video URL: $VIDEO_URL"
    break
  fi

  sleep 10
done

📘 Especificações técnicas do Grok Imagine Video

Especificação	Detalhes
ID do modelo	grok-imagine-video
Provedor	xAI
Tipo	IA de geração e edição de vídeo
Tipos de entrada	Texto (prompt); imagem ou vídeo opcionais Prompts de texto (linguagem natural); entrada de imagem opcional (imagem→vídeo); `video_url` opcional para editar clipes existentes. As durações máximas do vídeo de entrada para edição diferem por endpoint — relatado ~8.7s para alguns fluxos de edição.
Tipos de saída	Vídeo .mp4 via URL temporária
Faixa de duração (geração)	1–15 segundos
Resolução	480p, 720p (configurável)
Proporções de tela	1:1, 16:9, 9:16
Suporte a edição	Sim — anima e modifica vídeos de até 8.7s
Moderação	Moderação de conteúdo incluída
Preço	Cobrado por segundo, varia conforme a resolução

🚀 O que é o Grok Imagine Video?

🧠Principais recursos (o que diferencia o Grok Imagine)

Áudio nativo + sincronização labial: Gera áudio ambiente sincronizado, efeitos e fala curta / narração com sincronização labial aproximada.
Imagem→Vídeo / edição por prompt: Anime uma imagem estática ou edite filmagens existentes por meio de prompts de texto (remover/substituir objetos, reajustar tempo, mudar o estilo).
Iteração rápida e baixa latência: Projetado para ciclos rápidos de feedback, adequados para fluxos de trabalho criativos e prototipagem de produtos.
API de produção: A Imagine API expõe endpoints programáticos para geração em lote, integração em pipelines de edição e controles corporativos.
Múltiplos “modos” / estilos: Modos voltados ao usuário (exemplos relatados: Normal / Fun / Spicy ou presets semelhantes) para orientar as saídas em termos de estilo ou permissividade (observação: o modo “Spicy” historicamente permitia NSFW).

Modelo (empresa)	Resolução máx. (pública)	Duração máx. do clipe (pública)	Áudio nativo?	Pontos fortes	Ressalvas
Grok Imagine (xAI)	720p	6–15s	Sim	Iteração rápida, boa relação custo/latência, edição integrada, áudio nativo	Limite de 720p; preocupações com moderação; fidelidade variável no uso real
Sora (OpenAI)	720p–1080p (depende do plano)	curta (6–15s)	Sim	Alta fidelidade visual; forte integração com o ecossistema OpenAI	Mais caro; moderação/controles mais restritos
Veo (Google DeepMind)	Até 1080p+	curta (varia)	Sim	Forte fotorrealismo, movimento estável	Custo mais alto; menos experimentação pública
Runway Gen-4.5	1080p+	curta (varia)	Sim	Adoção pela indústria para fluxos criativos, alta fidelidade	Mais caro; focado em ferramentas criativas
Vidu / Kling / Pika (vários especialistas)	até 1080p	curta (varia)	Misto	Alguns oferecem recursos de nicho (Smart Cuts, encadeamento de múltiplos takes)	Suporte de áudio variado; maturidade de API diferente

⚠️ Limitações

O comprimento máximo do vídeo é limitado a 15 segundos.
A edição mantém a duração do vídeo de entrada (≤ 8.7s).
As URLs geradas são efêmeras — faça o download rapidamente.

Como acessar e integrar o Grok Imagine Video

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API `Grok Imagine Video`

Etapa 3: Envie solicitações para a API `Grok Imagine Video`

A imagem de origem pode ser fornecida como:

Uma URL pública apontando para uma imagem
Um URI de dados codificado em base64 (por exemplo, data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Grok Imagine Video

Mais modelos

Doubao-Seedance-2-0

Sora 2 Pro

Sora 2

mj_fast_video

Veo 3.1 Pro

Veo 3.1

Blogs relacionados

Como excluir vídeos do Grok Imagine em 2026: guia completo passo a passo

Como obter o Grok Imagine gratuitamente: acesso, preços e alternativas

O que é o Seedance 2.0? Uma análise abrangente

O que é o Grok 4.2: Recursos, Arquitetura e Comparações

Como usar a API do Grok 4.2 em 2026