📘 Especificaciones técnicas de Grok Imagine Video
| Especificación | Detalles |
|---|---|
| Model ID | grok-imagine-video |
| Provider | xAI |
| Type | IA de generación y edición de video |
| Input Types | Texto (prompt); imagen o video opcional. Prompts de texto (lenguaje natural); entrada de imagen opcional (imagen→video); video_url opcional para editar clips existentes. Las duraciones máximas del video de entrada para edición difieren según el endpoint — reportado ~8.7s en algunos flujos de edición. |
| Output Types | Video .mp4 mediante URL temporal |
| Duration Range (generate) | 1–15 segundos |
| Resolution | 480p, 720p (configurable) |
| Aspect Ratios | 1:1, 16:9, 9:16 |
| Edit Support | Sí — anima y modifica videos de hasta 8.7s |
| Moderation | Moderación de contenido incluida |
| Pricing | Cobro por segundo, varía según la resolución |
🚀 ¿Qué es Grok Imagine Video?
Grok Imagine Video es el modelo avanzado de IA de generación y edición de video de xAI expuesto a través de CometAPI. Permite a los desarrolladores generar videos cortos y personalizados a partir de prompts de lenguaje natural y, opcionalmente, animar imágenes estáticas o editar clips existentes. El modelo admite longitud de salida, resolución y relación de aspecto configurables, con moderación de contenido integrada para garantizar el cumplimiento de las políticas.
🧠 Características principales (qué diferencia a Grok Imagine)
- Audio nativo + sincronización labial: Genera audio ambiental, efectos y habla/narración corta sincronizada, con sincronización labial aproximada.
- Imagen→Video / edición mediante prompt: Animar una imagen fija o editar metraje existente mediante prompts de texto (eliminar/reemplazar objetos, ajustar el tiempo, cambiar el estilo).
- Iteración rápida y baja latencia: Diseñado para ciclos de retroalimentación rápidos, adecuados para flujos creativos y prototipado de productos.
- API de producción: Imagine API expone endpoints programáticos para generación por lotes, integración en pipelines de edición y controles empresariales.
- Múltiples “modos” / estilos: Modos orientados al usuario (ejemplos reportados: Normal / Fun / Spicy u otros preajustes similares) para sesgar las salidas en estilo o permisividad (nota: el modo “Spicy” históricamente habilitaba NSFW).
| Modelo (empresa) | Resolución máx. (pública) | Longitud máx. del clip (pública) | ¿Audio nativo? | Fortalezas | Advertencias |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sí | Iteración rápida, buen coste/latencia, edición integrada, audio nativo | Límite 720p; preocupaciones de moderación; fidelidad variable en el mundo real |
| Sora (OpenAI) | 720p–1080p (depende del nivel) | corto (6–15s) | Sí | Alta fidelidad visual; fuerte integración con el stack de OpenAI | Más caro; moderación/controles más restrictivos |
| Veo (Google DeepMind) | Hasta 1080p+ | corto (varía) | Sí | Gran fotorrealismo, movimiento estable | Coste más alto; menor experimentación pública |
| Runway Gen-4.5 | 1080p+ | corto (varía) | Sí | Adopción en la industria para flujos creativos, alta fidelidad | Más costoso; centrado en herramientas creativas |
| Vidu / Kling / Pika (especialistas varios) | hasta 1080p | corto (varía) | Mixto | Algunos ofrecen funciones de nicho (Smart Cuts, encadenado multi-toma) | Soporte de audio variable; distinta madurez de API |
⚠️ Limitaciones
- La duración máxima del video está limitada a 15 segundos.
- La edición conserva la duración del video de entrada (≤ 8.7s).
- Las URL generadas son efímeras — descargue de inmediato.
Cómo acceder e integrar Grok Imagine Video
Paso 1: Registrarse para obtener la clave de API
Acceda a cometapi.com. Si aún no es usuario, por favor regístrese primero. Inicie sesión en su CometAPI console. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
Paso 2: Envíe solicitudes a la API Grok Imagine Video
Seleccione el endpoint “grok-imagine-video” para enviar la solicitud de API y establecer el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio también proporciona pruebas en Apifox para su comodidad. Reemplace <YOUR_API_KEY> con su clave real de CometAPI de su cuenta. Dónde llamarlo: GROK Generación de video y Edición de video.
Paso 3: Envíe solicitudes a la API Grok Imagine Video
Ingrese texto o cargue una imagen (Puede proporcionar opcionalmente una imagen de origen para animar). La API de Grok Imagine AI analiza su entrada y prepara el contenido para url. Se admiten tanto conversión de texto a video como de imagen a video.
La imagen de origen puede proporcionarse como:
- Una URL pública que apunte a una imagen
- Un URI de datos codificado en base64 (p. ej.,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Paso 4: Recupere y verifique los resultados
Procese la respuesta de la API para obtener el resultado generado. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida. Devuelve un request_id inmediatamente al enviar; utilice el endpoint GET para comprobar el estado y recuperar el video generado. La edición de video es asíncrona, puede que deba consultar este endpoint múltiples veces hasta que la tarea se complete. Por favor descargue de inmediato.