📘 Especificaciones técnicas de Grok Imagine Video
| Especificación | Detalles |
|---|---|
| ID del modelo | grok-imagine-video |
| Proveedor | xAI |
| Tipo | IA de generación y edición de video |
| Tipos de entrada | Texto (prompt); imagen o video opcionales. Prompts de texto (lenguaje natural); entrada de imagen opcional (imagen→video); parámetro opcional video_url para editar clips existentes. Las duraciones máximas del video de entrada para edición varían según el endpoint — se han reportado ~8.7s en algunos flujos de edición. |
| Tipos de salida | Video .mp4 mediante URL temporal |
| Rango de duración (generación) | 1–15 segundos |
| Resolución | 480p, 720p (configurable) |
| Relaciones de aspecto | 1:1, 16:9, 9:16 |
| Compatibilidad de edición | Sí — anima y modifica videos de hasta 8.7s |
| Moderación | Incluye moderación de contenido |
| Precios | Cobro por segundo, varía según la resolución |
🚀 ¿Qué es Grok Imagine Video?
Grok Imagine Video es el modelo avanzado de IA de generación y edición de video de xAI expuesto a través de CometAPI. Permite a los desarrolladores generar videos cortos y personalizados a partir de prompts en lenguaje natural y, opcionalmente, animar imágenes fijas o editar clips existentes. El modelo admite longitud de salida, resolución y relación de aspecto configurables, con moderación de contenido integrada para garantizar el cumplimiento de políticas.
🧠 Funciones principales (qué diferencia a Grok Imagine)
- Audio nativo + sincronización labial: Genera audio ambiental, efectos y locución/discurso breve con sincronización labial aproximada.
- Imagen→Video / edición por prompt: Anima una imagen fija o edita metraje existente mediante prompts de texto (eliminar/reemplazar objetos, retemporizar, cambiar de estilo).
- Iteración rápida y baja latencia: Diseñado para ciclos de retroalimentación rápidos, adecuados para flujos creativos y prototipado de producto.
- API de producción: Imagine API expone endpoints programáticos para generación por lotes, integración en pipelines de edición y controles empresariales.
- Múltiples “modos”/estilos: Modos orientados al usuario (ejemplos reportados: Normal / Fun / Spicy u otros preajustes similares) para sesgar las salidas por estilo o permisividad (nota: el modo “Spicy” históricamente habilitaba NSFW).
| Modelo (empresa) | Resolución máx. (público) | Longitud máx. del clip (público) | ¿Audio nativo? | Fortalezas | Advertencias |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sí | Iteración rápida, buen costo/latencia, edición integrada, audio nativo | Límite en 720p; preocupaciones de moderación; fidelidad variable en escenarios reales |
| Sora (OpenAI) | 720p–1080p (depende del nivel) | corto (6–15s) | Sí | Alta fidelidad visual; fuerte integración con el stack de OpenAI | Más caro; moderación/controles más restrictivos |
| Veo (Google DeepMind) | Hasta 1080p+ | corto (varía) | Sí | Fuerte fotorrealismo, movimiento estable | Costo más alto; menos experimentación pública |
| Runway Gen-4.5 | 1080p+ | corto (varía) | Sí | Adopción en la industria para flujos creativos, alta fidelidad | Más costoso; centrado en herramientas creativas |
| Vidu / Kling / Pika (varios especialistas) | hasta 1080p | corto (varía) | Mixto | Algunos ofrecen funciones de nicho (Smart Cuts, encadenado multishot) | Soporte de audio variable; diferente madurez de API |
⚠️ Limitaciones
- La duración máxima del video está limitada a 15 segundos.
- La edición conserva la duración del video de entrada (≤ 8.7s).
- Las URL generadas son efímeras — descargue con prontitud.
Cómo acceder e integrar Grok Imagine Video
Paso 1: Regístrese para obtener la clave de API
Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su Consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave de token: sk-xxxxx y envíe.
Paso 2: Envíe solicitudes a la API de Grok Imagine Video
Seleccione el endpoint “grok-imagine-video” para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para su conveniencia. Reemplace <YOUR_API_KEY> con su clave de CometAPI real de su cuenta. Dónde llamarlo: GROKGeneración de video y Edición de video.
Paso 3: Envíe solicitudes a la API de Grok Imagine Video
Introduzca texto o cargue una imagen (puede proporcionar opcionalmente una imagen de origen para animar). La API de Grok Imagine AI analiza su entrada y prepara el contenido para la URL. Se admiten tanto texto a video como imagen a video.
La imagen de origen se puede proporcionar como:
- Una URL pública que apunte a una imagen
- Un Data URI codificado en base64 (p. ej.,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Paso 4: Recupere y verifique los resultados
Procese la respuesta de la API para obtener el resultado generado. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida. Devuelve un request_id inmediatamente al enviar; utilice el endpoint GET para comprobar el estado y recuperar el video generado. La edición de video es asíncrona; es posible que deba consultar este endpoint varias veces hasta que la tarea se complete. Descargue con prontitud.




