📘 Especificaciones técnicas de Grok Imagine Video

Especificación	Detalles
Model ID	grok-imagine-video
Provider	xAI
Type	IA de generación y edición de video
Input Types	Texto (prompt); imagen o video opcional. Prompts de texto (lenguaje natural); entrada de imagen opcional (imagen→video); video_url opcional para editar clips existentes. Las duraciones máximas del video de entrada para edición difieren según el endpoint — reportado ~8.7s en algunos flujos de edición.
Output Types	Video .mp4 mediante URL temporal
Duration Range (generate)	1–15 segundos
Resolution	480p, 720p (configurable)
Aspect Ratios	1:1, 16:9, 9:16
Edit Support	Sí — anima y modifica videos de hasta 8.7s
Moderation	Moderación de contenido incluida
Pricing	Cobro por segundo, varía según la resolución

🚀 ¿Qué es Grok Imagine Video?

Grok Imagine Video es el modelo avanzado de IA de generación y edición de video de xAI expuesto a través de CometAPI. Permite a los desarrolladores generar videos cortos y personalizados a partir de prompts de lenguaje natural y, opcionalmente, animar imágenes estáticas o editar clips existentes. El modelo admite longitud de salida, resolución y relación de aspecto configurables, con moderación de contenido integrada para garantizar el cumplimiento de las políticas.

🧠 Características principales (qué diferencia a Grok Imagine)

Audio nativo + sincronización labial: Genera audio ambiental, efectos y habla/narración corta sincronizada, con sincronización labial aproximada.
Imagen→Video / edición mediante prompt: Animar una imagen fija o editar metraje existente mediante prompts de texto (eliminar/reemplazar objetos, ajustar el tiempo, cambiar el estilo).
Iteración rápida y baja latencia: Diseñado para ciclos de retroalimentación rápidos, adecuados para flujos creativos y prototipado de productos.
API de producción: Imagine API expone endpoints programáticos para generación por lotes, integración en pipelines de edición y controles empresariales.
Múltiples “modos” / estilos: Modos orientados al usuario (ejemplos reportados: Normal / Fun / Spicy u otros preajustes similares) para sesgar las salidas en estilo o permisividad (nota: el modo “Spicy” históricamente habilitaba NSFW).

Modelo (empresa)	Resolución máx. (pública)	Longitud máx. del clip (pública)	¿Audio nativo?	Fortalezas	Advertencias
Grok Imagine (xAI)	720p	6–15s	Sí	Iteración rápida, buen coste/latencia, edición integrada, audio nativo	Límite 720p; preocupaciones de moderación; fidelidad variable en el mundo real
Sora (OpenAI)	720p–1080p (depende del nivel)	corto (6–15s)	Sí	Alta fidelidad visual; fuerte integración con el stack de OpenAI	Más caro; moderación/controles más restrictivos
Veo (Google DeepMind)	Hasta 1080p+	corto (varía)	Sí	Gran fotorrealismo, movimiento estable	Coste más alto; menor experimentación pública
Runway Gen-4.5	1080p+	corto (varía)	Sí	Adopción en la industria para flujos creativos, alta fidelidad	Más costoso; centrado en herramientas creativas
Vidu / Kling / Pika (especialistas varios)	hasta 1080p	corto (varía)	Mixto	Algunos ofrecen funciones de nicho (Smart Cuts, encadenado multi-toma)	Soporte de audio variable; distinta madurez de API

⚠️ Limitaciones

La duración máxima del video está limitada a 15 segundos.
La edición conserva la duración del video de entrada (≤ 8.7s).
Las URL generadas son efímeras — descargue de inmediato.

Cómo acceder e integrar Grok Imagine Video

Paso 1: Registrarse para obtener la clave de API

Acceda a cometapi.com. Si aún no es usuario, por favor regístrese primero. Inicie sesión en su CometAPI console. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.

Paso 2: Envíe solicitudes a la API `Grok Imagine Video`

Seleccione el endpoint “grok-imagine-video” para enviar la solicitud de API y establecer el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio también proporciona pruebas en Apifox para su comodidad. Reemplace <YOUR_API_KEY> con su clave real de CometAPI de su cuenta. Dónde llamarlo: GROK Generación de video y Edición de video.

Paso 3: Envíe solicitudes a la API `Grok Imagine Video`

Ingrese texto o cargue una imagen (Puede proporcionar opcionalmente una imagen de origen para animar). La API de Grok Imagine AI analiza su entrada y prepara el contenido para url. Se admiten tanto conversión de texto a video como de imagen a video.

La imagen de origen puede proporcionarse como:

Una URL pública que apunte a una imagen
Un URI de datos codificado en base64 (p. ej., data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Paso 4: Recupere y verifique los resultados

Procese la respuesta de la API para obtener el resultado generado. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida. Devuelve un request_id inmediatamente al enviar; utilice el endpoint GET para comprobar el estado y recuperar el video generado. La edición de video es asíncrona, puede que deba consultar este endpoint múltiples veces hasta que la tarea se complete. Por favor descargue de inmediato.

📘 Especificaciones técnicas de Grok Imagine Video

Especificación	Detalles
Model ID	grok-imagine-video
Provider	xAI
Type	IA de generación y edición de video
Input Types	Texto (prompt); imagen o video opcional. Prompts de texto (lenguaje natural); entrada de imagen opcional (imagen→video); video_url opcional para editar clips existentes. Las duraciones máximas del video de entrada para edición difieren según el endpoint — reportado ~8.7s en algunos flujos de edición.
Output Types	Video .mp4 mediante URL temporal
Duration Range (generate)	1–15 segundos
Resolution	480p, 720p (configurable)
Aspect Ratios	1:1, 16:9, 9:16
Edit Support	Sí — anima y modifica videos de hasta 8.7s
Moderation	Moderación de contenido incluida
Pricing	Cobro por segundo, varía según la resolución

🚀 ¿Qué es Grok Imagine Video?

🧠 Características principales (qué diferencia a Grok Imagine)

Audio nativo + sincronización labial: Genera audio ambiental, efectos y habla/narración corta sincronizada, con sincronización labial aproximada.
Imagen→Video / edición mediante prompt: Animar una imagen fija o editar metraje existente mediante prompts de texto (eliminar/reemplazar objetos, ajustar el tiempo, cambiar el estilo).
Iteración rápida y baja latencia: Diseñado para ciclos de retroalimentación rápidos, adecuados para flujos creativos y prototipado de productos.
API de producción: Imagine API expone endpoints programáticos para generación por lotes, integración en pipelines de edición y controles empresariales.
Múltiples “modos” / estilos: Modos orientados al usuario (ejemplos reportados: Normal / Fun / Spicy u otros preajustes similares) para sesgar las salidas en estilo o permisividad (nota: el modo “Spicy” históricamente habilitaba NSFW).

Modelo (empresa)	Resolución máx. (pública)	Longitud máx. del clip (pública)	¿Audio nativo?	Fortalezas	Advertencias
Grok Imagine (xAI)	720p	6–15s	Sí	Iteración rápida, buen coste/latencia, edición integrada, audio nativo	Límite 720p; preocupaciones de moderación; fidelidad variable en el mundo real
Sora (OpenAI)	720p–1080p (depende del nivel)	corto (6–15s)	Sí	Alta fidelidad visual; fuerte integración con el stack de OpenAI	Más caro; moderación/controles más restrictivos
Veo (Google DeepMind)	Hasta 1080p+	corto (varía)	Sí	Gran fotorrealismo, movimiento estable	Coste más alto; menor experimentación pública
Runway Gen-4.5	1080p+	corto (varía)	Sí	Adopción en la industria para flujos creativos, alta fidelidad	Más costoso; centrado en herramientas creativas
Vidu / Kling / Pika (especialistas varios)	hasta 1080p	corto (varía)	Mixto	Algunos ofrecen funciones de nicho (Smart Cuts, encadenado multi-toma)	Soporte de audio variable; distinta madurez de API

⚠️ Limitaciones

La duración máxima del video está limitada a 15 segundos.
La edición conserva la duración del video de entrada (≤ 8.7s).
Las URL generadas son efímeras — descargue de inmediato.

Cómo acceder e integrar Grok Imagine Video

Paso 1: Registrarse para obtener la clave de API

Paso 2: Envíe solicitudes a la API `Grok Imagine Video`

Paso 3: Envíe solicitudes a la API `Grok Imagine Video`

La imagen de origen puede proporcionarse como:

Una URL pública que apunte a una imagen
Un URI de datos codificado en base64 (p. ej., data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Grok Imagine Video

📘 Especificaciones técnicas de Grok Imagine Video

🚀 ¿Qué es Grok Imagine Video?

🧠 Características principales (qué diferencia a Grok Imagine)

⚠️ Limitaciones

Cómo acceder e integrar Grok Imagine Video

Paso 1: Registrarse para obtener la clave de API

Paso 2: Envíe solicitudes a la API Grok Imagine Video

Paso 3: Envíe solicitudes a la API Grok Imagine Video

Paso 4: Recupere y verifique los resultados

Preguntas Frecuentes

How do I generate a video using grok-imagine-video API?

What input formats does grok-imagine-video accept?

What are the maximum video duration and resolution options?

Can I animate a still image into a video with this model?

Does grok-imagine-video support editing existing videos?

How does moderation work in grok-imagine-video outputs?

Is the video generation asynchronous?

How should I handle expired video URLs?

Más modelos

Grok Imagine Video

📘 Especificaciones técnicas de Grok Imagine Video

🚀 ¿Qué es Grok Imagine Video?

🧠 Características principales (qué diferencia a Grok Imagine)

⚠️ Limitaciones

Cómo acceder e integrar Grok Imagine Video

Paso 1: Registrarse para obtener la clave de API

Paso 2: Envíe solicitudes a la API Grok Imagine Video

Paso 3: Envíe solicitudes a la API Grok Imagine Video

Paso 4: Recupere y verifique los resultados

Preguntas Frecuentes

How do I generate a video using grok-imagine-video API?

What input formats does grok-imagine-video accept?

What are the maximum video duration and resolution options?

Can I animate a still image into a video with this model?

Does grok-imagine-video support editing existing videos?

How does moderation work in grok-imagine-video outputs?

Is the video generation asynchronous?

How should I handle expired video URLs?

Más modelos

Paso 2: Envíe solicitudes a la API `Grok Imagine Video`

Paso 3: Envíe solicitudes a la API `Grok Imagine Video`

Paso 2: Envíe solicitudes a la API `Grok Imagine Video`

Paso 3: Envíe solicitudes a la API `Grok Imagine Video`