📘 Spécifications techniques de Grok Imagine Video
| Spécification | Détails |
|---|---|
| ID du modèle | grok-imagine-video |
| Fournisseur | xAI |
| Type | IA de génération et d’édition vidéo |
| Types d’entrée | Texte (prompt) ; image ou vidéo facultative Prompts textuels (langage naturel) ; image facultative (image→vidéo) ; option vidéo_url pour éditer des clips existants. Les durées max des vidéos à éditer varient selon l’endpoint — signalé ~8.7s pour certains flux d’édition. |
| Types de sortie | Vidéo .mp4 via URL temporaire |
| Durée (génération) | 1–15 secondes |
| Résolution | 480p, 720p (configurable) |
| Rapports d’aspect | 1:1, 16:9, 9:16 |
| Prise en charge de l’édition | Oui — anime et modifie des vidéos jusqu’à 8.7s |
| Modération | Modération de contenu incluse |
| Tarification | Facturation à la seconde, variable selon la résolution |
🚀 Qu’est-ce que Grok Imagine Video ?
Grok Imagine Video est le modèle avancé d’IA de génération et d’édition vidéo de xAI, exposé via CometAPI. Il permet aux développeurs de générer de courtes vidéos personnalisées à partir de prompts en langage naturel et, en option, d’animer des images fixes ou d’éditer des clips existants. Le modèle prend en charge la durée, la résolution et le rapport d’aspect configurables, avec une modération de contenu intégrée pour garantir la conformité aux politiques.
🧠 Fonctionnalités principales (ce qui différencie Grok Imagine)
- Audio natif + synchronisation labiale : génère un audio d’ambiance synchronisé, des effets et de courts segments de parole/narration avec une synchronisation labiale approximative.
- Image→Vidéo / édition par prompt : anime une image fixe ou édite des séquences existantes via des prompts textuels (supprimer/remplacer des objets, réajuster le timing, restyler).
- Itération rapide et faible latence : conçu pour des boucles de retour rapides adaptées aux workflows créatifs et au prototypage produit.
- API de production : Imagine API expose des endpoints programmatiques pour la génération par lots, l’intégration dans des pipelines d’édition et des contrôles d’entreprise.
- Multiples « modes » / styles : modes orientés utilisateur (exemples signalés : Normal / Fun / Spicy ou préréglages similaires) pour orienter la sortie en termes de style ou de permissivité (note : le mode « Spicy » a historiquement activé du NSFW).
| Modèle (entreprise) | Résolution max (publique) | Durée max du clip (publique) | Audio natif ? | Atouts | Limites |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Oui | Itération rapide, bon coût/latence, édition intégrée, audio natif | Limitation à 720p ; questions de modération ; fidélité au réel variable |
| Sora (OpenAI) | 720p–1080p (selon l’offre) | court (6–15s) | Oui | Haute fidélité visuelle ; forte intégration avec l’écosystème OpenAI | Plus cher ; modération/contrôles contraints |
| Veo (Google DeepMind) | Jusqu’à 1080p+ | court (variable) | Oui | Fort photoréalisme, mouvement stable | Coût plus élevé ; moins d’expérimentation publique |
| Runway Gen-4.5 | 1080p+ | court (variable) | Oui | Adoption par l’industrie pour les workflows créatifs, haute fidélité | Plus coûteux ; axé sur l’outillage créatif |
| Vidu / Kling / Pika (spécialistes) | jusqu’à 1080p | court (variable) | Mixte | Certaines offrent des fonctions de niche (Smart Cuts, enchaînement multi-plans) | Support audio variable ; maturité API différente |
⚠️ Limitations
- La durée maximale d’une vidéo est limitée à 15 secondes.
- L’édition conserve la durée de la vidéo d’entrée (≤ 8.7s).
- Les URL générées sont éphémères — téléchargez rapidement.
Comment accéder à et intégrer Grok Imagine Video
Étape 1 : Inscrivez-vous pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous enregistrer. Connectez-vous à votre console CometAPI. Obtenez la clé d’accès (API key) de l’interface. Cliquez sur « Add Token » dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx et soumettez.
Étape 2 : Envoyez des requêtes vers l’API Grok Imagine Video
Sélectionnez l’endpoint « grok-imagine-video » pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site. Notre site propose également un test Apifox pour votre commodité. Où l’appeler : GROK Génération vidéo et Édition vidéo.
Étape 3 : Envoyez des requêtes vers l’API Grok Imagine Video
Saisissez du texte ou téléchargez une image (vous pouvez fournir une image source à animer). L’API Grok Imagine analyse votre entrée et prépare le contenu pour l’URL. Les conversions texte-vers-vidéo et image-vers-vidéo sont prises en charge.
L’image source peut être fournie sous forme de :
- Une URL publique pointant vers une image
- Un URI de données encodé en base64 (p. ex.,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Étape 4 : Récupérez et vérifiez les résultats
Traitez la réponse de l’API pour obtenir le résultat généré. Après traitement, l’API répond avec le statut de la tâche et les données de sortie. Un request_id est renvoyé immédiatement après soumission ; utilisez le point de terminaison GET pour vérifier le statut et récupérer la vidéo générée. L’édition vidéo est asynchrone ; vous devrez peut-être interroger ce point de terminaison plusieurs fois jusqu’à l’achèvement de la tâche. Veuillez télécharger rapidement.




