📘 Caractéristiques techniques de Grok Imagine Video
| Spécification | Détails |
|---|---|
| ID du modèle | grok-imagine-video |
| Fournisseur | xAI |
| Type | IA de génération et d’édition vidéo |
| Types d’entrée | Texte (prompt) ; image ou vidéo facultative ; prompts textuels (langage naturel) ; entrée d’image facultative (image→vidéo) ; video_url facultatif pour éditer des clips existants. Les durées maximales des vidéos d’entrée pour l’édition varient selon l’endpoint — signalé ~8.7s pour certains flux d’édition. |
| Types de sortie | Vidéo .mp4 via URL temporaire |
| Plage de durée (génération) | 1–15 secondes |
| Résolution | 480p, 720p (configurable) |
| Rapports d’aspect | 1:1, 16:9, 9:16 |
| Prise en charge de l’édition | Oui — anime et modifie des vidéos jusqu’à 8.7s |
| Modération | Modération de contenu incluse |
| Tarification | Facturation à la seconde, variable selon la résolution |
🚀 Qu’est-ce que Grok Imagine Video ?
Grok Imagine Video est le modèle d’IA avancé de xAI pour la génération et l’édition vidéo, exposé via CometAPI. Il permet aux développeurs de générer de courtes vidéos personnalisées à partir de prompts en langage naturel et, en option, d’animer des images fixes ou d’éditer des clips existants. Le modèle prend en charge la configuration de la durée de sortie, de la résolution et du rapport d’aspect, avec une modération de contenu intégrée pour garantir la conformité aux politiques.
🧠 Fonctionnalités principales (ce qui différencie Grok Imagine)
- Audio natif + lip-sync : génère un audio d’ambiance, des effets et de courtes voix-off/narrations synchronisés, avec une synchronisation labiale approximative.
- Image→Vidéo / édition via prompt : anime une image fixe ou édite des séquences existantes via des prompts textuels (supprimer/remplacer des objets, retimer, restyler).
- Itération rapide & faible latence : conçu pour des boucles de feedback rapides, adaptées aux workflows créatifs et au prototypage produit.
- API de production : Imagine API expose des endpoints programmatiques pour la génération en lot, l’intégration dans des pipelines d’édition et des contrôles d’entreprise.
- Multiples « modes » / styles : modes côté utilisateur (exemples rapportés : Normal / Fun / Spicy ou préréglages similaires) pour orienter le style ou le niveau de permissivité (note : le mode « Spicy » a historiquement permis du NSFW).
| Modèle (entreprise) | Résolution max (publique) | Longueur max du clip (publique) | Audio natif ? | Atouts | Limites |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Oui | Itération rapide, bon coût/latence, édition intégrée, audio natif | Limité à 720p ; préoccupations de modération ; fidélité au réel variable |
| Sora (OpenAI) | 720p–1080p (selon l’offre) | court (6–15s) | Oui | Haute fidélité visuelle ; forte intégration avec la stack OpenAI | Plus coûteux ; modération/contrôles plus contraints |
| Veo (Google DeepMind) | Jusqu’à 1080p+ | court (variable) | Oui | Fort photoréalisme, mouvements stables | Coût plus élevé ; moins d’expérimentation publique |
| Runway Gen-4.5 | 1080p+ | court (variable) | Oui | Adoption industrielle pour les workflows créatifs, grande fidélité | Plus coûteux ; axé sur les outils créatifs |
| Vidu / Kling / Pika (spécialistes) | jusqu’à 1080p | court (variable) | Mixte | Certaines offrent des fonctionnalités de niche (Smart Cuts, chaînage multi-plans) | Prise en charge audio variable ; maturité API variable |
⚠️ Limitations
- La durée maximale d’une vidéo est limitée à 15 secondes.
- L’édition conserve la durée de la vidéo d’entrée (≤ 8.7s).
- Les URL générées sont éphémères — téléchargez rapidement.
Comment accéder à Grok Imagine Video et l’intégrer
Étape 1 : Inscription pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Obtenez la clé API d’accès à l’interface. Cliquez sur “Add Token” dans la section des jetons API du centre personnel, récupérez la clé de jeton : sk-xxxxx et soumettez.
Étape 2 : Envoyer des requêtes vers l’API Grok Imagine Video
Sélectionnez l’endpoint “grok-imagine-video” pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site. Notre site fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. Où l’appeler : GROK Génération de vidéo et Édition vidéo.
Étape 3 : Envoyer des requêtes vers l’API Grok Imagine Video
Saisissez du texte ou importez une image (vous pouvez fournir en option une image source à animer). L’API Grok Imagine AI analyse votre entrée et prépare le contenu pour l’URL. La conversion texte→vidéo et image→vidéo est prise en charge.
L’image source peut être fournie sous forme de :
- URL publique pointant vers une image
- URI de données encodées en base64 (par ex.
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Étape 4 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir le résultat généré. Après soumission, l’API répond avec le statut de la tâche et les données de sortie. Un request_id est renvoyé immédiatement après l’envoi ; utilisez l’endpoint GET pour vérifier le statut et récupérer la vidéo générée. L’édition vidéo est asynchrone, vous devrez peut-être interroger cet endpoint plusieurs fois jusqu’à la fin de la tâche. Veuillez télécharger rapidement.