📘 Specifiche tecniche di Grok Imagine Video
| Specification | Details |
|---|---|
| ID modello | grok-imagine-video |
| Provider | xAI |
| Tipo | IA per generazione e modifica di video |
| Tipi di input | Testo (prompt); immagine o video opzionali Prompt testuali (linguaggio naturale); input immagine opzionale (image→video); video_url opzionale per modificare clip esistenti. Le durate massime dei video di input per la modifica variano in base all’endpoint — per alcuni flussi di modifica sono stati riportati ~8.7s. |
| Tipi di output | Video .mp4 tramite URL temporaneo |
| Intervallo di durata (generazione) | 1–15 secondi |
| Risoluzione | 480p, 720p (configurabile) |
| Proporzioni | 1:1, 16:9, 9:16 |
| Supporto alla modifica | Sì — anima e modifica video fino a 8.7s |
| Moderazione | Moderazione dei contenuti inclusa |
| Prezzi | Addebitato al secondo, varia in base alla risoluzione |
🚀 Che cos’è Grok Imagine Video?
Grok Imagine Video è il modello avanzato di IA di xAI per la generazione e la modifica di video, esposto tramite CometAPI. Consente agli sviluppatori di generare brevi video personalizzati da prompt in linguaggio naturale e, facoltativamente, di animare immagini statiche o modificare clip esistenti. Il modello supporta lunghezza di output, risoluzione e proporzioni configurabili, con moderazione dei contenuti integrata per garantire la conformità alle policy.
🧠Funzionalità principali (cosa distingue Grok Imagine)
- Audio nativo + lip-sync: genera audio ambientale sincronizzato, effetti e brevi parlati / narrazioni con sincronizzazione labiale approssimativa.
- Image→Video / modifica tramite prompt: anima un’immagine statica o modifica filmati esistenti tramite prompt testuali (rimuovere/sostituire oggetti, ritimizzare, cambiare stile).
- Iterazione rapida e bassa latenza: progettato per cicli di feedback rapidi, adatti a flussi di lavoro creativi e prototipazione di prodotto.
- API di produzione: l’API Imagine espone endpoint programmatici per generazione in batch, integrazione nelle pipeline di editing e controlli enterprise.
- Più “modalità” / stili: modalità rivolte all’utente (esempi riportati: Normal / Fun / Spicy o preset simili) per orientare gli output in termini di stile o permissività (nota: storicamente la modalità “Spicy” consentiva contenuti NSFW).
| Model (company) | Max res (public) | Max clip len (public) | Native audio? | Strengths | Caveats |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sì | Iterazione rapida, ottimo rapporto costo/latenza, editing integrato, audio nativo | Limite a 720p; problemi di moderazione; fedeltà variabile nel mondo reale |
| Sora (OpenAI) | 720p–1080p (depends on tier) | short (6–15s) | Sì | Elevata fedeltà visiva; forte integrazione con lo stack OpenAI | Più costoso; moderazione/controlli più vincolati |
| Veo (Google DeepMind) | Up to 1080p+ | short (varies) | Sì | Forte fotorealismo, movimento stabile | Costo più elevato; minore sperimentazione pubblica |
| Runway Gen-4.5 | 1080p+ | short (varies) | Sì | Adozione nel settore per flussi di lavoro creativi, alta fedeltà | Più costoso; focalizzato sugli strumenti creativi |
| Vidu / Kling / Pika (various specialists) | up to 1080p | short (varies) | Misto | Alcuni offrono funzionalità di nicchia (Smart Cuts, concatenazione multi-shot) | Supporto audio variabile; diversa maturità delle API |
⚠️ Limitazioni
- La lunghezza massima del video è limitata a 15 secondi.
- La modifica mantiene la lunghezza del video di input (≤ 8.7s).
- Gli URL generati sono effimeri — scaricali tempestivamente.
Come accedere e integrare Grok Imagine Video
Passaggio 1: registrarsi per ottenere una chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la credenziale di accesso, ovvero la chiave API dell’interfaccia. Fai clic su “Add Token” nella sezione API token del centro personale, ottieni la chiave token: sk-xxxxx e inviala.
Passaggio 2: inviare richieste all’API Grok Imagine Video
Seleziona l’endpoint “grok-imagine-video” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo di richiesta e il corpo della richiesta si ottengono dalla documentazione API sul nostro sito web. Il nostro sito web fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua effettiva chiave CometAPI del tuo account. Dove chiamarla: GROKVideo Generation e Video Edit.
Passaggio 3: inviare richieste all’API Grok Imagine Video
Inserisci testo o carica un’immagine(Puoi facoltativamente fornire un’immagine sorgente da animare.). L’API Grok Imagine AI analizza il tuo input e prepara il contenuto per l’URL. Sono supportate sia la conversione da testo a video sia quella da immagine a video.
L’immagine sorgente può essere fornita come:
- Un URL pubblico che punta a un’immagine
- Un data URI codificato in base64( ad esempio,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Passaggio 4: recuperare e verificare i risultati
Elabora la risposta API per ottenere l’output generato. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output. Restituisce immediatamente un request_id al momento dell’invio; usa l’endpoint GET per controllare lo stato e recuperare il video generato. La modifica video è asincrona, potresti dover interrogare questo endpoint più volte finché l’attività non è completata. Scarica tempestivamente.




