📘 Specifiche tecniche di Grok Imagine Video
| Specifica | Dettagli |
|---|---|
| ID del modello | grok-imagine-video |
| Provider | xAI |
| Tipo | AI per generazione e modifica video |
| Tipi di input | Testo (prompt); immagine o video opzionali Prompt testuali (linguaggio naturale); input immagine opzionale (image→video); video_url opzionale per modificare clip esistenti. Le durate massime dei video in input per l’editing variano in base all’endpoint — segnalati ~8.7s per alcuni flussi di editing. |
| Tipi di output | Video .mp4 tramite URL temporaneo |
| Intervallo di durata (generazione) | 1–15 secondi |
| Risoluzione | 480p, 720p (configurabile) |
| Proporzioni | 1:1, 16:9, 9:16 |
| Supporto modifica | Sì — anima e modifica video fino a 8.7s |
| Moderazione | Moderazione dei contenuti inclusa |
| Prezzi | Addebitato al secondo, varia in base alla risoluzione |
🚀 Che cos'è Grok Imagine Video?
Grok Imagine Video è il modello avanzato di xAI per generazione e editing video esposto tramite CometAPI. Consente agli sviluppatori di generare brevi video personalizzati da prompt in linguaggio naturale e, opzionalmente, animare immagini statiche o modificare clip esistenti. Il modello supporta lunghezza, risoluzione e proporzioni configurabili, con moderazione dei contenuti integrata per garantire la conformità alle policy.
🧠Caratteristiche principali (cosa differenzia Grok Imagine)
- Audio nativo + sincronizzazione labiale: Genera audio ambientale sincronizzato, effetti e brevi parlati/narrazioni con sincronizzazione labiale approssimativa.
- Immagine→Video / editing tramite prompt: Anima un’immagine statica o modifica filmati esistenti via prompt testuali (rimuovi/sostituisci oggetti, ri-temporizza, cambia stile).
- Iterazione rapida e bassa latenza: Progettato per cicli di feedback veloci, adatto a workflow creativi e prototipazione di prodotto.
- API di produzione: Imagine API espone endpoint programmabili per generazione in batch, integrazione in pipeline di editing e controlli enterprise.
- Molteplici “modalità”/stili: Modalità rivolte all’utente (esempi riportati: Normal / Fun / Spicy o preset simili) per orientare l’output in termini di stile o permissività (nota: la modalità “Spicy” storicamente abilitava NSFW).
| Modello (azienda) | Risoluzione max (pubblica) | Durata clip max (pubblica) | Audio nativo? | Punti di forza | Avvertenze |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Sì | Iterazione rapida, costi/latenza contenuti, editing integrato, audio nativo | Limite a 720p; questioni di moderazione; fedeltà variabile sul campo |
| Sora (OpenAI) | 720p–1080p (dipende dal tier) | breve (6–15s) | Sì | Alta fedeltà visiva; forte integrazione con lo stack OpenAI | Più costoso; moderazione/controlli più rigidi |
| Veo (Google DeepMind) | Fino a 1080p+ | breve (varia) | Sì | Fotorealismo elevato, movimento stabile | Costo più alto; minore sperimentazione pubblica |
| Runway Gen-4.5 | 1080p+ | breve (varia) | Sì | Adozione nel settore per workflow creativi, alta fedeltà | Più costoso; focalizzato su strumenti creativi |
| Vidu / Kling / Pika (vari specialisti) | fino a 1080p | breve (varia) | Misto | Alcuni offrono funzionalità di nicchia (Smart Cuts, concatenazione multi-shot) | Supporto audio vario; maturità delle API differente |
⚠️ Limitazioni
- La lunghezza massima del video è limitata a 15 secondi.
- L’editing mantiene la lunghezza del video in input (≤ 8.7s).
- Gli URL generati sono effimeri — scaricare prontamente.
Come accedere e integrare Grok Imagine Video
Passaggio 1: Registrati per ottenere una chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la credenziale di accesso (chiave API) dell’interfaccia. Fai clic su “Add Token” nel token API nel centro personale, ottieni la chiave del token: sk-xxxxx e invia.
Passaggio 2: Invia richieste all’API Grok Imagine Video
Seleziona l’endpoint “grok-imagine-video” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono disponibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche test su Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account. Dove chiamarlo: GROK Generazione video e Modifica video.
Passaggio 3: Invia richieste all’API Grok Imagine Video
Inserisci testo o carica un’immagine (puoi fornire facoltativamente un’immagine sorgente da animare). L’API Grok Imagine AI analizza il tuo input e prepara il contenuto per l’URL. Sono supportate sia la conversione da testo a video sia da immagine a video.
L’immagine sorgente può essere fornita come:
- Un URL pubblico che punta a un’immagine
- Un URI dati codificato base64 (es.,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Passaggio 4: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere il risultato generato. Dopo l’invio, l’API risponde con lo stato dell’attività e i dati di output. Restituisce un request_id immediatamente dopo la sottomissione; usa l’endpoint GET per verificare lo stato e recuperare il video generato. L’editing video è asincrono, potresti dover interrogare più volte questo endpoint finché l’attività non è completata. Effettua il download prontamente.