📘 Specyfikacja techniczna Grok Imagine Video
| Parametr | Szczegóły |
|---|---|
| Identyfikator modelu | grok-imagine-video |
| Dostawca | xAI |
| Typ | Sztuczna inteligencja do generowania i edycji wideo |
| Typy wejścia | Tekst (prompt); opcjonalnie obraz lub wideo Wskazówki tekstowe (język naturalny); opcjonalne wejście obrazu (image→video); opcjonalny video_url do edycji istniejących klipów. Maksymalny czas wejściowego wideo do edycji zależy od endpointu — zgłaszano ~8,7s dla niektórych przepływów edycji. |
| Typy wyjścia | wideo .mp4 poprzez tymczasowy URL |
| Zakres czasu trwania (generowanie) | 1–15 sekund |
| Rozdzielczość | 480p, 720p (konfigurowalne) |
| Proporcje obrazu | 1:1, 16:9, 9:16 |
| Obsługa edycji | Tak — animuje i modyfikuje filmy do 8,7s |
| Moderacja | Wbudowana moderacja treści |
| Cennik | Rozliczanie za sekundę, zależne od rozdzielczości |
🚀 Czym jest Grok Imagine Video?
Grok Imagine Video to zaawansowany model xAI do generowania i edycji wideo, udostępniony przez CometAPI. Umożliwia deweloperom generowanie krótkich, spersonalizowanych filmów na podstawie wskazówek w języku naturalnym oraz opcjonalnie animowanie statycznych obrazów lub edycję istniejących klipów. Model obsługuje konfigurowalną długość wyjścia, rozdzielczość i proporcje obrazu, a wbudowana moderacja treści zapewnia zgodność z politykami.
🧠Główne funkcje (co wyróżnia Grok Imagine)
- Wbudowane audio + lip-sync: Generuje zsynchronizowane dźwięki otoczenia, efekty oraz krótkie kwestie mówione/narrację z przybliżoną synchronizacją ruchu ust.
- Obraz→Wideo / edycja promptu: Animuj statyczny obraz lub edytuj istniejący materiał wideo za pomocą wskazówek tekstowych (usuwanie/zastępowanie obiektów, zmiana czasu, zmiana stylu).
- Szybkie iteracje i niskie opóźnienia: Zaprojektowany do szybkich pętli informacji zwrotnej odpowiednich dla kreatywnych procesów i prototypowania produktów.
- Produkcyjne API: Imagine API udostępnia programistyczne endpointy do wsadowego generowania, integracji z pipeline’ami edycyjnymi i kontroli korporacyjnych.
- Wiele „trybów”/stylów: Tryby dla użytkowników (zgłaszane przykłady: Normal / Fun / Spicy lub podobne presety) ukierunkowujące wyniki pod kątem stylu lub permisywności (uwaga: tryb „Spicy” historycznie umożliwiał NSFW).
| Model (firma) | Maks. rozdzielczość (publiczna) | Maks. długość klipu (publiczna) | Wbudowane audio? | Mocne strony | Ograniczenia |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Tak | Szybkie iteracje, korzystny koszt/opóźnienia, zintegrowana edycja, wbudowane audio | Limit 720p; kwestie moderacji; zmienna wierność w realnym świecie |
| Sora (OpenAI) | 720p–1080p (zależnie od tieru) | krótkie (6–15s) | Tak | Wysoka wierność wizualna; silna integracja ze stosem OpenAI | Wyższy koszt; ograniczona moderacja/kontrola |
| Veo (Google DeepMind) | Do 1080p+ | krótkie (różnie) | Tak | Silny fotorealizm, stabilny ruch | Wyższy koszt; mniej publicznych eksperymentów |
| Runway Gen-4.5 | 1080p+ | krótkie (różnie) | Tak | Szerokie zastosowanie w branży w kreatywnych workflowach, wysoka wierność | Droższy; skupienie na narzędziach kreatywnych |
| Vidu / Kling / Pika (różni specjaliści) | do 1080p | krótkie (różnie) | Różnie | Niektóre oferują niszowe funkcje (Smart Cuts, łączenie wielu ujęć) | Zróżnicowane wsparcie audio; różny poziom dojrzałości API |
⚠️ Ograniczenia
- Maksymalna długość wideo wynosi 15 sekund.
- Edycja zachowuje długość wejściowego wideo (≤ 8,7s).
- Generowane adresy URL są efemeryczne — pobierz je niezwłocznie.
Jak uzyskać dostęp i zintegrować Grok Imagine Video
Krok 1: Zarejestruj klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, zarejestruj się najpierw. Zaloguj się do konsoli CometAPI. Uzyskaj poświadczenia dostępu — klucz API interfejsu. Kliknij „Add Token” w tokenie API w centrum osobistym, uzyskaj klucz tokena: sk-xxxxx i wyślij.
Krok 2: Wyślij żądania do interfejsu API Grok Imagine Video
Wybierz endpoint „grok-imagine-video”, aby wysłać żądanie do API i ustaw body żądania. Metoda oraz body żądania są dostępne w dokumentacji API na naszej stronie. Dla wygody udostępniamy też test w Apifox. Zastąp <YOUR_API_KEY> rzeczywistym kluczem CometAPI ze swojego konta. Gdzie to wywołać: GROK Generowanie wideo oraz Edycja wideo.
Krok 3: Wyślij żądania do interfejsu API Grok Imagine Video
Wprowadź tekst lub prześlij obraz (możesz opcjonalnie podać obraz źródłowy do animacji). API Grok Imagine AI analizuje Twoje dane wejściowe i przygotowuje treść do URL. Obsługiwane są zarówno konwersje tekst→wideo, jak i obraz→wideo.
Obraz źródłowy można dostarczyć jako:
- Publiczny adres URL wskazujący na obraz
- Identyfikator URI danych zakodowany w base64 (np.
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Krok 4: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Natychmiast po złożeniu zwracany jest request_id; użyj endpointu GET, aby sprawdzać status i pobrać wygenerowane wideo. Edycja wideo jest asynchroniczna — może być konieczne wielokrotne odpytywanie tego endpointu, aż zadanie się zakończy. Prosimy pobrać niezwłocznie.




