📘 Technische Spezifikationen von Grok Imagine Video
| Spezifikation | Details |
|---|---|
| Modell-ID | grok-imagine-video |
| Anbieter | xAI |
| Typ | KI für Videoerstellung & -bearbeitung |
| Eingabetypen | Text (Prompt); optional Bild oder Video Text-Prompts (natürliche Sprache); optionaler Bildeingang (Bild→Video); optionales video_url zur Bearbeitung bestehender Clips. Maximale Dauer des Eingabevideos für Bearbeitung variiert je nach Endpoint — berichtet ~8.7s für einige Bearbeitungsabläufe. |
| Ausgabetypen | .mp4-Video über temporäre URL |
| Dauerbereich (Generieren) | 1–15 Sekunden |
| Auflösung | 480p, 720p (konfigurierbar) |
| Seitenverhältnisse | 1:1, 16:9, 9:16 |
| Bearbeitungsunterstützung | Ja — animiert & modifiziert Videos bis zu 8.7s |
| Moderation | Inhaltsmoderation enthalten |
| Preisgestaltung | Abrechnung pro Sekunde, variiert je nach Auflösung |
🚀 Was ist Grok Imagine Video?
Grok Imagine Video ist xAIs fortschrittliches KI-Modell für Videoerstellung und -bearbeitung, verfügbar über die CometAPI. Es ermöglicht Entwicklerinnen und Entwicklern, aus natürlichsprachigen Prompts kurze, individuelle Videos zu generieren und optional Standbilder zu animieren oder bestehende Clips zu bearbeiten. Das Modell unterstützt konfigurierbare Ausgabelänge, Auflösung und Seitenverhältnis sowie integrierte Inhaltsmoderation zur Sicherstellung der Richtlinienkonformität.
🧠 Hauptfunktionen (was Grok Imagine unterscheidet)
- Native Audio + Lippensynchronisation: Erzeugt synchronisierte Umgebungsgeräusche, Effekte und kurze Sprache/Erzählung mit annähernder Lippensynchronisation.
- Bild→Video / Prompt-Editing: Animieren eines Standbilds oder Bearbeiten vorhandenen Materials über Text-Prompts (Objekte entfernen/ersetzen, neu timen, neu gestalten).
- Schnelle Iteration & geringe Latenz: Für schnelle Feedback-Schleifen geeignet, ideal für kreative Workflows und Produktprototyping.
- Produktions-API: Imagine API bietet programmatische Endpunkte für Batch-Erzeugung, Integration in Bearbeitungspipelines und Enterprise-Kontrollen.
- Mehrere „Modi“/Stile: Nutzerseitige Modi (berichtete Beispiele: Normal / Fun / Spicy oder ähnliche Presets), um Ausgaben hinsichtlich Stil oder Permissivität zu beeinflussen (Hinweis: Der Modus „Spicy“ ermöglichte historisch NSFW).
| Modell (Unternehmen) | Max. Auflösung (öffentlich) | Max. Clip-Länge (öffentlich) | Native Audio? | Stärken | Einschränkungen |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Ja | Schnelle Iteration, starke Kosten/Latenz, integrierte Bearbeitung, native Audio | 720p-Grenze; Moderationsbedenken; schwankende Realitätsnähe |
| Sora (OpenAI) | 720p–1080p (abhängig von Tier) | kurz (6–15s) | Ja | Hohe visuelle Treue; starke Integration in den OpenAI-Stack | Teurer; eingeschränkte Moderation/Steuerungen |
| Veo (Google DeepMind) | Bis zu 1080p+ | kurz (variiert) | Ja | Starke Photorealistik, stabile Bewegung | Höhere Kosten; weniger öffentliche Experimente |
| Runway Gen-4.5 | 1080p+ | kurz (variiert) | Ja | Branchenakzeptanz für kreative Workflows, hohe Treue | Kostenintensiver; fokussiert auf Kreativ-Tools |
| Vidu / Kling / Pika (diverse Spezialisten) | bis zu 1080p | kurz (variiert) | Gemischt | Einige bieten Nischenfunktionen (Smart Cuts, Multi-Shot-Chaining) | Uneinheitliche Audio-Unterstützung; unterschiedliche API-Reife |
⚠️ Einschränkungen
- Die maximale Videolänge ist auf 15 Sekunden begrenzt.
- Bearbeitung behält die Länge des Eingabevideos (≤ 8.7s) bei.
- Generierte URLs sind flüchtig — bitte zeitnah herunterladen.
Zugriff und Integration von Grok Imagine Video
Schritt 1: Für einen API-Schlüssel registrieren
Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zunächst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugriffsberechtigungs-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.
Schritt 2: Anfragen an die Grok Imagine Video API senden
Wählen Sie den Endpoint „grok-imagine-video“, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Methode und Request-Body entnehmen Sie der API-Dokumentation auf unserer Website. Unsere Website bietet zudem Apifox-Tests zu Ihrer Unterstützung. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Wo aufrufen: GROK Videoerstellung und Videobearbeitung.
Schritt 3: Anfragen an die Grok Imagine Video API senden
Geben Sie Text ein oder laden Sie ein Bild hoch (Sie können optional ein Quellbild zur Animation bereitstellen.). Die Grok Imagine AI API analysiert Ihre Eingabe und bereitet den Inhalt für die URL vor. Sowohl Text-zu-Video als auch Bild-zu-Video werden unterstützt.
Das Quellbild kann bereitgestellt werden als:
- Eine öffentliche URL, die auf ein Bild verweist
- Eine Base64-codierte Data-URI ( z. B.
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Schritt 4: Ergebnisse abrufen und verifizieren
Verarbeiten Sie die API-Antwort, um die generierte Ausgabe zu erhalten. Nach der Verarbeitung antwortet die API mit dem Task-Status und Ausgabedaten. Bei der Einreichung wird sofort eine request_id zurückgegeben; verwenden Sie den GET-Endpunkt, um den Status zu prüfen und das generierte Video abzurufen. Die Videobearbeitung ist asynchron; möglicherweise müssen Sie diesen Endpunkt mehrfach abfragen, bis die Aufgabe abgeschlossen ist. Bitte zeitnah herunterladen.