📘 Technische Spezifikationen von Grok Imagine Video
| Spezifikation | Details |
|---|---|
| Modell-ID | grok-imagine-video |
| Anbieter | xAI |
| Typ | KI zur Videogenerierung und -bearbeitung |
| Eingabetypen | Text (Prompt); optionale Bild- oder Videoeingabe. Textprompts (natürliche Sprache); optionaler Bildeingang (image→video); optionales video_url zur Bearbeitung vorhandener Clips. Maximale Eingabevideolängen für Bearbeitung unterscheiden sich je nach Endpoint — für einige Bearbeitungsabläufe wurden ~8.7s berichtet. |
| Ausgabetypen | .mp4-Video über temporäre URL |
| Dauerbereich (Generierung) | 1–15 Sekunden |
| Auflösung | 480p, 720p (konfigurierbar) |
| Seitenverhältnisse | 1:1, 16:9, 9:16 |
| Bearbeitungsunterstützung | Ja — animiert und verändert Videos bis zu 8.7s |
| Moderation | Inhaltsmoderation enthalten |
| Preisgestaltung | Abrechnung pro Sekunde, variiert je nach Auflösung |
🚀 Was ist Grok Imagine Video?
Grok Imagine Video ist das fortschrittliche KI-Modell von xAI für Videogenerierung und -bearbeitung, verfügbar über die CometAPI. Es ermöglicht Entwicklerinnen und Entwicklern, aus natürlichen Spracheingaben kurze, individuelle Videos zu generieren und optional Standbilder zu animieren oder bestehende Clips zu bearbeiten. Das Modell unterstützt konfigurierbare Ausgabelänge, Auflösung und Seitenverhältnis und verfügt über integrierte Inhaltsmoderation zur Einhaltung von Richtlinien.
🧠Hauptfunktionen (was Grok Imagine auszeichnet)
- Natives Audio + Lippensynchronisation: Erzeugt synchronisierte Umgebungsgeräusche, Effekte und kurze Sprache/Erzählung mit annähernder Lippensynchronisation.
- Bild→Video / Prompt-Editing: Animieren Sie ein Standbild oder bearbeiten Sie vorhandenes Filmmaterial per Textprompt (Objekte entfernen/ersetzen, zeitlich anpassen, neu stylen).
- Schnelle Iteration & geringe Latenz: Ausgelegt auf schnelle Feedback-Loops für kreative Workflows und Produktprototyping.
- Produktions-API: Imagine API stellt programmatische Endpunkte für Batch-Generierung, Integration in Editing-Pipelines und Enterprise-Kontrollen bereit.
- Mehrere „Modi“/Stile: Benutzerseitige Modi (gemeldete Beispiele: Normal / Fun / Spicy oder ähnliche Presets), um Ausgaben hinsichtlich Stil oder Permissivität zu beeinflussen (Hinweis: Modus „Spicy“ ermöglichte historisch NSFW).
| Modell (Unternehmen) | Max. Auflösung (öffentlich) | Max. Clip-Länge (öffentlich) | Natives Audio? | Stärken | Einschränkungen |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Ja | Schnelle Iteration, gute Kosten/Latenz, integrierte Bearbeitung, natives Audio | 720p-Grenze; Moderationsbedenken; variierende Realwelt-Treue |
| Sora (OpenAI) | 720p–1080p (abhängig von Tier) | kurz (6–15s) | Ja | Hohe visuelle Treue; starke Integration in den OpenAI-Stack | Teurer; eingeschränkte Moderation/Steuerungsmöglichkeiten |
| Veo (Google DeepMind) | Bis 1080p+ | kurz (variabel) | Ja | Starke Photorealistik, stabile Bewegung | Höhere Kosten; weniger öffentliche Experimente |
| Runway Gen-4.5 | 1080p+ | kurz (variabel) | Ja | Branchenweite Nutzung für kreative Workflows, hohe Bildtreue | Kostenintensiver; Fokus auf kreative Tools |
| Vidu / Kling / Pika (verschiedene) | bis 1080p | kurz (variabel) | Gemischt | Einige bieten Nischenfunktionen (Smart Cuts, Multi-Shot-Chaining) | Unterschiedliche Audio-Unterstützung; unterschiedliche API-Reife |
⚠️ Einschränkungen
- Die maximale Videolänge ist auf 15 Sekunden begrenzt.
- Bearbeitung behält die Eingabevideolänge bei (≤ 8.7s).
- Generierte URLs sind temporär — bitte zügig herunterladen.
So greifen Sie auf Grok Imagine Video zu und integrieren es
Schritt 1: Für API-Schlüssel registrieren
Melden Sie sich auf cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugangs-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.
Schritt 2: Anfragen an die Grok Imagine Video-API senden
Wählen Sie den Endpunkt “grok-imagine-video”, um die API-Anfrage zu senden, und setzen Sie den Request-Body. Die Anfragemethode und der Request-Body sind unserer Website-API-Dokumentation zu entnehmen. Unsere Website bietet zudem einen Apifox-Test zu Ihrer Bequemlichkeit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Wo aufrufen: GROK Videogenerierung und Videobearbeitung.
Schritt 3: Anfragen an die Grok Imagine Video-API senden
Geben Sie Text ein oder laden Sie ein Bild hoch (Sie können optional ein Ausgangsbild zum Animieren bereitstellen.). Die Grok Imagine AI API analysiert Ihre Eingabe und bereitet den Inhalt für die URL auf. Sowohl Text-zu-Video als auch Bild-zu-Video werden unterstützt.
Das Ausgangsbild kann bereitgestellt werden als:
- Eine öffentliche URL, die auf ein Bild zeigt
- Eine base64-codierte Data-URI (z. B.
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Schritt 4: Ergebnisse abrufen und überprüfen
Verarbeiten Sie die API-Antwort, um das generierte Ergebnis zu erhalten. Nach der Verarbeitung antwortet die API mit dem Auftragsstatus und Ausgabedaten. Beim Absenden wird sofort eine request_id zurückgegeben; verwenden Sie den GET-Endpunkt, um den Status zu prüfen und das generierte Video abzurufen. Die Videobearbeitung ist asynchron, Sie müssen diesen Endpunkt ggf. mehrfach pollen, bis die Aufgabe abgeschlossen ist. Bitte laden Sie zeitnah herunter.




