X

Grok Imagine Video

Pro Sekunde:$0.04
Generieren Sie Videos aus Text-Prompts, animieren Sie Standbilder oder bearbeiten Sie vorhandene Videos mit natürlicher Sprache. Die API unterstützt konfigurierbare Dauer, Seitenverhältnis und Auflösung für generierte Videos — das SDK übernimmt das asynchrone Polling automatisch.
Neu
Kommerzielle Nutzung

📘 Technische Spezifikationen von Grok Imagine Video

SpezifikationDetails
Modell-IDgrok-imagine-video
AnbieterxAI
TypKI für Videoerstellung & -bearbeitung
EingabetypenText (Prompt); optional Bild oder Video Text-Prompts (natürliche Sprache); optionaler Bildeingang (Bild→Video); optionales video_url zur Bearbeitung bestehender Clips. Maximale Dauer des Eingabevideos für Bearbeitung variiert je nach Endpoint — berichtet ~8.7s für einige Bearbeitungsabläufe.
Ausgabetypen.mp4-Video über temporäre URL
Dauerbereich (Generieren)1–15 Sekunden
Auflösung480p, 720p (konfigurierbar)
Seitenverhältnisse1:1, 16:9, 9:16
BearbeitungsunterstützungJa — animiert & modifiziert Videos bis zu 8.7s
ModerationInhaltsmoderation enthalten
PreisgestaltungAbrechnung pro Sekunde, variiert je nach Auflösung

🚀 Was ist Grok Imagine Video?

Grok Imagine Video ist xAIs fortschrittliches KI-Modell für Videoerstellung und -bearbeitung, verfügbar über die CometAPI. Es ermöglicht Entwicklerinnen und Entwicklern, aus natürlichsprachigen Prompts kurze, individuelle Videos zu generieren und optional Standbilder zu animieren oder bestehende Clips zu bearbeiten. Das Modell unterstützt konfigurierbare Ausgabelänge, Auflösung und Seitenverhältnis sowie integrierte Inhaltsmoderation zur Sicherstellung der Richtlinienkonformität.

🧠 Hauptfunktionen (was Grok Imagine unterscheidet)

  • Native Audio + Lippensynchronisation: Erzeugt synchronisierte Umgebungsgeräusche, Effekte und kurze Sprache/Erzählung mit annähernder Lippensynchronisation.
  • Bild→Video / Prompt-Editing: Animieren eines Standbilds oder Bearbeiten vorhandenen Materials über Text-Prompts (Objekte entfernen/ersetzen, neu timen, neu gestalten).
  • Schnelle Iteration & geringe Latenz: Für schnelle Feedback-Schleifen geeignet, ideal für kreative Workflows und Produktprototyping.
  • Produktions-API: Imagine API bietet programmatische Endpunkte für Batch-Erzeugung, Integration in Bearbeitungspipelines und Enterprise-Kontrollen.
  • Mehrere „Modi“/Stile: Nutzerseitige Modi (berichtete Beispiele: Normal / Fun / Spicy oder ähnliche Presets), um Ausgaben hinsichtlich Stil oder Permissivität zu beeinflussen (Hinweis: Der Modus „Spicy“ ermöglichte historisch NSFW).
Modell (Unternehmen)Max. Auflösung (öffentlich)Max. Clip-Länge (öffentlich)Native Audio?StärkenEinschränkungen
Grok Imagine (xAI)720p6–15sJaSchnelle Iteration, starke Kosten/Latenz, integrierte Bearbeitung, native Audio720p-Grenze; Moderationsbedenken; schwankende Realitätsnähe
Sora (OpenAI)720p–1080p (abhängig von Tier)kurz (6–15s)JaHohe visuelle Treue; starke Integration in den OpenAI-StackTeurer; eingeschränkte Moderation/Steuerungen
Veo (Google DeepMind)Bis zu 1080p+kurz (variiert)JaStarke Photorealistik, stabile BewegungHöhere Kosten; weniger öffentliche Experimente
Runway Gen-4.51080p+kurz (variiert)JaBranchenakzeptanz für kreative Workflows, hohe TreueKostenintensiver; fokussiert auf Kreativ-Tools
Vidu / Kling / Pika (diverse Spezialisten)bis zu 1080pkurz (variiert)GemischtEinige bieten Nischenfunktionen (Smart Cuts, Multi-Shot-Chaining)Uneinheitliche Audio-Unterstützung; unterschiedliche API-Reife

⚠️ Einschränkungen

  • Die maximale Videolänge ist auf 15 Sekunden begrenzt.
  • Bearbeitung behält die Länge des Eingabevideos (≤ 8.7s) bei.
  • Generierte URLs sind flüchtig — bitte zeitnah herunterladen.

Zugriff und Integration von Grok Imagine Video

Schritt 1: Für einen API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zunächst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugriffsberechtigungs-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

Schritt 2: Anfragen an die Grok Imagine Video API senden

Wählen Sie den Endpoint „grok-imagine-video“, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Methode und Request-Body entnehmen Sie der API-Dokumentation auf unserer Website. Unsere Website bietet zudem Apifox-Tests zu Ihrer Unterstützung. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Wo aufrufen: GROK Videoerstellung und Videobearbeitung.

Schritt 3: Anfragen an die Grok Imagine Video API senden

Geben Sie Text ein oder laden Sie ein Bild hoch (Sie können optional ein Quellbild zur Animation bereitstellen.). Die Grok Imagine AI API analysiert Ihre Eingabe und bereitet den Inhalt für die URL vor. Sowohl Text-zu-Video als auch Bild-zu-Video werden unterstützt.

Das Quellbild kann bereitgestellt werden als:

  • Eine öffentliche URL, die auf ein Bild verweist
  • Eine Base64-codierte Data-URI ( z. B. data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Schritt 4: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Ausgabe zu erhalten. Nach der Verarbeitung antwortet die API mit dem Task-Status und Ausgabedaten. Bei der Einreichung wird sofort eine request_id zurückgegeben; verwenden Sie den GET-Endpunkt, um den Status zu prüfen und das generierte Video abzurufen. Die Videobearbeitung ist asynchron; möglicherweise müssen Sie diesen Endpunkt mehrfach abfragen, bis die Aufgabe abgeschlossen ist. Bitte zeitnah herunterladen.

FAQ

Weitere Modelle