📘 Grok Imagine Video の技術仕様
| Specification | Details |
|---|---|
| Model ID | grok-imagine-video |
| Provider | xAI |
| Type | 動画生成・編集 AI |
| Input Types | テキスト(プロンプト);オプションで画像または動画 テキストプロンプト(自然言語);オプションで画像入力(画像→動画);既存クリップ編集用にオプションで video_url。編集用入力動画の最大長はエンドポイントにより異なり、一部の編集フローでは約 8.7 秒と報告。 |
| Output Types | 一時的な URL 経由で .mp4 動画を返却 |
| Duration Range (generate) | 1–15 秒 |
| Resolution | 480p、720p(設定可能) |
| Aspect Ratios | 1:1、16:9、9:16 |
| Edit Support | はい — 最長 8.7 秒までの動画をアニメーション化・編集 |
| Moderation | コンテンツモデレーションを搭載 |
| Pricing | 秒単位の従量課金、解像度により変動 |
🚀 Grok Imagine Video とは?
Grok Imagine Video は、CometAPI を通じて提供される xAI の先進的な動画生成・編集 AI モデルです。開発者は自然言語プロンプトから短いカスタム動画を生成でき、静止画像のアニメーション化や既存クリップの編集も可能です。出力の長さ、解像度、アスペクト比を設定でき、ポリシー順守のためのコンテンツモデレーションも内蔵しています。
🧠主な機能(Grok Imagine の差別化要因)
- ネイティブ音声 + リップシンク: 環境音、効果音、短い音声/ナレーションを同期生成し、おおよそのリップシンクに対応。
- 画像→動画 / プロンプト編集: 静止画のアニメーション化、またはテキストプロンプトで既存映像を編集(オブジェクトの削除/置換、リタイミング、スタイル変更)。
- 高速な反復と低レイテンシー: クリエイティブワークフローやプロトタイピングに適した迅速なフィードバックループ。
- 本番向け API: Imagine API はバッチ生成、編集パイプライン統合、エンタープライズ制御のためのプログラム的エンドポイントを公開。
- 複数の「モード」/ スタイル: ユーザー向けのモード(報告例: Normal / Fun / Spicy などのプリセット)でスタイルや許容度をバイアス(注: “Spicy” モードは過去に NSFW を有効化)。
| Model (company) | Max res (public) | Max clip len (public) | Native audio? | Strengths | Caveats |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Yes | 高速反復、優れたコスト/レイテンシー、編集統合、ネイティブ音声 | 720p に制限;モデレーション上の懸念;実環境での忠実度にばらつき |
| Sora (OpenAI) | 720p–1080p (depends on tier) | short (6–15s) | Yes | 高い視覚的忠実度;OpenAI スタックとの強固な統合 | より高コスト;モデレーション/制御に制約 |
| Veo (Google DeepMind) | Up to 1080p+ | short (varies) | Yes | 高いフォトリアリズム、安定したモーション | 高コスト;パブリックな実験が少なめ |
| Runway Gen-4.5 | 1080p+ | short (varies) | Yes | クリエイティブワークフローでの採用実績、高い忠実度 | さらに高コスト;クリエイティブツールに特化 |
| Vidu / Kling / Pika (various specialists) | up to 1080p | short (varies) | Mixed | 一部はニッチ機能(Smart Cuts、マルチショット連結)を提供 | 音声サポートは様々;API の成熟度が異なる |
⚠️ 制限事項
- 最大動画長は15 秒に制限。
- 編集時は入力動画の長さを維持(≤ 8.7 秒)。
- 生成される URL は期限付き — 速やかにダウンロードしてください。
Grok Imagine Video へのアクセスと統合方法
Step 1: API キーの取得
cometapi.com にログインしてください。未登録の場合は先に登録を行ってください。CometAPI コンソール にサインインします。インターフェースのアクセス認証用 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー sk-xxxxx を取得して送信します。
Step 2: Grok Imagine Video API にリクエストを送信
「grok-imagine-video」エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントに記載しています。利便性のため、当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し場所: GROK動画生成 および 動画編集。
Step 3: Grok Imagine Video API にリクエストを送信
テキストを入力するか画像をアップロードします(オプションでアニメーション化する元画像を指定できます)。Grok Imagine AI API は入力を解析し、URL で取得できるコンテンツを準備します。テキスト→動画と画像→動画の両方をサポートします。
元画像の提供方法:
- 画像を指すパブリック URL
- base64 エンコードのデータ URI(例:
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Step 4: 結果の取得と検証
API レスポンスを処理して生成結果を取得します。送信後すぐに request_id が返されます。GET エンドポイントを使用してステータスを確認し、生成された動画を取得します。動画編集は非同期であるため、タスク完了までこのエンドポイントを複数回ポーリングする必要がある場合があります。速やかにダウンロードしてください。