📘 Grok Imagine Video 技术规格
| Specification | Details |
|---|---|
| Model ID | grok-imagine-video |
| Provider | xAI |
| Type | 视频生成与编辑 AI |
| Input Types | 文本(提示);可选图像或视频 文本提示(自然语言);可选图像输入(image→video);可选用于编辑现有片段的 video_url。不同端点的编辑输入视频最长时长不同 — 有报告为 ~8.7s 的编辑流程。 |
| Output Types | 通过临时 URL 提供 .mp4 视频 |
| Duration Range (generate) | 1–15 秒 |
| Resolution | 480p,720p(可配置) |
| Aspect Ratios | 1:1、16:9、9:16 |
| Edit Support | 是 — 可对最长 8.7s 的视频进行动画与修改 |
| Moderation | 包含内容审核 |
| Pricing | 按秒计费,因分辨率而异 |
🚀 什么是 Grok Imagine Video?
Grok Imagine Video 是 xAI 通过 CometAPI 提供的高级视频生成与编辑 AI 模型。它使开发者能够根据自然语言提示生成简短、定制的视频,并可选对静态图像进行动画化或编辑现有片段。模型支持可配置的输出时长、分辨率与纵横比,并内置内容审核以确保合规。
🧠 主要功能(Grok Imagine 的差异点)
- 原生音频 + 口型同步:生成同步的环境音效、效果,以及简短的语音/旁白,并实现近似的口型同步。
- 图片→视频/提示编辑:可对静态图像进行动画化,或通过文本提示编辑现有素材(移除/替换对象、重定时、重设风格)。
- 快速迭代与低时延:为创意工作流与产品原型设计提供快速反馈回路。
- 生产级 API:Imagine API 提供批量生成、集成到编辑流水线与企业控制的编程接口。
- 多种“模式”/风格:面向用户的模式(据报示例:Normal / Fun / Spicy 或类似预设)以在风格或宽松度上偏置输出(注意:“Spicy” 模式历史上曾启用 NSFW)。
| Model (company) | Max res (public) | Max clip len (public) | Native audio? | Strengths | Caveats |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | 是 | 迭代快,成本/时延表现强,集成编辑,原生音频 | 720p 上限;审核问题;真实世界保真度不一 |
| Sora (OpenAI) | 720p–1080p(取决于级别) | 短(6–15s) | 是 | 高视觉保真度;与 OpenAI 生态集成良好 | 更昂贵;审核/控制更受约束 |
| Veo (Google DeepMind) | 最高 1080p+ | 短(不等) | 是 | 优秀的写实性,运动稳定 | 成本更高;公开试验较少 |
| Runway Gen-4.5 | 1080p+ | 短(不等) | 是 | 在创作流程中的行业采用,高保真 | 更昂贵;专注于创意工具链 |
| Vidu / Kling / Pika (various specialists) | up to 1080p | 短(不等) | 不一 | 部分提供细分特性(Smart Cuts、多镜头串联) | 音频支持差异较大;API 成熟度不一 |
⚠️ 限制
- 最大视频时长上限为 15 秒。
- 编辑保留输入视频时长(≤ 8.7s)。
- 生成的 URL 为临时链接 — 请及时下载。
如何获取并集成 Grok Imagine Video
步骤 1:申请 API 密钥
登录 cometapi.com。若您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获得 token key:sk-xxxxx 并提交。
步骤 2:向 Grok Imagine Video API 发送请求
选择 “grok-imagine-video” 端点发送 API 请求并设置请求体。请求方法与请求体请参见我们网站的 API 文档。我们的网站也提供 Apifox 测试以便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。调用位置:GROK视频生成 与 视频编辑。
步骤 3:向 Grok Imagine Video API 发送请求
输入文本或上传图像(您可以选择提供源图像以进行动画化)。Grok Imagine AI API 会分析您的输入并准备可用于 url 的内容。支持文本转视频与图像转视频两种转换。
源图像可通过以下方式提供:
- 指向图像的公共 URL
- base64 编码的 data URI(例如,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
步骤 4:获取并验证结果
处理 API 响应以获得生成结果。处理后,API 会返回任务状态与输出数据。提交后会立即返回 request_id;使用 GET 端点检查状态并获取生成的视频。视频编辑为异步,您可能需要多次轮询该端点直至任务完成。请及时下载。




