📘 Grok Imagine Video 的技术规格
| 规格 | 详细信息 |
|---|---|
| 模型 ID | grok-imagine-video |
| 提供方 | xAI |
| 类型 | 视频生成与编辑 AI |
| 输入类型 | 文本(提示);可选图像或视频 文本提示(自然语言);可选图像输入(图片→视频);可选 video_url 以编辑现有片段。编辑输入视频的最长时长因端点而异——据报道某些编辑流程约为 8.7s。 |
| 输出类型 | 通过临时 URL 提供 .mp4 视频 |
| 时长范围(生成) | 1–15 秒 |
| 分辨率 | 480p、720p(可配置) |
| 纵横比 | 1:1、16:9、9:16 |
| 编辑支持 | 是 — 可对最长 8.7s 的视频进行动画与修改 |
| 内容审核 | 内置内容审核 |
| 定价 | 按秒计费,费用因分辨率而异 |
🚀 什么是 Grok Imagine Video?
Grok Imagine Video 是 xAI 通过 CometAPI 提供的高级视频生成与编辑 AI 模型。它使开发者能够通过自然语言提示生成短的定制视频,并可选地为静态图像添加动画或编辑现有片段。该模型支持可配置的输出时长、分辨率与纵横比,内置内容审核以确保合规。
🧠 主要功能(Grok Imagine 的差异化)
- 原生音频 + 唇同步:生成同步的环境音效、效果以及短语音/旁白,并提供近似唇形同步。
- 图片→视频 / 提示词编辑:通过文本提示为静态图像添加动画或编辑现有素材(移除/替换对象、重定时、重塑风格)。
- 快速迭代与低延迟:为快速反馈循环而设计,适用于创意流程与产品原型制作。
- 生产级 API:Imagine API 提供用于批量生成、集成到编辑流水线以及企业控制的编程端点。
- 多种“模式”/风格:面向用户的模式(据报道示例:Normal / Fun / Spicy 或类似预设),可对输出的风格或宽容度进行偏置(注意:“Spicy”模式历史上启用了 NSFW)。
| 模型(公司) | 最高分辨率(公开) | 最长片段时长(公开) | 原生音频? | 优势 | 注意事项 |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | 是 | 快速迭代、成本/延迟表现强、集成编辑、原生音频 | 720p 上限;审核顾虑;现实世界保真度不一 |
| Sora (OpenAI) | 720p–1080p(取决于层级) | 短(6–15s) | 是 | 高视觉保真度;与 OpenAI 生态集成度高 | 更昂贵;审核/控制受限 |
| Veo (Google DeepMind) | 最高 1080p+ | 短(不等) | 是 | 强真实感、运动稳定 | 成本更高;公共试验更少 |
| Runway Gen-4.5 | 1080p+ | 短(不等) | 是 | 行业广泛采用,适用于创意工作流程,高保真 | 更昂贵;专注于创意工具 |
| Vidu / Kling / Pika(多家专长厂商) | 最高 1080p | 短(不等) | 混合 | 部分提供小众功能(Smart Cuts、多镜头串联) | 音频支持各异;API 成熟度不同 |
⚠️ 限制
- 最长视频时长上限为 15 秒。
- 编辑保留输入视频时长(≤ 8.7s)。
- 生成的 URL 为临时链接 — 请及时下载。
如何访问并集成 Grok Imagine Video
步骤 1:注册获取 API 密钥
登录 cometapi.com。如果您尚未成为我们的用户,请先注册。登录您的 CometAPI 控制台。获取接口的访问凭证 API 密钥。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。
步骤 2:向 Grok Imagine Video API 发送请求
选择“grok-imagine-video”端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。调用位置:GROK视频生成 和 视频编辑。
步骤 3:向 Grok Imagine Video API 发送请求
输入文本或上传图像(您可以选择提供源图像进行动画)。Grok Imagine AI API 会分析您的输入并为 url 准备内容。支持文本转视频与图片转视频。
源图像可通过以下方式提供:
- 指向图像的公开 URL
- base64 编码的数据 URI(例如,
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
步骤 4:获取并验证结果
处理 API 响应以获取生成结果。提交后,API 会返回任务状态与输出数据。提交后会立即返回 request_id;使用 GET 端点查询状态并获取生成的视频。视频编辑是异步的,您可能需要多次轮询该端点直至任务完成。请及时下载。