📘 Grok Imagine Video 的技术规格

规格	详细信息
模型 ID	grok-imagine-video
提供方	xAI
类型	视频生成与编辑 AI
输入类型	文本（提示）；可选图像或视频文本提示（自然语言）；可选图像输入（图片→视频）；可选 video_url 以编辑现有片段。编辑输入视频的最长时长因端点而异——据报道某些编辑流程约为 8.7s。
输出类型	通过临时 URL 提供 .mp4 视频
时长范围（生成）	1–15 秒
分辨率	480p、720p（可配置）
纵横比	1:1、16:9、9:16
编辑支持	是 — 可对最长 8.7s 的视频进行动画与修改
内容审核	内置内容审核
定价	按秒计费，费用因分辨率而异

🚀 什么是 Grok Imagine Video？

Grok Imagine Video 是 xAI 通过 CometAPI 提供的高级视频生成与编辑 AI 模型。它使开发者能够通过自然语言提示生成短的定制视频，并可选地为静态图像添加动画或编辑现有片段。该模型支持可配置的输出时长、分辨率与纵横比，内置内容审核以确保合规。

🧠 主要功能（Grok Imagine 的差异化）

原生音频 + 唇同步：生成同步的环境音效、效果以及短语音/旁白，并提供近似唇形同步。
图片→视频 / 提示词编辑：通过文本提示为静态图像添加动画或编辑现有素材（移除/替换对象、重定时、重塑风格）。
快速迭代与低延迟：为快速反馈循环而设计，适用于创意流程与产品原型制作。
生产级 API：Imagine API 提供用于批量生成、集成到编辑流水线以及企业控制的编程端点。
多种“模式”/风格：面向用户的模式（据报道示例：Normal / Fun / Spicy 或类似预设），可对输出的风格或宽容度进行偏置（注意：“Spicy”模式历史上启用了 NSFW）。

模型（公司）	最高分辨率（公开）	最长片段时长（公开）	原生音频？	优势	注意事项
Grok Imagine (xAI)	720p	6–15s	是	快速迭代、成本/延迟表现强、集成编辑、原生音频	720p 上限；审核顾虑；现实世界保真度不一
Sora (OpenAI)	720p–1080p（取决于层级）	短（6–15s）	是	高视觉保真度；与 OpenAI 生态集成度高	更昂贵；审核/控制受限
Veo (Google DeepMind)	最高 1080p+	短（不等）	是	强真实感、运动稳定	成本更高；公共试验更少
Runway Gen-4.5	1080p+	短（不等）	是	行业广泛采用，适用于创意工作流程，高保真	更昂贵；专注于创意工具
Vidu / Kling / Pika（多家专长厂商）	最高 1080p	短（不等）	混合	部分提供小众功能（Smart Cuts、多镜头串联）	音频支持各异；API 成熟度不同

⚠️ 限制

最长视频时长上限为 15 秒。
编辑保留输入视频时长（≤ 8.7s）。
生成的 URL 为临时链接 — 请及时下载。

如何访问并集成 Grok Imagine Video

步骤 1：注册获取 API 密钥

登录 cometapi.com。如果您尚未成为我们的用户，请先注册。登录您的 CometAPI 控制台。获取接口的访问凭证 API 密钥。在个人中心的 API token 处点击“Add Token”，获取令牌密钥：sk-xxxxx 并提交。

步骤 2：向 `Grok Imagine Video` API 发送请求

选择“grok-imagine-video”端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。调用位置：GROK视频生成和视频编辑。

步骤 3：向 `Grok Imagine Video` API 发送请求

输入文本或上传图像（您可以选择提供源图像进行动画）。Grok Imagine AI API 会分析您的输入并为 url 准备内容。支持文本转视频与图片转视频。

源图像可通过以下方式提供：

指向图像的公开 URL
base64 编码的数据 URI（例如，data:image/jpeg;base64,<YOUR_BASE64_IMAGE>）

步骤 4：获取并验证结果

处理 API 响应以获取生成结果。提交后，API 会返回任务状态与输出数据。提交后会立即返回 request_id；使用 GET 端点查询状态并获取生成的视频。视频编辑是异步的，您可能需要多次轮询该端点直至任务完成。请及时下载。

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Grok Imagine Video