Google 发布 Veo 3.1 Lite 的时机恰逢 AI 视频生成的关键节点。就在 OpenAI 未作出明确解释便关闭其 Sora 视频应用的数日后,Google 明确表态:“视频会长期存在。”全新的 Lite 层级让专业级生成式视频显著更易获得,大幅降低初创团队、内容团队与企业的使用门槛。
什么是 Veo 3.1 Lite?
Veo 3.1 Lite 是由 Google DeepMind 基于最先进的 Veo 3.1 架构打造的高效率、面向开发者的视频生成模型。它于 2026 年 3 月 31 日通过 Gemini API 以预览形式发布,面向成本、速度与可扩展性最重要的高吞吐视频应用场景。
不同于聚焦超高端电影级输出的高阶层级,Lite 的优先级是“在不牺牲核心真实感、物理一致性、提示词遵循与原生音频的前提下实现高性价比”。它可生成 4 秒、6 秒或 8 秒片段(24 fps),支持横屏(16:9)与竖屏(9:16)格式——非常适合 YouTube Shorts、TikTok、Instagram Reels、广告与社交优先内容。
关键差异点:它使用相同的 Veo 3.1 基础模型,但进行了效率优化,成为迄今为止 Google “性价比最高的视频模型”。现已在 Google AI Studio 与 Gemini API(模型 ID:veo-3.1-lite-generate-preview)中可用,让此前连 “Fast” 层在规模化下都显得昂贵的团队也能轻松上手。
本次版本的主要更新:
- 与 Veo 3.1 Fast 相比,成本降低 >50%(每秒定价见下文)。
- 与 Fast 层相同的生成速度——省钱不增时延。
- 1080p 多格式输出(默认 720p;1080p 需小幅溢价)。
- 在 API 与 Vertex AI 中扩大高吞吐工作流可达性。
- 所有输出默认包含原生音频(对白、音效、环境声)。
由此,Lite 成为面向生产规模 AI 视频的入门选项,而 Fast 与 Standard 面向更高阶创意需求。Google 也“预告近期还有更多更新”,表明其持续投入。
Veo 3.1 Lite 能做什么?
1) 文本生成视频与图像生成视频
Veo 3.1 Lite 支持文本提示与图像输入。也就是说,你既可以从零描述一个场景,也可以用一张图像作为运动画面的基础。输出为带音频的视频,模型并非静音的纯视觉生成器。它旨在生成更完整的成片包,尤其适用于广告、讲解、产品预告与社交视频。
2) 竖屏与横屏格式
模型支持横屏(16:9)与竖屏(9:16)取景。这一特性看似简单,却能为需面向 YouTube Shorts、Reels 类位、移动广告或产品演示面的创作者减少大量重排版摩擦。团队无需先生成一种格式再手动改造,而是可从一开始就面向目标渠道生成。
3) 720p 与 1080p 生成
Google 称 Veo 3.1 Lite 支持 720p 与 1080p,这对许多更看重成本与周转效率的商业场景而言已足够。文档补充了一个关键细节:1080p 仅支持 8 秒生成。这是在设计工作流前需要了解的边界条件。
4) 短时可控片段
开发者可选择 4 秒、6 秒或 8 秒时长。这一范围非常适合产品广告、转场、片头、循环社交创意与快速概念测试。模型显然面向快速迭代,而非长篇叙事。如果你需要更长片段或高级多镜次工作流,旗舰层级 Veo 3.1 更适合。
5) 原生音频
这是 Veo 3.1 系列的标志性功能,在 Lite 版同样具备。生成视频将包含环境音效与音频同步,而非无声画面。例如,生成城市街景时,会自动加入车流与人群的环境声。
Veo 3.1 Lite vs Veo 3.1 Fast vs Veo 3.1 Standard:详细对比
Google 现在提供清晰的三层产品线。你可以在 CometAPI(Veo 3.1 与 Veo 3.1 Pro)中访问它们。以下是官方并排对比:
| 功能 | Veo 3.1 Lite | Veo 3.1 Fast | Veo 3.1 Standard |
|---|---|---|---|
| 最佳适用对象 | 高批量、成本敏感 | 速度与质量平衡 | 高端电影级质量 |
| 定价(每秒,含音频) | $0.05(720p)$0.08(1080p) | $0.15(720p/1080p)→ $0.10/$0.12(Apr 7) | $0.40(720p/1080p)$0.60(4K) |
| 分辨率 | 720p、1080p(无 4K) | 720p、1080p、4K | 720p、1080p、4K |
| 生成速度 | 与 Fast 相同 | 最快 | 标准(为质量带来更高延迟) |
| 原生音频 | 是 | 是 | 是 |
| 纵横比 | 16:9、9:16 | 16:9、9:16 | 16:9、9:16 |
| 参考图像 | 有限(单张图像转视频) | 最多 3 张 | 最多 3 张 |
| 视频扩展 | 否 | 是(最高 20×,总计约 ~148s) | 是 |
| 首/末帧 | 否 | 是 | 是 |
| 单段最大时长 | 4/6/8 秒 | 4/6/8 秒 | 4/6/8 秒 |
| 理想用例 | 批量广告、社交、原型 | A/B 测试、快速迭代 | 最终交付、电影级项目 |
| 模型 ID | veo-3.1-lite-generate-preview | veo-3.1-fast-generate-preview | veo-3.1-generate-preview |
Veo 3.1 系列价格变动
成本示例(8 秒 720p 带音频视频):
- Lite:$0.40
- Fast(当前):$1.20(→ $0.80,4 月 7 日降价后)
- Standard:$3.20
与当前 Fast 定价相比,Lite 提供超过 67% 的节省——与宣传一致。
自 4 月 7 日起,Veo 3.1 Fast 全线降价:720p 从 $0.15 降至 $0.10(降 5 美分),1080p 从 $0.18 降至 $0.15(降 3 美分),4K 从 $0.40 降至 $0.35(降 5 美分)。
Veo 3.1 全系列都在降价。

Veo 3.1 Lite 的限制
它不支持 4K 输出或视频扩展。这两项功能仅在 Standard 版本可用。换言之,Lite 版生成的视频最长为 8 秒,不能扩展,且不具备 4K 质量。够用,但有其局限。
- 不支持视频扩展或多片段串联(使用更高层或手动拼接)。
- 不支持多参考图像(仅单张图像转视频)。
- 不支持 4K 输出。
- 每次 API 调用最多 1 段视频;提示词上限 1,024 tokens。
- 视频仅保留 2 天——请及时下载。
- 延迟:视负载为 11 秒至 ~6 分钟。
- 人物生成的区域限制(例如在 EU/UK 需设置 “allow_adult”)。
如何使用 Veo 3.1 Lite:分步指南 + Python 代码示例
1. 获取访问权限
- 注册 API(付费层)。
- 获取 API Key。
- 先在 PlayGround 中测试(无需代码)。
2. Python SDK 示例(文本转视频,720p 竖屏)
Python
import time
from google import genai
from google.genai import types
client = genai.Client() # API key 将自动从环境或凭据加载
prompt = "披萨制作蒙太奇:厨师抛掷并按平撒着面粉的面团,舀取浓郁的红色番茄酱画出螺旋,撒上马苏里拉芝士与意大利辣香肠,最后一镜定格于起泡的金黄色披萨;背景为节奏感强烈的电子乐,整体高能量、专业质感的视频。"
operation = client.models.generate_videos(
model="veo-3.1-lite-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
aspect_ratio="9:16", # 竖屏,适配 Shorts/Reels
resolution="720p", # 或 "1080p"
duration_seconds=8
),
)
# 轮询直到完成(异步操作)
while not operation.done:
time.sleep(10)
operation = client.operations.get(operation)
# 下载视频
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("pizza_making_1080p.mp4") # 或 720p
print("视频已保存!")
图像转视频变体(替换 prompt 并增加图像参数)遵循相同模式。完整文档包含错误处理与批量示例。
3. 最佳实践
- 具体描述:机位、光线、音频提示用引号明确。
- 使用负向提示:“避免背景模糊、文字叠加。”
- 先用 720p 快速迭代,最终素材再升至 1080p。
Google Veo 3.1 Lite 对比 Sora:为什么 Google 在退役后胜出
此版本发布于市场的微妙时刻。OpenAI 宣布 Sora 的网页与应用体验将于 2026 年 4 月 26 日停用,Sora API 将于 2026 年 9 月 24 日停用。OpenAI 还表示 Sora 1 已于 2026 年 3 月 13 日在美国下线,而 Sora 2 现为当地默认体验。
这并不意味着“Sora 今天就结束了”。但竞争环境正迅速变化:Google 以低成本、高吞吐的选项扩展其视频模型家族,而 OpenAI 正从旧版 Sora 体验迁移并将用户整合至 Sora 2。对采购方、代理商与开发者而言,问题不再是“哪个品牌演示更炫?”、“哪个平台在当前提供最佳的成本、输出控制与部署可靠性组合?”,而更多是 CometAPI 目前提供了最佳的成本、输出控制与部署可靠性组合。它集成了 Veo 3.1 系列、Sora 2 与 Grok imagine Video 等,价格较官方优惠 20%。开发者可借助 CometAPI 集成对比测试哪类视频更优。
OpenAI 的 Sora 下线留下了空白。Sora 2 画面表现强,但缺乏原生音频、成本更高、可用性受限。Veo 3.1 Lite 的应对是:
- 原生同步音频。
- 更低定价(相较同类层级通常便宜 50–70%)。
独立测试与开发者反馈显示,Veo 3.1 家族在电影质感一致性、提示词遵循与商业就绪度方面领先——尤其是在品牌内容与 UGC 场景。
结论:平价 AI 视频的未来已到来
Veo 3.1 Lite 不只是更便宜——它是战略级使能者。通过将成本砍半以上、支持 1080p 多格式输出,并以 Fast 层速度提供原生音频,Google 让专业级 AI 视频生成对每位创作者与企业都变得可行。无论你是在做原型、规模化社交内容,还是打造下一支爆款,Veo 3.1 Lite 在 2026 年都带来了无与伦比的价值。
准备好开始了吗? 前往 CometAPI,获取你的 API Key,运行上面的代码。昂贵且门槛高的视频 AI 时代已成过去——Google 刚刚让它对所有人都触手可及。
