什么是 Google Veo 3.1 Lite?

CometAPI
AnnaApr 1, 2026
什么是 Google Veo 3.1 Lite?

Google 发布 Veo 3.1 Lite 的时机恰逢 AI 视频生成的关键节点。就在 OpenAI 未作出明确解释便关闭其 Sora 视频应用的数日后,Google 明确表态:“视频会长期存在。”全新的 Lite 层级让专业级生成式视频显著更易获得,大幅降低初创团队、内容团队与企业的使用门槛。

什么是 Veo 3.1 Lite?

Veo 3.1 Lite 是由 Google DeepMind 基于最先进的 Veo 3.1 架构打造的高效率、面向开发者的视频生成模型。它于 2026 年 3 月 31 日通过 Gemini API 以预览形式发布,面向成本、速度与可扩展性最重要的高吞吐视频应用场景。

不同于聚焦超高端电影级输出的高阶层级,Lite 的优先级是“在不牺牲核心真实感、物理一致性、提示词遵循与原生音频的前提下实现高性价比”。它可生成 4 秒、6 秒或 8 秒片段(24 fps),支持横屏(16:9)与竖屏(9:16)格式——非常适合 YouTube Shorts、TikTok、Instagram Reels、广告与社交优先内容。

关键差异点:它使用相同的 Veo 3.1 基础模型,但进行了效率优化,成为迄今为止 Google “性价比最高的视频模型”。现已在 Google AI Studio 与 Gemini API(模型 ID:veo-3.1-lite-generate-preview)中可用,让此前连 “Fast” 层在规模化下都显得昂贵的团队也能轻松上手。

本次版本的主要更新:

  • 与 Veo 3.1 Fast 相比,成本降低 >50%(每秒定价见下文)。
  • 与 Fast 层相同的生成速度——省钱不增时延。
  • 1080p 多格式输出(默认 720p;1080p 需小幅溢价)。
  • 在 API 与 Vertex AI 中扩大高吞吐工作流可达性。
  • 所有输出默认包含原生音频(对白、音效、环境声)。

由此,Lite 成为面向生产规模 AI 视频的入门选项,而 Fast 与 Standard 面向更高阶创意需求。Google 也“预告近期还有更多更新”,表明其持续投入。

Veo 3.1 Lite 能做什么?

1) 文本生成视频与图像生成视频

Veo 3.1 Lite 支持文本提示与图像输入。也就是说,你既可以从零描述一个场景,也可以用一张图像作为运动画面的基础。输出为带音频的视频,模型并非静音的纯视觉生成器。它旨在生成更完整的成片包,尤其适用于广告、讲解、产品预告与社交视频。

2) 竖屏与横屏格式

模型支持横屏(16:9)与竖屏(9:16)取景。这一特性看似简单,却能为需面向 YouTube Shorts、Reels 类位、移动广告或产品演示面的创作者减少大量重排版摩擦。团队无需先生成一种格式再手动改造,而是可从一开始就面向目标渠道生成。

3) 720p 与 1080p 生成

Google 称 Veo 3.1 Lite 支持 720p 与 1080p,这对许多更看重成本与周转效率的商业场景而言已足够。文档补充了一个关键细节:1080p 仅支持 8 秒生成。这是在设计工作流前需要了解的边界条件。

4) 短时可控片段

开发者可选择 4 秒、6 秒或 8 秒时长。这一范围非常适合产品广告、转场、片头、循环社交创意与快速概念测试。模型显然面向快速迭代,而非长篇叙事。如果你需要更长片段或高级多镜次工作流,旗舰层级 Veo 3.1 更适合。

5) 原生音频

这是 Veo 3.1 系列的标志性功能,在 Lite 版同样具备。生成视频将包含环境音效与音频同步,而非无声画面。例如,生成城市街景时,会自动加入车流与人群的环境声。

Veo 3.1 Lite vs Veo 3.1 Fast vs Veo 3.1 Standard:详细对比

Google 现在提供清晰的三层产品线。你可以在 CometAPIVeo 3.1Veo 3.1 Pro)中访问它们。以下是官方并排对比:

功能Veo 3.1 LiteVeo 3.1 FastVeo 3.1 Standard
最佳适用对象高批量、成本敏感速度与质量平衡高端电影级质量
定价(每秒,含音频)$0.05(720p)$0.08(1080p)$0.15(720p/1080p)→ $0.10/$0.12(Apr 7)$0.40(720p/1080p)$0.60(4K)
分辨率720p、1080p(无 4K)720p、1080p、4K720p、1080p、4K
生成速度与 Fast 相同最快标准(为质量带来更高延迟)
原生音频
纵横比16:9、9:1616:9、9:1616:9、9:16
参考图像有限(单张图像转视频)最多 3 张最多 3 张
视频扩展是(最高 20×,总计约 ~148s)
首/末帧
单段最大时长4/6/8 秒4/6/8 秒4/6/8 秒
理想用例批量广告、社交、原型A/B 测试、快速迭代最终交付、电影级项目
模型 IDveo-3.1-lite-generate-previewveo-3.1-fast-generate-previewveo-3.1-generate-preview

Veo 3.1 系列价格变动

成本示例(8 秒 720p 带音频视频):

  • Lite:$0.40
  • Fast(当前):$1.20(→ $0.80,4 月 7 日降价后)
  • Standard:$3.20

与当前 Fast 定价相比,Lite 提供超过 67% 的节省——与宣传一致。

自 4 月 7 日起,Veo 3.1 Fast 全线降价:720p 从 $0.15 降至 $0.10(降 5 美分),1080p 从 $0.18 降至 $0.15(降 3 美分),4K 从 $0.40 降至 $0.35(降 5 美分)。

Veo 3.1 全系列都在降价。

什么是 Google Veo 3.1 Lite?

Veo 3.1 Lite 的限制

它不支持 4K 输出或视频扩展。这两项功能仅在 Standard 版本可用。换言之,Lite 版生成的视频最长为 8 秒,不能扩展,且不具备 4K 质量。够用,但有其局限。

  • 不支持视频扩展或多片段串联(使用更高层或手动拼接)。
  • 不支持多参考图像(仅单张图像转视频)。
  • 不支持 4K 输出。
  • 每次 API 调用最多 1 段视频;提示词上限 1,024 tokens。
  • 视频仅保留 2 天——请及时下载。
  • 延迟:视负载为 11 秒至 ~6 分钟。
  • 人物生成的区域限制(例如在 EU/UK 需设置 “allow_adult”)。

如何使用 Veo 3.1 Lite:分步指南 + Python 代码示例

1. 获取访问权限

  • 注册 API(付费层)。
  • 获取 API Key。
  • 先在 PlayGround 中测试(无需代码)。

2. Python SDK 示例(文本转视频,720p 竖屏)

Python

import time
from google import genai
from google.genai import types

client = genai.Client()  # API key 将自动从环境或凭据加载

prompt = "披萨制作蒙太奇:厨师抛掷并按平撒着面粉的面团,舀取浓郁的红色番茄酱画出螺旋,撒上马苏里拉芝士与意大利辣香肠,最后一镜定格于起泡的金黄色披萨;背景为节奏感强烈的电子乐,整体高能量、专业质感的视频。"

operation = client.models.generate_videos(
    model="veo-3.1-lite-generate-preview",
    prompt=prompt,
    config=types.GenerateVideosConfig(
        aspect_ratio="9:16",      # 竖屏,适配 Shorts/Reels
        resolution="720p",        # 或 "1080p"
        duration_seconds=8
    ),
)

# 轮询直到完成(异步操作)
while not operation.done:
    time.sleep(10)
    operation = client.operations.get(operation)

# 下载视频
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("pizza_making_1080p.mp4")  # 或 720p
print("视频已保存!")

图像转视频变体(替换 prompt 并增加图像参数)遵循相同模式。完整文档包含错误处理与批量示例。

3. 最佳实践

  • 具体描述:机位、光线、音频提示用引号明确。
  • 使用负向提示:“避免背景模糊、文字叠加。”
  • 先用 720p 快速迭代,最终素材再升至 1080p。

Google Veo 3.1 Lite 对比 Sora:为什么 Google 在退役后胜出

此版本发布于市场的微妙时刻。OpenAI 宣布 Sora 的网页与应用体验将于 2026 年 4 月 26 日停用,Sora API 将于 2026 年 9 月 24 日停用。OpenAI 还表示 Sora 1 已于 2026 年 3 月 13 日在美国下线,而 Sora 2 现为当地默认体验。

这并不意味着“Sora 今天就结束了”。但竞争环境正迅速变化:Google 以低成本、高吞吐的选项扩展其视频模型家族,而 OpenAI 正从旧版 Sora 体验迁移并将用户整合至 Sora 2。对采购方、代理商与开发者而言,问题不再是“哪个品牌演示更炫?”、“哪个平台在当前提供最佳的成本、输出控制与部署可靠性组合?”,而更多是 CometAPI 目前提供了最佳的成本、输出控制与部署可靠性组合。它集成了 Veo 3.1 系列、Sora 2Grok imagine Video 等,价格较官方优惠 20%。开发者可借助 CometAPI 集成对比测试哪类视频更优。

OpenAI 的 Sora 下线留下了空白。Sora 2 画面表现强,但缺乏原生音频、成本更高、可用性受限。Veo 3.1 Lite 的应对是:

  • 原生同步音频。
  • 更低定价(相较同类层级通常便宜 50–70%)。

独立测试与开发者反馈显示,Veo 3.1 家族在电影质感一致性、提示词遵循与商业就绪度方面领先——尤其是在品牌内容与 UGC 场景。

结论:平价 AI 视频的未来已到来

Veo 3.1 Lite 不只是更便宜——它是战略级使能者。通过将成本砍半以上、支持 1080p 多格式输出,并以 Fast 层速度提供原生音频,Google 让专业级 AI 视频生成对每位创作者与企业都变得可行。无论你是在做原型、规模化社交内容,还是打造下一支爆款,Veo 3.1 Lite 在 2026 年都带来了无与伦比的价值。

准备好开始了吗? 前往 CometAPI,获取你的 API Key,运行上面的代码。昂贵且门槛高的视频 AI 时代已成过去——Google 刚刚让它对所有人都触手可及。

以低成本 获取顶级模型

阅读更多