Google 發布 Veo 3.1 Lite 正值 AI 影片生成的關鍵時刻。就在 OpenAI 在未明確說明的情況下關閉其 Sora 影片應用的數天後,Google 進一步加碼:「影片將長存。」全新的 Lite 等級大幅降低專業級生成式影片的門檻,讓新創、內容團隊與企業更容易上手。
什麼是 Veo 3.1 Lite?
Veo 3.1 Lite 是 Google DeepMind 基於最先進的 Veo 3.1 架構打造的高效率、開發者優先的影片生成模型。於 2026 年 3 月 31 日透過 Gemini API 以預覽版發布,鎖定在成本、速度與可擴展性最為關鍵的高量影片應用。
與專注於超高端電影級輸出的高級等級不同,Lite 優先考量的是「在不犧牲核心寫實性、物理一致性、提示詞遵從度與原生音訊」的前提下降低成本。它可生成 4、6 或 8 秒片段(24 fps),支援橫向(16:9)或直向(9:16)格式——非常適合 YouTube Shorts、TikTok、Instagram Reels、廣告與社群導向內容。
關鍵差異點:它沿用相同的 Veo 3.1 基礎模型,但為效率最佳化,使之成為迄今為止 Google「最具成本效益的影片模型」。現已可在 Google AI Studio 與 Gemini API(模型 ID:veo-3.1-lite-generate-preview)中使用,讓先前覺得連「Fast」等級在大規模使用時費用過高的團隊也能負擔。
本次版本的重大更新:
- 與 Veo 3.1 Fast 相比,成本降低超過 50%(每秒定價詳見下文)。
- 與 Fast 等級相同的生成速度——節省成本不增加延遲。
- 1080p 多格式輸出(預設為 720p;1080p 需略加費)。
- 在 API 與 Vertex AI 中擴大對高量工作流程的可用性。
- 所有輸出預設即包含原生音訊(對話、音效、環境聲)。
這使 Lite 成為生產規模 AI 影片的入門點,而 Fast 與 Standard 則負責更高階的創意需求。Google 也預告「很快會有更多更新」,顯示持續投入。
Veo 3.1 Lite 能做什麼?
1) 文字轉影片與影像轉影片
Veo 3.1 Lite 同時支援文字提示與影像輸入。也就是說,你可以從零描述場景,或以影像作為動態片段的基礎。輸出為帶有音訊的影片,因此模型不只是無聲影像生成器。它旨在生成更完整的輸出套件,對於廣告、解說、產品預告與社群影片特別實用。
2) 直向與橫向格式
模型支援橫向(16:9)與直向(9:16)取景。這項看似簡單的功能實際上非常重要,因為它去除了創作者在發佈到 YouTube Shorts、Reels 類型版位、行動廣告或產品展示面時的大量重新排版阻力。團隊可以一開始就針對目標渠道生成,而非先產生單一格式再手動改版。
3) 720p 與 1080p 生成
Google 表示 Veo 3.1 Lite 支援 720p 與 1080p,對於成本與交付速度比頂級電影輸出更重要的許多商業場景而言已足夠。文件補充了一個關鍵細節:1080p 只支援 8 秒的生成。這是在建立工作流程前必須了解的邊界。
4) 短且可控的片段
開發者可選擇 4 秒、6 秒或 8 秒的時長。這個範圍非常適合產品廣告、轉場、片頭、循環社群創意與快速概念測試。模型顯然更適合快速迭代,而非長篇敘事。如果你需要更長片段或進階多鏡次工作流程,旗艦 Veo 3.1 等級會更合適。
5) 原生音訊
Veo 3.1 系列的標誌性特性,Lite 版本同樣具備。生成的影片包含環境音效與音訊同步,而非無聲畫面。例如,生成城市街景時,它會自動加入車流聲與人群聲。
Veo 3.1 Lite vs Veo 3.1 Fast vs Veo 3.1 Standard:詳細比較
Google 現在提供清晰的三層產品線。你可以在 CometAPI(Veo 3.1 與 Veo 3.1 Pro)中存取它們。以下是官方並列比較:
| 功能 | Veo 3.1 Lite | Veo 3.1 Fast | Veo 3.1 Standard |
|---|---|---|---|
| 最適合 | 高量、成本敏感 | 速度與品質兼顧 | 高級電影級品質 |
| 定價(每秒,含音訊) | $0.05(720p)$0.08(1080p) | $0.15(720p/1080p)→ $0.10/$0.12(4/7 起) | $0.40(720p/1080p)$0.60(4K) |
| 解析度 | 720p、1080p(無 4K) | 720p、1080p、4K | 720p、1080p、4K |
| 生成速度 | 與 Fast 相同 | 最快 | 標準(為品質犧牲較高延遲) |
| 原生音訊 | 有 | 有 | 有 |
| 長寬比 | 16:9、9:16 | 16:9、9:16 | 16:9、9:16 |
| 參考影像 | 受限(單張 image-to-video) | 最多 3 張 | 最多 3 張 |
| 影片延長 | 無 | 有(最多 20 倍,約 148 秒總長) | 有 |
| 首/末幀 | 無 | 有 | 有 |
| 每段最大時長 | 4/6/8s | 4/6/8s | 4/6/8s |
| 理想用例 | 批次廣告、社群、原型 | A/B 測試、快速迭代 | 最終交付、電影級專案 |
| 模型 ID | veo-3.1-lite-generate-preview | veo-3.1-fast-generate-preview | veo-3.1-generate-preview |
Veo 3.1 系列價格變動
成本範例(8 秒 720p 含音訊影片):
- Lite:$0.40
- Fast(目前):$1.20(→ 4/7 後調降至 $0.80)
- Standard:$3.20
相較於目前 Fast 的定價,Lite 帶來超過 67% 的節省——與宣稱一致。
自 4 月 7 日起,整個 Veo 3.1 Fast 系列降價:720p 從 $0.15 降至 $0.10(降 5 分)、1080p 從 $0.18 降至 $0.15(降 3 分)、4K 從 $0.40 降至 $0.35(降 5 分)。
整個 Veo 3.1 系列都在降價。

Veo 3.1 Lite 的限制
它不支援 4K 輸出或影片延長。這兩項功能僅在 Standard 版本提供。換言之,Lite 版本生成的影片最長為 8 秒,無法延長,且不具備 4K 品質。足夠實用,但仍有其限制。
- 無影片延長或多片段串接(請使用更高層級,或手動拼接)。
- 無多重參考影像(僅單張 image-to-video)。
- 無 4K 輸出。
- 每次 API 呼叫最多 1 支影片;提示詞上限 1,024 個 token。
- 影片僅保存 2 天——請及時下載。
- 延遲:視負載而定,從 11 秒到約 6 分鐘。
- 在人物生成方面有地區限制(例如在 EU/UK 需要「allow_adult」)。
如何使用 Veo 3.1 Lite:步驟指南 + Python 程式碼範例
1. 取得存取權限
- 註冊 API(付費方案)。
- 取得你的 API 金鑰。
- 先在 PlayGround 測試(無需寫程式)。
2. Python SDK 範例(720p 直向文字轉影片)
Python
import time
from google import genai
from google.genai import types
client = genai.Client() # API 金鑰會自動從環境變數或憑證載入
prompt = "一段製作披薩的蒙太奇:廚師拋接並壓平帶著麵粉的麵團,將濃郁的紅色番茄醬以螺旋狀舀上,撒上莫札瑞拉起司與義大利臘腸,最後以金黃微焦、熱氣翻騰的披薩作結,背景播放節奏感鮮明的歡快電子樂,整體節奏高能且專業。"
operation = client.models.generate_videos(
model="veo-3.1-lite-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
aspect_ratio="9:16", # 直向,適合 Shorts/Reels
resolution="720p", # 或 "1080p"
duration_seconds=8
),
)
# 輪詢直到完成(非同步作業)
while not operation.done:
time.sleep(10)
operation = client.operations.get(operation)
# 下載影片
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("pizza_making_1080p.mp4") # 或 720p
print("影片已儲存!")
「Image-to-Video 變體」(替換 prompt 並加入影像參數)遵循相同模式。完整文件包含錯誤處理與批次範例。
3. 最佳實務
- 具體描述:機位、燈光、引號中的音訊提示。
- 使用負面提示:例如「避免背景模糊、文字覆蓋」。
- 先以 720p 迭代,最終資產再升至 1080p。
Google Veo 3.1 Lite vs Sora:在 Sora 退場後為何 Google 佔優
這次發布碰上市場的微妙時機。OpenAI 宣布 Sora 的網頁與應用體驗將於 2026 年 4 月 26 日停止,Sora API 將於 2026 年 9 月 24 日停止。OpenAI 也表示 Sora 1 已於 2026 年 3 月 13 日在美國下架,而 Sora 2 現為該地區的預設體驗。
這不代表「Sora 今天就結束」,但競爭態勢正在快速轉變。Google 以低成本、高吞吐選項擴大其影片模型家族,同時 OpenAI 正從舊的 Sora 體驗轉向整合用戶至 Sora 2。對購買方、代理商與開發者而言,問題不再是「哪個品牌的展示影片最炫?」、「哪個平台現在能給我最佳的成本、輸出控制與部署可靠性?」而更多地是 CometAPI 目前提供最佳的成本、輸出控制與部署可靠性組合。它整合了 Veo 3.1 系列、Sora 2 與 Grok imagine Video 等,且較官方價下調 20%。開發者可利用 CometAPI 的整合來測試哪支影片表現最佳。
OpenAI 關閉 Sora 留下了空缺。Sora 2 具有強勁的視覺表現,但缺乏原生音訊、成本更高且可用性有限。Veo 3.1 Lite 的反擊在於:
- 原生同步音訊。
- 更低定價(相較可比層級通常便宜 50–70%)。
獨立測試與開發者回饋顯示,Veo 3.1 系列在電影感一致性、提示詞遵從度與商用就緒度方面領先——尤其是在品牌內容與 UGC 上。
結論:平價 AI 影片的未來已然到來
Veo 3.1 Lite 不只是更便宜——它是策略性助力。透過將成本削減逾 50%、支援 1080p 多格式輸出,並在 Fast 等級速度提供原生音訊,Google 讓專業的 AI 影片生成對每位創作者與企業都變得可行。無論你是在打樣、擴大量產社群內容,或打造下一支病毒式行銷活動,Veo 3.1 Lite 都在 2026 年提供了無與倫比的價值。
準備開始了嗎?前往 CometAPI,取得你的 API 金鑰並執行上述程式碼。昂貴、受限的影片 AI 時代已經結束——Google 已讓它對所有人開放。
