Google による Veo 3.1 Lite の発表は、AI 動画生成にとって極めて重要な局面で行われた。明確な説明のないまま OpenAI が Sora の動画アプリを閉鎖してから数日後、Google は「動画はここに残る」と改めて強調した。新しい Lite ティアは、スタートアップ、コンテンツチーム、エンタープライズに向けて、プロフェッショナル級の生成動画へのアクセスを劇的に容易にし、参入障壁を大幅に引き下げる。
Veo 3.1 Lite とは?
Veo 3.1 Lite は、Google DeepMind による最先端の Veo 3.1 アーキテクチャを基盤にした、高効率で開発者優先の動画生成モデルだ。2026 年 3 月 31 日に Gemini API 経由のプレビューとして公開され、コスト、速度、スケーラビリティが最重要となる高トラフィックの動画アプリケーションを主な対象としている。
超高品位のシネマティック出力にフォーカスしたプレミアムティアと異なり、Lite は中核となるリアリズム、物理法則、プロンプト遵守、ネイティブ音声を犠牲にせず、手頃さを最優先する。ランドスケープ(16:9)またはポートレート(9:16)で 4・6・8 秒(24 fps)のクリップを生成でき、YouTube Shorts、TikTok、Instagram Reels、広告、ソーシャル中心のコンテンツに最適だ。
大きな違いは、同じ Veo 3.1 の基盤モデルを活用しつつ効率化に最適化した点で、これまでで「最もコスト効率の高い動画モデル」だという。Google AI Studio と Gemini API(モデル ID: veo-3.1-lite-generate-preview)で即時利用可能で、スケール時に「Fast」ティアでさえ高価だと感じていたチームにも門戸を開く。
このリリースの主な更新点:
- Veo 3.1 Fast 比で50%超のコスト削減(秒単価は後述)
- Fast ティアと同等の生成速度—低価格化によるレイテンシ増はなし
- 1080p マルチフォーマット出力(デフォルトは 720p、1080p はわずかなプレミアム)
- API と Vertex AI で高ボリュームワークフローへのアクセス性を拡大
- すべての出力でデフォルトでネイティブ音声を含む(ダイアログ、効果音、環境音)
これにより、Lite はプロダクション規模の AI 動画のエントリーポイントとなり、Fast と Standard はプレミアムなクリエイティブニーズを担う。Google は「近くさらなる更新」を示唆しており、継続的な投資姿勢がうかがえる。
Veo 3.1 Lite で何ができる?
1) Text-to-video と image-to-video
Veo 3.1 Lite はテキストプロンプトと画像入力の両方に対応。ゼロからシーンを記述することも、画像を基に動きのあるクリップを生成することもできる。出力は音声付きの動画で、単なる無音のビジュアルジェネレーターではない。広告、解説動画、プロダクトティーザー、ソーシャル動画など、完成度の高い出力パッケージが求められる用途に有用だ。
2) ポートレートとランドスケープの両対応
ランドスケープ(16:9)とポートレート(9:16)の両フレーミングをサポート。これは YouTube Shorts、Reels 形式の枠、モバイル広告、製品デモ面などへ配信するクリエイターにとって、リフォーマットの手間を大幅に減らす重要な機能だ。あとで手動で流用するのではなく、最初からターゲットチャネルに合わせて生成できる。
3) 720p と 1080p の生成
Google によれば、Veo 3.1 Lite は 720p と 1080p をサポートし、コストとスピードを重視する多くの商用ユースケースに十分だ。ドキュメントには重要な注意点がある。1080p は 8 秒生成にのみ対応する。この境界条件はワークフロー構築前に知っておきたい。
4) 短尺かつ制御しやすいクリップ
開発者は 4 秒、6 秒、8 秒の長さを選択できる。この範囲はプロダクト広告、トランジション、イントロ、ループするソーシャルクリエイティブ、迅速なコンセプトテストに理想的だ。同モデルは明らかに長編ストーリーテリングではなく、素早い反復に向いている。長尺クリップや高度なマルチショットを要する場合は、フラッグシップの Veo 3.1 ティアが適している。
5) ネイティブ音声
Veo 3.1 シリーズの象徴的機能で、Lite 版にも搭載。生成される動画には環境音や効果音、音声同期が含まれ、無音ではない。例えば都市の街並みを生成する場合、交通音や人混みのざわめきが自動的に加えられる。
Veo 3.1 Lite vs Veo 3.1 Fast vs Veo 3.1 Standard: 詳細比較
Google は明確な 3 ティア構成を用意した。CometAPI(Veo 3.1 と Veo 3.1 Pro)でアクセス可能。以下が公式のサイドバイサイド比較だ。
| Feature | Veo 3.1 Lite | Veo 3.1 Fast | Veo 3.1 Standard |
|---|---|---|---|
| Best For | 大量生成、コスト重視 | 速度と品質のバランス | プレミアム級のシネマ品質 |
| Pricing (per second, with audio) | $0.05 (720p) $0.08 (1080p) | $0.15 (720p/1080p) → $0.10/$0.12 (Apr 7) | $0.40 (720p/1080p) $0.60 (4K) |
| Resolution | 720p, 1080p (no 4K) | 720p, 1080p, 4K | 720p, 1080p, 4K |
| Generation Speed | Fast と同等 | 最速 | Standard(品質優先でレイテンシ高め) |
| Native Audio | あり | あり | あり |
| Aspect Ratios | 16:9, 9:16 | 16:9, 9:16 | 16:9, 9:16 |
| Reference Images | 制限あり(単一 image-to-video) | 最大 3 | 最大 3 |
| Video Extension | なし | あり(最大 20 倍、~148s 合計) | あり |
| First/Last Frame | なし | あり | あり |
| Max Duration per Clip | 4/6/8s | 4/6/8s | 4/6/8s |
| Ideal Use Cases | バッチ広告、ソーシャル、試作 | A/B テスト、迅速な反復 | 最終納品、フィルムグレード案件 |
| Model ID | veo-3.1-lite-generate-preview | veo-3.1-fast-generate-preview | veo-3.1-generate-preview |
Veo 3.1 ファミリーの価格変更
コスト例(8 秒 720p、音声付き):
- Lite: $0.40
- Fast(現行): $1.20(→ 4 月 7 日以降 $0.80)
- Standard: $3.20
Lite は現行の Fast 価格に対して67%超の節約を実現—まさに公称どおりだ。
4 月 7 日から、Veo 3.1 Fast 全ラインナップの価格が値下げされた。720p は $0.15 から $0.10(5 セント減)、1080p は $0.18 から $0.15(3 セント減)、4K は $0.40 から $0.35(5 セント減)。
Veo 3.1 ファミリー全体が値下げの対象となっている。

Veo 3.1 Lite の制限事項
4K 出力や動画延長には非対応。これら 2 機能は Standard のみがサポートする。言い換えると、Lite は最長 8 秒の動画を生成し、延長はできず、4K 品質にはならない。十分実用的だが、制約はある。
- 動画延長やマルチクリップのシーケンス化は不可(上位ティアを使うか手動で連結)
- 複数参照画像は不可(単一の image-to-video のみ)
- 4K 出力なし
- 1 回の API 呼び出しにつき最大 1 本、プロンプト上限 1,024 トークン
- 動画の保存期間は 2 日のみ—早めのダウンロード推奨
- レイテンシ: 負荷により 11 秒〜~6 分
- 人物生成に関する地域制限(例:「allow_adult」は EU/UK)
Veo 3.1 Lite の使い方: ステップバイステップ + Python コード例
1. アクセスの取得
- API にサインアップ(有料ティア)
- API キーを取得
- まずは PlayGround でテスト(コード不要)
2. Python SDK 例(720p ポートレートでの Text-to-Video)
Python
import time
from google import genai
from google.genai import types
client = genai.Client() # API キーは環境変数または認証情報から自動読み込み
prompt = "ピザ作りのモンタージュ:シェフが粉だらけの生地を宙で回して伸ばし、濃い赤のトマトソースを渦巻き状にかけ、モッツァレラチーズとペパロニを振りかけ、最後に泡立つ黄金色のピザのショット。リズム感のあるアップビートなエレクトロニック音楽が流れ、高エナジーでプロフェッショナルな動画。"
operation = client.models.generate_videos(
model="veo-3.1-lite-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
aspect_ratio="9:16", # Shorts/Reels 向けのポートレート
resolution="720p", # または "1080p"
duration_seconds=8
),
)
# 完了までポーリング(非同期オペレーション)
while not operation.done:
time.sleep(10)
operation = client.operations.get(operation)
# 動画をダウンロード
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("pizza_making_1080p.mp4") # または 720p
print("動画を保存しました!")
Image-to-Video のバリアント(プロンプト差し替え + 画像パラメータ追加)も同様のパターン。完全なドキュメントにはエラーハンドリングやバッチ例が含まれる。
3. ベストプラクティス
- 具体的に記述する:カメラアングル、照明、音声キューは引用で明示
- ネガティブプロンプトを使う:「ぼやけた背景、テキストオーバーレイは避ける」など
- 反復は 720p で開始し、最終アセットで 1080p に上げる
Google Veo 3.1 Lite vs Sora: 引退後になぜ Google が優位か
このリリースは市場の興味深い局面で登場した。OpenAI は Sora の Web とアプリ体験を 2026 年 4 月 26 日に終了、Sora API を 2026 年 9 月 24 日に終了すると発表。さらに 2026 年 3 月 13 日に米国で Sora 1 を削除し、Sora 2 が同地でデフォルト体験になっているという。
これは「今日時点で Sora が終わった」という意味ではないが、競争環境が急速に変化していることは確かだ。Google は低コスト・高スループットの選択肢で動画モデルファミリーを拡大する一方、OpenAI は旧来の Sora 体験を整理し、ユーザーを Sora 2 に集約している。購買担当者、エージェンシー、開発者にとって論点は、「どのブランドのデモが一番派手か?」ではなく、「現時点でコスト、出力制御、デプロイ信頼性の最良の組み合わせを提供するのはどのプラットフォームか?」に移っている。CometAPI は現時点でコスト、出力制御、デプロイ信頼性の最良の組み合わせを提供している。Veo 3.1 シリーズ、Sora 2、Grok imagine Video などと統合し、公式価格から 20% オフで提供。開発者は CometAPI の統合を活用して、どの動画が最適かをテストできる。
OpenAI の Sora 終了は空白を生んだ。Sora 2 は強力なビジュアルを提供したが、ネイティブ音声がなく、コストが高く、利用可能性も限られていた。Veo 3.1 Lite は次の点で対抗する。
- ネイティブで同期された音声
- 低価格(比較対象ティア比でしばしば 50–70% 安い)
独立検証や開発者のフィードバックでは、特にブランドコンテンツや UGC において、Veo 3.1 ファミリーがシネマティックな一貫性、プロンプト遵守、商用準備度でリードしていることが示されている。
結論:手頃な AI 動画の未来はすでに来ている
Veo 3.1 Lite は単に安いだけではない。戦略的な「実現装置」だ。50% 超のコスト削減、1080p のマルチフォーマット出力、Fast ティア相当の速度でネイティブ音声を提供することで、Google はプロフェッショナルな AI 動画生成をすべてのクリエイターと企業に現実的な選択肢とした。プロトタイピング、ソーシャルコンテンツのスケール、次のバイラルキャンペーン構築のいずれにおいても、Veo 3.1 Lite は 2026 年の無類のバリューをもたらす。
始める準備はできた? CometAPI にアクセスして API キーを取得し、上記のコードを実行しよう。高価で閉ざされた動画 AI の時代は終わった—Google がすべての人に開いたのだ。
