Home/Models/Google/Veo 3.1
G

Veo 3.1

リクエストごと:$0.40
Veo 3.1 は、Google の Veo テキストおよび画像→動画ファミリーに対する段階的だが重要なアップデートで、より豊かなネイティブオーディオ、より長くより制御しやすい動画出力、そしてより細かな編集やシーンレベルのコントロールを追加します。
新着
商用利用
概要
機能
料金プラン
API
バージョン

コア機能

Veo 3.1 は、実践的なコンテンツ作成機能に重点を置いています:

  • ネイティブ音声生成(セリフ、環境音、SFX)を出力に統合。Veo 3.1 は、視覚のタイムラインに合わせたネイティブ音声(セリフ+アンビエンス+SFX)を生成し、セリフのリップシンクと音声–映像の整合性を維持することを目指します。
  • より長い出力(最大 ~60 seconds / 1080p に対応。Veo 3 の非常に短いクリップ,8s と比較)、および物語の連続性のためのマルチプロンプトによるマルチショットのシーケンス。
  • Scene Extension と First/Last Frame モードにより、キー・フレーム間の映像を拡張または補間。
  • Flow 内でのオブジェクト挿入と(近日対応)オブジェクト削除、編集の基本操作。

上記の各ポイントは、手作業の VFX を減らすために設計されています。音声とシーンの連続性が、付け足しではなく最初から主要な出力となります。

技術的詳細(モデルの挙動と入力)

モデルファミリーとバリアント: Veo は Google の Veo-3 ファミリーに属します。プレビュー版のモデル ID は一般に veo3.1-pro、veo3.1(CometAPI doc)。テキストプロンプト、画像リファレンス(単一フレームまたはシーケンス)、マルチショット生成のための構造化されたマルチプロンプトレイアウトを受け付けます。

解像度と尺: プレビューのドキュメントでは、出力は 720p/1080p、長尺(特定のプレビュー設定で最大 ~60s)と、以前の Veo バリアントより高い忠実度のオプションが記載されています。

アスペクト比: 16:9(対応)および 9:16(一部の参照画像フローを除き対応)。

プロンプト言語: English(プレビュー)。

API 制限: 一般的なプレビューの制限には、プロジェクトあたり max 10 API requests/min、リクエストあたり max 4 videos、および video lengths は 4, 6, or 8 seconds から選択(参照画像フローは 8s をサポート)が含まれます。

ベンチマーク性能

Google の社内評価と公開要約では、テキスト整合性、視覚品質、音声–映像の一貫性(text→video と image→video のタスク)といった指標で、人間評価者の比較において Veo 3.1 の出力が強く好まれると報告されています。

Veo 3.1 は、社内の人間評価者による比較で複数の客観軸において最先端の結果を達成しました—全体的な好ましさ、プロンプト整合性(text→video と image→video)、視覚品質、音声–映像のアライメント、そして MovieGenBench や VBench のようなベンチマークデータセットにおける “visually realistic physics”。

制約と安全面の考慮

制約:

  • アーティファクトと不整合: 改善にもかかわらず、特定の照明、微細な物理挙動、複雑なオクルージョンではアーティファクトが生じる場合があります。image→video の一貫性(特に長尺)は向上していますが、完璧ではありません。
  • 誤情報/ディープフェイクのリスク: より豊かな音声とオブジェクトの挿入/削除により、悪用のリスクが高まります(リアルな偽音声や延長されたクリップ)。Google は軽減策(ポリシー、セーフガード)に言及しており、先行する Veo のリリースでは来歴を支援するウォーターマーキング/SynthID が参照されました。ただし技術的な防護策だけでは悪用リスクを完全には排除できません。
  • コストとスループットの制約: 高解像度・長尺のビデオは計算コストが高く、現在は有償プレビューでゲートされています—画像モデルと比べて高いレイテンシとコストが予想されます。コミュニティ投稿や Google フォーラムのスレッドでは、利用可能な時間枠やフォールバック戦略が議論されています。

安全管理: Veo3.1 には統合されたコンテンツポリシー、先行する Veo リリースでのウォーターマーキング/SynthID シグナリング、プレビューアクセス管理が含まれます。プラットフォームのポリシーに従い、高リスクの出力には人的レビューを実施することが推奨されます。

実用的なユースケース

  • クリエイターのための迅速なプロトタイピング: ストーリーボード→ネイティブなセリフ付きのマルチショットクリップやアニマティクスで、初期のクリエイティブレビューを加速。
  • マーケティングと短尺コンテンツ: 15–60s のプロダクトスポット、ソーシャルクリップ、コンセプトティーザーなど、完璧なフォトリアリズムよりもスピードが重要な場面。
  • Image→video の適応: イラストやキャラクター、2 フレームを、First/Last Frame と Scene Extension によって滑らかなトランジションやアニメーションシーンへ。
  • ツールの強化: Flow に統合され、反復的な編集(オブジェクト挿入/削除、照明プリセット)を行うことで手作業の VFX 工程を削減。

他の主要モデルとの比較

Veo 3.1 vs Veo 3(前世代): Veo 3.1 は、プロンプト遵守の改善、音声品質、マルチショットの一貫性に注力—アーティファクトの低減と編集容易性の向上を狙った、漸進的だが影響の大きいアップデート。

Veo 3.1 vs OpenAI Sora 2: 報道で言及されるトレードオフとして、Veo 3.1 は長尺のナラティブ制御、統合音声、Flow の編集統合を重視。Sora 2 は異なる強み(速度、異なる編集パイプライン)にフォーカス。TechRadar などは、Veo 3.1 をナラティブと長尺ビデオ対応における Google のターゲット競合として位置付けています。独立した並列比較テストは依然として限定的です。

Veo 3.1の機能

Veo 3.1のパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Veo 3.1の料金

Veo 3.1の競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Veo 3.1がコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Veo 3.1のサンプルコードとAPI

Veo 3.1の包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでVeo 3.1の潜在能力を最大限に活用できるよう支援します。
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Veo 3.1のバージョン

Veo 3.1に複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
モデルID説明提供状況価格リクエスト
veo3.1-all使用技術は非公式で、生成は不安定など✅$0.2 / あたりチャット 形式
veo3.1推奨、最新モデルを指しています✅$0.4/ あたり非同期生成

その他のモデル