模型定價企業
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
公司
關於我們企業
資源
AI模型部落格更新日誌支援
服務條款隱私政策
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

每秒:$0.05
Veo 3.1 是 Google 對其 Veo 文本與圖像→影片系列的一次漸進但意義重大的更新,新增更豐富的原生音訊、更長且更可控的影片輸出,以及更精細的編輯與場景層級控制。
新
商業用途
Playground
概覽
功能
定價
API
版本

核心功能

Veo 3.1 著重於實用的 內容創作 功能:

  • 原生音訊生成(對話、環境音、SFX)整合於輸出。Veo 3.1 生成 原生音訊(對話 + 環境音 + SFX),與視覺時間軸對齊;模型旨在維持口型同步以及對話與場景提示的影音對齊。
  • 更長的輸出(支援長達 ~60 秒 / 1080p,相較於 Veo 3 的極短片段,8s),以及多重提示的 多鏡頭 序列以維持敘事連貫性。
  • Scene Extension 與 First/Last Frame 模式,可在關鍵影格之間延展或插值畫面。
  • 物件插入 與(即將推出的)物件移除,以及在 Flow 中的編輯基本操作。

以上每點皆旨在減少手動 VFX 工作:音訊與場景連貫性現已成為一級輸出,而非事後補充。

技術細節(模型行為與輸入)

**模型家族與變體:**Veo 屬於 Google 的 Veo-3 家族;預覽模型 ID 通常為 veo3.1-pro;veo3.1(CometAPI 文件)。它接受 文字提示、影像參考(單一影格或序列),以及用於多鏡頭生成的結構化多重提示版面。

**解析度與時長:**預覽文件描述輸出為 720p/1080p,並提供更長時長的選項(在某些預覽設定中可達 ~60s),且相較於較早的 Veo 變體具有更高保真度。

縱橫比: 16:9(支援)與 9:16(支援,但在某些參考影像流程中除外)。

**提示語言:**English(預覽)。

**API 限制:**典型預覽限制包括 每專案每分鐘最多 10 次 API 請求、每次請求最多 4 支影片,以及 影片長度 可選 4、6 或 8 秒(參考影像流程支援 8s)。

基準表現

Google 的內部與公開摘要評估皆顯示,在人員評分比較中,Veo 3.1 的輸出在 文字對齊、視覺品質 以及 影音一致性 等指標上獲得強烈偏好(text→video 與 image→video 任務)。

Veo 3.1 在多個客觀面向的人員評分比較中取得 最先進 的結果——整體偏好、提示對齊(text→video 與 image→video)、視覺品質、影音對齊,以及在 MovieGenBench 與 VBench 等基準資料集上的「視覺上逼真的物理效果」。

侷限與安全考量

侷限:

  • **偽影與不一致:**儘管有所改進,某些光照、細粒度物理與複雜遮擋仍可能產生偽影;image→video 的一致性(尤其在較長時長)已有提升,但尚不完美。
  • **錯誤資訊/深偽風險:**更豐富的音訊與物件插入/移除提高了濫用風險(逼真的假音訊與延長片段)。Google 提到緩解措施(政策、保障),且較早的 Veo 發佈曾提及加水印/SynthID 以輔助溯源;然而技術性保障並不能消除濫用風險。
  • **成本與吞吐限制:**高解析度、長影片的計算成本高,當前在付費預覽中受管制——與影像模型相比,預期延遲與成本更高。社群貼文與 Google 論壇主題討論可用時段與回退策略。

**安全控制:**Veo 3.1 內建內容政策、較早 Veo 版本中的加水印/SynthID 訊號,以及預覽存取控制;建議客戶遵循平台政策,並對高風險輸出進行人工審查。

實務用例

  • **為創作者快速原型:**分鏡腳本 → 多鏡頭短片與樣片,並含 原生對話,用於早期創意審閱。
  • **行銷與短影音內容:**15–60 秒的產品短片、社群貼文與概念前導,適用於速度比完美擬真更重要的場景。
  • **影像→影片改編:**透過 First/Last Frame 與 Scene Extension,將插畫、角色或兩個影格轉為平滑過場或動畫場景。
  • **工具增強:**整合於 Flow 以進行迭代編輯(物件插入/移除、燈光預設),減少手動 VFX 次數。

與其他領先模型的比較

**Veo 3.1 vs Veo 3(前代):**Veo 3.1 著重於 改善提示遵循度、音訊品質 與 多鏡頭一致性——屬於漸進但具影響力的更新,旨在減少偽影並提升可編輯性。

**Veo 3.1 vs OpenAI Sora 2:**媒體報導中的權衡:Veo 3.1 強調 較長篇幅的敘事掌控、整合 音訊,以及與 Flow 的編輯整合;Sora 2(在媒體比較時)則聚焦於不同的強項(速度、不同的編輯管線)。TechRadar 與其他媒體將 Veo 3.1 定位為 Google 面向敘事與長影片支援的針對性競品。獨立的並排測試仍然有限。

Veo 3.1 的功能

探索 Veo 3.1 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Veo 3.1 的定價

探索 Veo 3.1 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Veo 3.1 如何在保持成本可控的同時提升您的專案效果。

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Veo 3.1 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Veo 3.1 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Veo 3.1 的潛力。
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Veo 3.1的版本

Veo 3.1擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
模型 ID描述可用性價格請求
veo3.1-all所使用的技術為非官方,生成不穩定等✅$0.2 / 每聊天 格式
veo3.1推薦,指向最新模型✅$0.4/ 每異步生成

更多模型

D

Doubao-Seedance-2-0

每秒:$0.07
Seedance 2.0 是 ByteDance 的新一代多模態影片基礎模型,聚焦於電影級、多鏡頭敘事的影片生成。有別於單鏡頭的文本轉影片示範,Seedance 2.0 著重於基於參考的控制(圖像、短片、音訊)、跨鏡頭的角色與風格一致性,以及原生的聲畫同步——旨在使 AI 影片可用於專業創作與預視化工作流程。
O

Sora 2

每秒:$0.08
超強大的影片生成模型,具備音效,支援對話格式。
M

mj_fast_video

每次請求:$0.6
Midjourney 影片生成
X

Grok Imagine Video

每秒:$0.04
可根據文字提示生成影片,將靜態圖片動態化,或以自然語言編輯現有影片。API 支援為生成的影片自訂時長、寬高比與解析度 — SDK 會自動處理非同步輪詢。
G

Veo 3.1 Pro

每秒:$0.25
Veo 3.1-Pro 指的是 Google 的 Veo 3.1 系列的高階存取/設定 — 這是一代支援音訊的短影片模型,並加入更豐富的原生音訊、改進的敘事/剪輯控制與場景延伸工具。
G

Veo 3 Pro

G

Veo 3 Pro

每秒:$0.25
Veo 3 pro 表示生產級的 Veo 3 影片模型體驗 (高保真、原生音訊,以及擴充的工具集)

相關部落格

Kling 3.0 vs Veo 3.1:2026 年終極 AI 影片生成器對決
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs Veo 3.1:2026 年終極 AI 影片生成器對決

Kling 3.0 目前以原生 4K 多鏡頭敘事與卓越的攝影機控制領先。Veo 3.1 在照片級寫實的物理效果、原生音訊同步與 Google 生態系整合方面表現出色,使其非常適合電影級或企業級專案。對大多數使用者而言,誰勝出取決於優先考量:Kling 3.0 重在速度、一致性與成本;Veo 3.1 則著重頂級寫實感與音訊。
Google Veo 3.1 Lite 是什麼?
Apr 1, 2026
veo-3-1

Google Veo 3.1 Lite 是什麼?

Veo 3.1 Lite 是什麼?Veo 3.1 Lite 是 Google 最新、具成本效益、面向開發者的影片生成模型,於 2026 年 3 月 31 日發佈。它支援文字轉影片與圖片轉影片,可輸出帶音訊的影片,並為大規模應用而設計。Google 稱,其費用不到 Veo 3.1 Fast 的一半,且保持相同速度,並支援 16:9 與 9:16 的輸出格式,以及 720p/1080p 解析度。
如何免費取得 Grok Imagine:存取、定價與替代方案
Mar 25, 2026
grok-imagine-video

如何免費取得 Grok Imagine:存取、定價與替代方案

截至 2026 年 3 月,Grok Imagine Video 在官方 xAI/Grok 平台上並非免費(由於高需求與濫用疑慮,免費方案已被移除),但你仍可透過像 CometAPI 這類第三方聚合平台,以可負擔的價格存取它——或者使用免費的新手額度。CometAPI 以每秒僅 $0.04(480p)的價格提供該模型,新使用者在註冊時通常可獲得 $1–$5 的免費額度。
如何使用 Veo 3.1 編輯視頻
Mar 5, 2026
veo-3-1

如何使用 Veo 3.1 編輯視頻

Google於 2025 年 10 月中旬正式發布了 Veo 3.1(及其快速版本 Veo 3.1),這是一種改進的文本轉視頻模型,能夠產生更高保真度的短視頻。
什麼是 vidu Q3?它可能是 2026 年最好的 AI 影片模型。
Jan 31, 2026
vidu-q3

什麼是 vidu Q3?它可能是 2026 年最好的 AI 影片模型。

Vidu Q3 在 2026 年初登場,成為迄今最明確的信號之一,表明 AI 驅動的影片生成正從新奇噱頭式的短片走向真正具敘事性的多鏡頭故事化創作。自其大規模推出以來的數月裡,Vidu Q3 已成為創作者工作流程、研究試點與商業試點中的常備工具——理由也很充分:它在時長、視聽整合與多鏡頭連貫性方面都比多數早期模型更進一步,並提供面向開發者的 API 以支持程式化使用。