Mô hìnhGiáDoanh nghiệp
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Công ty
Về chúng tôiDoanh nghiệp
Tài nguyên
Mô hình AIBlogNhật ký thay đổiHỗ trợ
Điều khoản Dịch vụChính sách Bảo mật
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

Mỗi Giây:$0.05
Veo 3.1 là bản cập nhật tiệm tiến nhưng đáng kể của Google cho dòng Veo chuyển đổi văn bản và hình ảnh→video, bổ sung âm thanh gốc phong phú hơn, đầu ra video dài hơn và dễ kiểm soát hơn, cùng khả năng chỉnh sửa tinh vi và điều khiển ở cấp độ cảnh.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Tính năng cốt lõi

Veo 3.1 tập trung vào các tính năng tạo nội dung thực tiễn:

  • Tạo âm thanh nguyên bản (đối thoại, âm thanh môi trường, SFX) được tích hợp trong đầu ra. Veo 3.1 tạo âm thanh nguyên bản (đối thoại + âm thanh nền + SFX) căn chỉnh với timeline hình ảnh; mô hình hướng tới việc giữ đồng bộ khẩu hình và căn chỉnh âm thanh–hình ảnh cho lời thoại và tín hiệu cảnh.
  • Đầu ra dài hơn (hỗ trợ tới ~60 giây / 1080p so với clip rất ngắn 8s của Veo 3), và chuỗi đa cảnh với đa lời nhắc cho tính liên tục tường thuật.
  • Các chế độ Scene Extension và First/Last Frame giúp mở rộng hoặc nội suy footage giữa các key frame.
  • Chèn đối tượng và (sắp có) xóa đối tượng, cùng các thao tác chỉnh sửa cơ bản bên trong Flow.

Mỗi ý trên được thiết kế để giảm công việc VFX thủ công: âm thanh và tính liên tục cảnh giờ là đầu ra hạng nhất thay vì yếu tố phụ sau cùng.

Chi tiết kỹ thuật (hành vi mô hình & đầu vào)

Họ mô hình & biến thể: Veo thuộc họ Veo-3 của Google; model ID bản xem trước thường là veo3.1-pro; veo3.1 (tài liệu CometAPI). Mô hình chấp nhận lời nhắc văn bản, tham chiếu hình ảnh (khung đơn hoặc chuỗi), và bố cục đa lời nhắc có cấu trúc cho tạo đa cảnh.

Độ phân giải & thời lượng: Tài liệu bản xem trước mô tả đầu ra ở 720p/1080p với tùy chọn thời lượng dài hơn (tối đa ~60s trong một số thiết lập preview) và độ trung thực cao hơn so với các biến thể Veo trước đó.

Tỷ lệ khung hình: 16:9 (được hỗ trợ) và 9:16 (được hỗ trợ, trừ trong một số luồng tham chiếu hình ảnh).

Ngôn ngữ lời nhắc: Tiếng Anh (bản xem trước).

Giới hạn API: các giới hạn bản xem trước điển hình gồm tối đa 10 yêu cầu API/phút mỗi dự án, tối đa 4 video mỗi yêu cầu, và độ dài video có thể chọn là 4, 6 hoặc 8 giây (luồng tham chiếu hình ảnh hỗ trợ 8s).

Hiệu năng benchmark

Các đánh giá nội bộ và tổng hợp công khai của Google báo cáo sự ưu tiên mạnh dành cho đầu ra của Veo 3.1 qua so sánh bởi người đánh giá trên các tiêu chí như căn chỉnh văn bản, chất lượng hình ảnh, và độ hòa hợp âm thanh–hình ảnh (nhiệm vụ text→video và image→video).

Veo 3.1 đạt kết quả tiên tiến nhất trong so sánh nội bộ do người đánh giá, trên nhiều trục khách quan — mức độ được ưa thích tổng thể, căn chỉnh lời nhắc (text→video và image→video), chất lượng hình ảnh, căn chỉnh âm thanh–video, và “vật lý trông như thật” trên các bộ dữ liệu benchmark như MovieGenBench và VBench.

Giới hạn & cân nhắc an toàn

Giới hạn:

  • Tạo tác & không nhất quán: dù đã cải tiến, một số điều kiện ánh sáng, vật lý chi tiết và che khuất phức tạp vẫn có thể tạo ra tạo tác; tính nhất quán image→video (đặc biệt với thời lượng dài) đã được cải thiện nhưng chưa hoàn hảo.
  • Nguy cơ thông tin sai lệch / deepfake: âm thanh phong phú + chèn/xóa đối tượng làm tăng rủi ro lạm dụng (âm thanh giả thực và clip mở rộng). Google nêu các biện pháp giảm thiểu (chính sách, bảo vệ) và các lần ra mắt Veo trước đó đề cập watermarking/SynthID để hỗ trợ truy xuất nguồn gốc; tuy nhiên các biện pháp kỹ thuật không loại bỏ hoàn toàn rủi ro lạm dụng.
  • Hạn chế chi phí & thông lượng: video độ phân giải cao, thời lượng dài tốn tài nguyên tính toán và hiện được giới hạn trong bản xem trước trả phí — kỳ vọng độ trễ và chi phí cao hơn so với các mô hình ảnh. Cộng đồng và các chủ đề trên diễn đàn Google bàn về các khung thời gian khả dụng và chiến lược dự phòng.

Biện pháp an toàn: Veo3.1 tích hợp các chính sách nội dung, tín hiệu watermarking/SynthID trong các phiên bản Veo trước, và kiểm soát quyền truy cập bản xem trước; khuyến nghị khách hàng tuân theo chính sách nền tảng và triển khai kiểm duyệt thủ công cho các đầu ra rủi ro cao.

Trường hợp sử dụng thực tiễn

  • Dựng mẫu nhanh cho người sáng tạo: bảng phân cảnh → clip đa cảnh và animatic với lời thoại nguyên bản cho vòng duyệt sáng tạo sớm.
  • Marketing & nội dung dạng ngắn: spot sản phẩm 15–60s, clip mạng xã hội, và teaser ý tưởng nơi tốc độ quan trọng hơn tính chân thực hoàn hảo.
  • Chuyển thể image→video: biến minh họa, nhân vật, hoặc hai khung thành chuyển cảnh mượt mà hoặc cảnh động qua First/Last Frame và Scene Extension.
  • Tăng cường công cụ: tích hợp vào Flow để chỉnh sửa lặp (chèn/xóa đối tượng, preset ánh sáng) giúp giảm các lần VFX thủ công.

So sánh với các mô hình hàng đầu khác

Veo 3.1 so với Veo 3 (tiền nhiệm): Veo 3.1 tập trung vào cải thiện độ tuân thủ lời nhắc, chất lượng âm thanh, và tính nhất quán đa cảnh — các cập nhật tăng dần nhưng có tác động, nhằm giảm tạo tác và cải thiện khả năng chỉnh sửa.

Veo 3.1 so với OpenAI Sora 2: các báo chí ghi nhận những đánh đổi: Veo 3.1 nhấn mạnh kiểm soát tường thuật dạng dài, âm thanh tích hợp, và tích hợp chỉnh sửa trong Flow; Sora 2 (trong các so sánh trên báo chí) tập trung vào các thế mạnh khác (tốc độ, pipeline chỉnh sửa khác). TechRadar và các kênh khác xem Veo 3.1 là đối thủ có chủ đích của Google với Sora 2 về tường thuật và hỗ trợ video dài. Việc thử nghiệm song song độc lập vẫn còn hạn chế.

Tính năng cho Veo 3.1

Khám phá các tính năng chính của Veo 3.1, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Veo 3.1

Khám phá mức giá cạnh tranh cho Veo 3.1, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Veo 3.1 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Mã mẫu và API cho Veo 3.1

Truy cập mã mẫu toàn diện và tài nguyên API cho Veo 3.1 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của Veo 3.1 trong các dự án của mình.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Các phiên bản của Veo 3.1

Lý do Veo 3.1 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
ID mô hìnhmô tảKhả dụngGiáYêu cầu
veo3.1-allCông nghệ sử dụng là không chính thức và quá trình tạo không ổn định, v.v.✅$0.2 / mỗiTrò chuyện định dạng
veo3.1Khuyến nghị, trỏ tới mô hình mới nhất✅$0.4/ mỗiTạo bất đồng bộ

Thêm mô hình

D

Doubao-Seedance-2-0

Mỗi Giây:$0.07
Seedance 2.0 là mô hình nền tảng video đa phương thức thế hệ mới của ByteDance, tập trung vào khả năng tạo video kể chuyện đa cảnh mang phong cách điện ảnh. Khác với các bản demo chuyển văn bản thành video chỉ một cảnh, Seedance 2.0 nhấn mạnh điều khiển dựa trên tham chiếu (hình ảnh, clip ngắn, âm thanh), đảm bảo tính nhất quán mạch lạc về nhân vật và phong cách xuyên suốt các cảnh quay, cùng khả năng đồng bộ âm thanh–hình ảnh ở mức gốc — nhằm khiến video AI trở nên hữu ích cho các quy trình sáng tạo chuyên nghiệp và tiền trực quan hóa.
O

Sora 2

Mỗi Giây:$0.08
Mô hình tạo video siêu mạnh mẽ, kèm hiệu ứng âm thanh, hỗ trợ định dạng chat.
M

mj_fast_video

Theo Yêu cầu:$0.6
Tạo video bằng Midjourney
X

Grok Imagine Video

Mỗi Giây:$0.04
Tạo video từ prompt văn bản, làm động ảnh tĩnh hoặc chỉnh sửa video hiện có bằng ngôn ngữ tự nhiên. API hỗ trợ cấu hình thời lượng, tỷ lệ khung hình và độ phân giải cho các video được tạo — với SDK tự động xử lý việc thăm dò bất đồng bộ.
G

Veo 3.1 Pro

Mỗi Giây:$0.25
Veo 3.1-Pro đề cập đến quyền truy cập/cấu hình có khả năng cao của dòng Veo 3.1 của Google — một thế hệ mô hình video dạng ngắn, có hỗ trợ âm thanh, bổ sung âm thanh gốc phong phú hơn, các điều khiển tường thuật/chỉnh sửa được cải thiện và các công cụ mở rộng cảnh.
G

Veo 3 Pro

G

Veo 3 Pro

Mỗi Giây:$0.25
Veo 3 pro đại diện cho trải nghiệm mô hình video Veo 3 đạt chuẩn sản xuất (độ trung thực cao, âm thanh tích hợp sẵn và bộ công cụ mở rộng)

Blog liên quan

Kling 3.0 vs Veo 3.1: Cuộc đối đầu đỉnh cao giữa các trình tạo video AI năm 2026
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs Veo 3.1: Cuộc đối đầu đỉnh cao giữa các trình tạo video AI năm 2026

Kling 3.0 hiện đang dẫn đầu với khả năng kể chuyện đa cảnh quay 4K gốc và điều khiển máy quay vượt trội. Veo 3.1 vượt trội về mô phỏng vật lý chân thực như ảnh, đồng bộ âm thanh gốc và tích hợp hệ sinh thái Google, khiến nó lý tưởng cho các dự án điện ảnh hoặc doanh nghiệp. Với đa số người dùng, lựa chọn phụ thuộc vào ưu tiên: Kling 3.0 cho tốc độ, tính nhất quán và chi phí; Veo 3.1 cho độ chân thực cao cấp và âm thanh.
Google Veo 3.1 Lite là gì?
Apr 1, 2026
veo-3-1

Google Veo 3.1 Lite là gì?

Veo 3.1 Lite là gì? Veo 3.1 Lite là mô hình tạo video tiết kiệm chi phí mới nhất của Google dành cho nhà phát triển, ra mắt vào ngày 31 tháng 3 năm 2026. Mô hình này hỗ trợ tạo video từ văn bản và từ hình ảnh, xuất ra video kèm âm thanh, và được thiết kế cho các ứng dụng khối lượng lớn. Google cho biết sản phẩm có giá chưa đến một nửa so với Veo 3.1 Fast trong khi vẫn giữ nguyên tốc độ, với các định dạng đầu ra 16:9 và 9:16 cùng hỗ trợ độ phân giải 720p/1080p.
Cách sử dụng Grok Imagine miễn phí: Truy cập, giá và các lựa chọn thay thế
Mar 25, 2026
grok-imagine-video

Cách sử dụng Grok Imagine miễn phí: Truy cập, giá và các lựa chọn thay thế

Grok Imagine Video không miễn phí trên các nền tảng xAI/Grok chính thức tính đến tháng 3 năm 2026 (gói miễn phí đã bị gỡ bỏ do nhu cầu cao và lo ngại về lạm dụng), nhưng bạn có thể truy cập với chi phí phải chăng — hoặc bằng tín dụng khởi đầu miễn phí — thông qua các nền tảng tổng hợp bên thứ ba như CometAPI. CometAPI cung cấp mô hình này chỉ với $0.04 mỗi giây (480p), và người dùng mới thường nhận được $1–$5 tín dụng miễn phí khi đăng ký.
Cách chỉnh sửa video bằng veo 3.1
Mar 5, 2026
veo-3-1

Cách chỉnh sửa video bằng veo 3.1

Google đã công khai giới thiệu Veo 3.1 (và phiên bản Veo 3.1 Fast) vào giữa tháng 10 năm 2025 như một mô hình chuyển văn bản thành video được cải tiến, tạo ra các đoạn phim ngắn có độ trung thực cao hơn
vidu Q3 là gì? Có lẽ đó là mô hình AI tạo video tốt nhất vào năm 2026.
Jan 31, 2026
vidu-q3

vidu Q3 là gì? Có lẽ đó là mô hình AI tạo video tốt nhất vào năm 2026.

Vidu Q3 xuất hiện vào đầu năm 2026 như một trong những tín hiệu rõ ràng nhất rằng việc tạo video dựa trên AI đang chuyển dịch từ các clip ngắn mang tính mới lạ sang kể chuyện có tính tường thuật thực sự với nhiều cảnh quay. Trong vài tháng kể từ khi phát hành rộng rãi, Vidu Q3 đã trở thành một phần không thể thiếu trong quy trình công việc của người sáng tạo, các thử nghiệm thí điểm nghiên cứu và thí điểm thương mại — và vì lý do chính đáng: nó mở rộng thời lượng, khả năng tích hợp nghe nhìn và độ nhất quán giữa các cảnh quay vượt xa hầu hết các mô hình trước đó, đồng thời cung cấp API dành cho nhà phát triển để sử dụng theo lập trình.