ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Syarikat
Tentang kamiPerusahaan
Sumber
Model AIBlogLog PerubahanSokongan
Terma PerkhidmatanDasar Privasi
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

Setiap Saat:$0.05
Veo 3.1 ialah kemas kini bertahap namun signifikan daripada Google kepada keluarga Veo teks dan imej→video miliknya, yang menambah audio natif yang lebih kaya, output video yang lebih panjang dan lebih terkawal, serta suntingan yang lebih halus dan kawalan pada tahap adegan.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Ciri teras

Veo 3.1 memberi tumpuan pada ciri penciptaan kandungan yang praktikal:

  • Penjanaan audio asli (dialog, bunyi ambien, SFX) disepadukan dalam output. Veo 3.1 menjana audio asli (dialog + suasana + SFX) yang disejajarkan dengan garis masa visual; model bertujuan mengekalkan segerak bibir dan penjajaran audio–visual untuk dialog dan petunjuk adegan.
  • Output lebih panjang (sokongan sehingga ~60 saat / 1080p berbanding klip Veo 3 yang sangat pendek,8s), serta urutan berbilang syot berbilang gesaan untuk kesinambungan naratif.
  • Mod Scene Extension dan First/Last Frame yang memanjangkan atau menginterpolasi rakaman antara bingkai utama.
  • Penyisipan objek dan (akan datang) penyingkiran objek serta primitif penyuntingan di dalam Flow.

Setiap butiran di atas direka untuk mengurangkan kerja VFX manual: audio dan kesinambungan adegan kini merupakan output bertaraf utama, bukan lagi perkara susulan.

Perincian teknikal (kelakuan model & input)

Keluarga model & varian: Veo tergolong dalam keluarga Veo-3 Google; ID model pratonton biasanya veo3.1-pro; veo3.1 (CometAPI doc). Ia menerima gesaan teks, rujukan imej (bingkai tunggal atau urutan), dan susun atur berstruktur berbilang gesaan untuk penjanaan berbilang syot.

Resolusi & durasi: Dokumentasi pratonton menerangkan output pada 720p/1080p dengan pilihan durasi lebih panjang (sehingga ~60s dalam tetapan pratonton tertentu) dan ketelitian lebih tinggi berbanding varian Veo terdahulu.

Nisbah bidang: 16:9 (disokong) dan 9:16 (disokong kecuali dalam beberapa aliran rujukan imej).

Bahasa gesaan: Bahasa Inggeris (pratonton).

Had API: had pratonton tipikal termasuk maks 10 permintaan API/min setiap projek, maks 4 video bagi setiap permintaan, dan panjang video boleh dipilih antara 4, 6, atau 8 saat (aliran rujukan imej menyokong 8s).

Prestasi penanda aras

Penilaian dalaman Google dan ringkasan awam melaporkan keutamaan yang kuat untuk output Veo 3.1 merentas perbandingan penilai manusia pada metrik seperti penjajaran teks, kualiti visual, dan kekoherenan audio–visual (tugas teks→video dan imej→video).

Veo 3.1 mencapai hasil bertaraf terkini dalam perbandingan penilai manusia dalaman merentas beberapa dimensi objektif — keutamaan keseluruhan, penjajaran gesaan (teks→video dan imej→video), kualiti visual, penjajaran audio‑video, dan “fizik yang kelihatan realistik” pada set data penanda aras seperti MovieGenBench dan VBench.

Had & pertimbangan keselamatan

Had:

  • Artifak & ketidakselarasan: walaupun terdapat penambahbaikan, pencahayaan tertentu, fizik terperinci, dan oklusi kompleks masih boleh menghasilkan artifak; ketekalan imej→video (terutamanya bagi tempoh panjang) bertambah baik tetapi belum sempurna.
  • Risiko maklumat palsu / deepfake: audio yang lebih kaya + penyisipan/penyingkiran objek meningkatkan risiko salah guna (audio palsu realistik dan klip dipanjangkan). Google menyatakan mitigasi (dasar, perlindungan) dan pelancaran Veo terdahulu merujuk kepada watermarking/SynthID untuk membantu asal-usul; namun perlindungan teknikal tidak menghapuskan risiko salah guna.
  • Kekangan kos & kadar pemprosesan: video resolusi tinggi, panjang adalah mahal secara pengiraan dan kini dihadkan dalam pratonton berbayar — jangkakan kependaman dan kos lebih tinggi berbanding model imej. Hantaran komuniti dan benang forum Google membincangkan tetingkap ketersediaan dan strategi sandaran.

Kawalan keselamatan: Veo3.1 mempunyai dasar kandungan bersepadu, pensinyalan watermarking/SynthID dalam keluaran Veo terdahulu, dan kawalan akses pratonton; pelanggan dinasihatkan untuk mengikuti dasar platform dan melaksanakan semakan manusia bagi output berisiko tinggi.

Kes penggunaan praktikal

  • Pembangunan pantas untuk kreatif: papan cerita → klip berbilang syot dan animatik dengan dialog asli untuk semakan kreatif awal.
  • Pemasaran & kandungan bentuk pendek: iklan produk 15–60s, klip sosial, dan penggoda konsep di mana kelajuan lebih penting daripada fotorealisme sempurna.
  • Penyesuaian imej→video: mengubah ilustrasi, watak, atau dua bingkai kepada peralihan lancar atau adegan beranimasi melalui First/Last Frame dan Scene Extension.
  • Penambahan peralatan: disepadukan ke dalam Flow untuk penyuntingan berulang (penyisipan/penyingkiran objek, pratetap pencahayaan) yang mengurangkan lelaran VFX manual.

Perbandingan dengan model terkemuka lain

Veo 3.1 vs Veo 3 (pendahulu): Veo 3.1 memberi tumpuan pada pematuhan gesaan yang dipertingkat, kualiti audio, dan ketekalan berbilang syot — kemas kini beransur tetapi berimpak yang bertujuan mengurangkan artifak dan meningkatkan kebolehsuntingan.

Veo 3.1 vs OpenAI Sora 2: kompromi yang dilaporkan dalam media: Veo 3.1 menekankan kawalan naratif bentuk panjang, audio bersepadu, dan integrasi penyuntingan Flow; Sora 2 (apabila dibandingkan dalam media) memberi tumpuan kepada kekuatan berbeza (kelajuan, aliran kerja penyuntingan yang berbeza). TechRadar dan saluran lain menggambarkan Veo 3.1 sebagai pesaing disasarkan Google untuk naratif dan sokongan video lebih panjang. Ujian perbandingan berdampingan bebas masih terhad.

Ciri-ciri untuk Veo 3.1

Terokai ciri-ciri utama Veo 3.1, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Veo 3.1

Terokai harga yang kompetitif untuk Veo 3.1, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Veo 3.1 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Kod contoh dan API untuk Veo 3.1

Akses kod sampel yang komprehensif dan sumber API untuk Veo 3.1 bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh Veo 3.1 dalam projek anda.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Versi Veo 3.1

Sebab Veo 3.1 mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
ID modelPeneranganKetersediaanHargaPermintaan
veo3.1-allTeknologi yang digunakan tidak rasmi dan penjanaan tidak stabil dan sebagainya✅$0.2 / setiapSembang format
veo3.1Disyorkan, menunjuk ke model terbaharu✅$0.4/ setiapPenjanaan Asinkron

Lebih Banyak Model

D

Doubao-Seedance-2-0

Setiap Saat:$0.07
Seedance 2.0 ialah model asas multimodal untuk video generasi seterusnya daripada ByteDance yang memfokuskan pada penjanaan video naratif sinematik berbilang syot. Tidak seperti demonstrasi teks-ke-video syot tunggal, Seedance 2.0 menekankan kawalan berasaskan rujukan (imej, klip pendek, audio), ketekalan watak/gaya yang padu merentas syot, dan penselarasan audio/video natif — dengan matlamat menjadikan video AI berguna untuk aliran kerja kreatif profesional dan pra-visualisasi.
O

Sora 2

Setiap Saat:$0.08
Model penjanaan video yang sangat berkuasa, dengan kesan bunyi, menyokong format sembang.
M

mj_fast_video

Setiap Permintaan:$0.6
Penjanaan video Midjourney
X

Grok Imagine Video

Setiap Saat:$0.04
Hasilkan video daripada gesaan teks, animasikan imej pegun, atau sunting video sedia ada menggunakan bahasa semula jadi. API menyokong tempoh, nisbah aspek dan resolusi yang boleh dikonfigurasi untuk video yang dijana — dengan SDK mengendalikan polling asinkron secara automatik.
G

Veo 3.1 Pro

Setiap Saat:$0.25
Veo 3.1-Pro merujuk kepada akses/konfigurasi berkeupayaan tinggi bagi keluarga Veo 3.1 daripada Google — satu generasi model video bentuk pendek dengan sokongan audio yang menambah audio natif yang lebih kaya, kawalan penceritaan/penyuntingan yang dipertingkat dan alat peluasan adegan.
G

Veo 3 Pro

G

Veo 3 Pro

Setiap Saat:$0.25
Veo 3 pro menandakan pengalaman model video Veo 3 bertaraf produksi (fideliti tinggi, audio natif, dan set alatan yang diperluas)

Blog Berkaitan

Kling 3.0 vs Veo 3.1: Pertembungan Muktamad Penjana Video AI 2026
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs Veo 3.1: Pertembungan Muktamad Penjana Video AI 2026

Kling 3.0 kini mendahului dengan penceritaan berbilang syot 4K natif dan kawalan kamera yang unggul. Veo 3.1 cemerlang dalam fizik fotorealistik, penyegerakan audio natif, dan integrasi ekosistem Google, menjadikannya ideal untuk projek sinematik atau perusahaan. Bagi kebanyakan pengguna, pemenang bergantung pada keutamaan: Kling 3.0 untuk kelajuan, konsistensi, dan kos; Veo 3.1 untuk realisme premium dan audio.
Apakah Google Veo 3.1 Lite?
Apr 1, 2026
veo-3-1

Apakah Google Veo 3.1 Lite?

Apakah Veo 3.1 Lite? Veo 3.1 Lite ialah model penjanaan video terbaharu Google yang menjimatkan kos untuk pembangun, dilancarkan pada 31 Mac 2026. Ia menyokong teks-ke-video dan imej-ke-video, menghasilkan video berserta audio, dan direka untuk aplikasi volum tinggi. Google mengatakan harganya kurang daripada separuh harga Veo 3.1 Fast sambil mengekalkan kelajuan yang sama, dengan format output 16:9 dan 9:16 serta sokongan resolusi 720p/1080p.
Cara Mendapatkan Grok Imagine Secara Percuma: Akses, Harga, dan Alternatif
Mar 25, 2026
grok-imagine-video

Cara Mendapatkan Grok Imagine Secara Percuma: Akses, Harga, dan Alternatif

Sehingga Mac 2026, Grok Imagine Video tidak lagi percuma di platform rasmi xAI/Grok (pelan percuma telah dihentikan kerana permintaan yang tinggi dan kebimbangan terhadap penyalahgunaan), tetapi anda boleh mengaksesnya dengan harga berpatutan — atau dengan kredit permulaan percuma — melalui agregator pihak ketiga seperti CometAPI. CometAPI menawarkan model tersebut pada hanya $0.04 sesaat (480p), dengan pengguna baharu sering menerima kredit percuma bernilai $1–$5 semasa pendaftaran.
Bagaimana untuk mengedit video melalui veo 3.1
Mar 5, 2026
veo-3-1

Bagaimana untuk mengedit video melalui veo 3.1

Google secara terbuka memperkenalkan Veo 3.1 (dan varian Veo 3.1 Fast) pada pertengahan Oktober 2025 sebagai model teks-ke-video yang dipertingkatkan yang menghasilkan pendek ketepatan yang lebih tinggi
Apakah vidu Q3? Ia mungkin model video AI terbaik pada tahun 2026.
Jan 31, 2026
vidu-q3

Apakah vidu Q3? Ia mungkin model video AI terbaik pada tahun 2026.

Pada awal 2026, Vidu Q3 muncul sebagai antara petunjuk paling jelas setakat ini bahawa penjanaan video dipacu AI sedang beralih daripada klip pendek yang bersifat gimik kepada penceritaan berbilang babak yang benar-benar naratif. Dalam beberapa bulan sejak pelancarannya secara meluas, Vidu Q3 telah menjadi komponen asas dalam aliran kerja pencipta, projek perintis penyelidikan, dan projek perintis komersial — dan dengan alasan yang kukuh: ia menolak had tempoh, integrasi audiovisual, dan kekohesan berbilang babak lebih jauh daripada kebanyakan model terdahulu sambil menawarkan API berorientasikan pembangun untuk penggunaan secara programatik.