Home/Models/Google/Veo 3.1
G

Veo 3.1

Setiap Permintaan:$0.40
Veo 3.1 ialah kemas kini bertahap namun signifikan daripada Google kepada keluarga Veo teks dan imej→video miliknya, yang menambah audio natif yang lebih kaya, output video yang lebih panjang dan lebih terkawal, serta suntingan yang lebih halus dan kawalan pada tahap adegan.
Baru
Penggunaan komersial
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Ciri teras

Veo 3.1 memberi tumpuan pada ciri penciptaan kandungan yang praktikal:

  • Penjanaan audio asli (dialog, bunyi ambien, SFX) disepadukan dalam output. Veo 3.1 menjana audio asli (dialog + suasana + SFX) yang disejajarkan dengan garis masa visual; model bertujuan mengekalkan segerak bibir dan penjajaran audio–visual untuk dialog dan petunjuk adegan.
  • Output lebih panjang (sokongan sehingga ~60 saat / 1080p berbanding klip Veo 3 yang sangat pendek,8s), serta urutan berbilang syot berbilang gesaan untuk kesinambungan naratif.
  • Mod Scene Extension dan First/Last Frame yang memanjangkan atau menginterpolasi rakaman antara bingkai utama.
  • Penyisipan objek dan (akan datang) penyingkiran objek serta primitif penyuntingan di dalam Flow.

Setiap butiran di atas direka untuk mengurangkan kerja VFX manual: audio dan kesinambungan adegan kini merupakan output bertaraf utama, bukan lagi perkara susulan.

Perincian teknikal (kelakuan model & input)

Keluarga model & varian: Veo tergolong dalam keluarga Veo-3 Google; ID model pratonton biasanya veo3.1-pro; veo3.1 (CometAPI doc). Ia menerima gesaan teks, rujukan imej (bingkai tunggal atau urutan), dan susun atur berstruktur berbilang gesaan untuk penjanaan berbilang syot.

Resolusi & durasi: Dokumentasi pratonton menerangkan output pada 720p/1080p dengan pilihan durasi lebih panjang (sehingga ~60s dalam tetapan pratonton tertentu) dan ketelitian lebih tinggi berbanding varian Veo terdahulu.

Nisbah bidang: 16:9 (disokong) dan 9:16 (disokong kecuali dalam beberapa aliran rujukan imej).

Bahasa gesaan: Bahasa Inggeris (pratonton).

Had API: had pratonton tipikal termasuk maks 10 permintaan API/min setiap projek, maks 4 video bagi setiap permintaan, dan panjang video boleh dipilih antara 4, 6, atau 8 saat (aliran rujukan imej menyokong 8s).

Prestasi penanda aras

Penilaian dalaman Google dan ringkasan awam melaporkan keutamaan yang kuat untuk output Veo 3.1 merentas perbandingan penilai manusia pada metrik seperti penjajaran teks, kualiti visual, dan kekoherenan audio–visual (tugas teks→video dan imej→video).

Veo 3.1 mencapai hasil bertaraf terkini dalam perbandingan penilai manusia dalaman merentas beberapa dimensi objektif — keutamaan keseluruhan, penjajaran gesaan (teks→video dan imej→video), kualiti visual, penjajaran audio‑video, dan “fizik yang kelihatan realistik” pada set data penanda aras seperti MovieGenBench dan VBench.

Had & pertimbangan keselamatan

Had:

  • Artifak & ketidakselarasan: walaupun terdapat penambahbaikan, pencahayaan tertentu, fizik terperinci, dan oklusi kompleks masih boleh menghasilkan artifak; ketekalan imej→video (terutamanya bagi tempoh panjang) bertambah baik tetapi belum sempurna.
  • Risiko maklumat palsu / deepfake: audio yang lebih kaya + penyisipan/penyingkiran objek meningkatkan risiko salah guna (audio palsu realistik dan klip dipanjangkan). Google menyatakan mitigasi (dasar, perlindungan) dan pelancaran Veo terdahulu merujuk kepada watermarking/SynthID untuk membantu asal-usul; namun perlindungan teknikal tidak menghapuskan risiko salah guna.
  • Kekangan kos & kadar pemprosesan: video resolusi tinggi, panjang adalah mahal secara pengiraan dan kini dihadkan dalam pratonton berbayar — jangkakan kependaman dan kos lebih tinggi berbanding model imej. Hantaran komuniti dan benang forum Google membincangkan tetingkap ketersediaan dan strategi sandaran.

Kawalan keselamatan: Veo3.1 mempunyai dasar kandungan bersepadu, pensinyalan watermarking/SynthID dalam keluaran Veo terdahulu, dan kawalan akses pratonton; pelanggan dinasihatkan untuk mengikuti dasar platform dan melaksanakan semakan manusia bagi output berisiko tinggi.

Kes penggunaan praktikal

  • Pembangunan pantas untuk kreatif: papan cerita → klip berbilang syot dan animatik dengan dialog asli untuk semakan kreatif awal.
  • Pemasaran & kandungan bentuk pendek: iklan produk 15–60s, klip sosial, dan penggoda konsep di mana kelajuan lebih penting daripada fotorealisme sempurna.
  • Penyesuaian imej→video: mengubah ilustrasi, watak, atau dua bingkai kepada peralihan lancar atau adegan beranimasi melalui First/Last Frame dan Scene Extension.
  • Penambahan peralatan: disepadukan ke dalam Flow untuk penyuntingan berulang (penyisipan/penyingkiran objek, pratetap pencahayaan) yang mengurangkan lelaran VFX manual.

Perbandingan dengan model terkemuka lain

Veo 3.1 vs Veo 3 (pendahulu): Veo 3.1 memberi tumpuan pada pematuhan gesaan yang dipertingkat, kualiti audio, dan ketekalan berbilang syot — kemas kini beransur tetapi berimpak yang bertujuan mengurangkan artifak dan meningkatkan kebolehsuntingan.

Veo 3.1 vs OpenAI Sora 2: kompromi yang dilaporkan dalam media: Veo 3.1 menekankan kawalan naratif bentuk panjang, audio bersepadu, dan integrasi penyuntingan Flow; Sora 2 (apabila dibandingkan dalam media) memberi tumpuan kepada kekuatan berbeza (kelajuan, aliran kerja penyuntingan yang berbeza). TechRadar dan saluran lain menggambarkan Veo 3.1 sebagai pesaing disasarkan Google untuk naratif dan sokongan video lebih panjang. Ujian perbandingan berdampingan bebas masih terhad.

Ciri-ciri untuk Veo 3.1

Terokai ciri-ciri utama Veo 3.1, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Veo 3.1

Terokai harga yang kompetitif untuk Veo 3.1, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Veo 3.1 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Kod contoh dan API untuk Veo 3.1

Akses kod sampel yang komprehensif dan sumber API untuk Veo 3.1 bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh Veo 3.1 dalam projek anda.
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Versi Veo 3.1

Sebab Veo 3.1 mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
ID modelPeneranganKetersediaanHargaPermintaan
veo3.1-allTeknologi yang digunakan tidak rasmi dan penjanaan tidak stabil dan sebagainya✅$0.2 / setiapSembang format
veo3.1Disyorkan, menunjuk ke model terbaharu✅$0.4/ setiapPenjanaan Asinkron

Lebih Banyak Model