Home/Models/Google/Veo 3.1
G

Veo 3.1

Per Permintaan:$0.40
Veo 3.1 adalah pembaruan dari Google yang bertahap namun signifikan untuk keluarga Veo teks-dan-gambar→video, menambahkan audio bawaan yang lebih kaya, keluaran video yang lebih panjang dan lebih dapat dikendalikan, serta pengeditan yang lebih presisi dan kontrol pada tingkat adegan.
Baru
Penggunaan komersial
Ikhtisar
Fitur
Harga
API
Versi

Fitur inti

Veo 3.1 berfokus pada fitur pembuatan konten yang praktis:

  • Pembuatan audio native (dialog, suara ambient, SFX) terintegrasi dalam keluaran. Veo 3.1 menghasilkan audio native (dialog + ambience + SFX) yang selaras dengan linimasa visual; model ini bertujuan menjaga sinkronisasi bibir dan keselarasan audio–visual untuk dialog dan isyarat adegan.
  • Keluaran lebih panjang (dukungan hingga ~60 detik / 1080p dibanding klip sangat pendek Veo 3, 8 detik), serta urutan multi-shot dengan multi-prompt untuk kesinambungan naratif.
  • Scene Extension dan mode First/Last Frame yang memperluas atau menginterpolasi cuplikan di antara keyframe.
  • Penyisipan objek dan (segera hadir) penghapusan objek serta primitif pengeditan di dalam Flow.

Setiap poin di atas dirancang untuk mengurangi pekerjaan VFX manual: audio dan kesinambungan adegan kini menjadi keluaran kelas utama, bukan lagi hal yang dipikirkan belakangan.

Rincian teknis (perilaku model & input)

Keluarga model & varian: Veo termasuk dalam keluarga Veo-3 milik Google; ID model pratinjau biasanya veo3.1-pro; veo3.1 (dokumen CometAPI). Model ini menerima prompt teks, referensi gambar (bingkai tunggal atau urutan), dan tata letak multi-prompt terstruktur untuk pembuatan multi-shot.

Resolusi & durasi: Dokumentasi pratinjau menjelaskan keluaran pada 720p/1080p dengan opsi durasi lebih panjang (hingga ~60 detik dalam pengaturan pratinjau tertentu) dan fidelitas lebih tinggi dibanding varian Veo sebelumnya.

Rasio aspek: 16:9 (didukung) dan 9:16 (didukung kecuali pada beberapa alur referensi gambar).

Bahasa prompt: Bahasa Inggris (pratinjau).

Batas API: batas pratinjau tipikal mencakup maks 10 permintaan API/menit per proyek, maks 4 video per permintaan, dan durasi video dapat dipilih di antara 4, 6, atau 8 detik (alur referensi gambar mendukung 8 detik).

Performa benchmark

Evaluasi internal Google dan ringkasan publik melaporkan preferensi kuat terhadap keluaran Veo 3.1 dalam perbandingan penilai manusia pada metrik seperti kesesuaian teks, kualitas visual, dan koherensi audio–visual (tugas teks→video dan gambar→video).

Veo 3.1 mencapai hasil state-of-the-art pada perbandingan penilai manusia internal di berbagai sumbu objektif — preferensi keseluruhan, keselarasan prompt (teks→video dan gambar→video), kualitas visual, keselarasan audio–video, serta “fisika yang tampak realistis” pada dataset benchmark seperti MovieGenBench dan VBench.

Keterbatasan & pertimbangan keamanan

Keterbatasan:

  • Artefak & inkonsistensi: meskipun ada peningkatan, pencahayaan tertentu, fisika yang sangat terperinci, dan oklusi kompleks masih dapat menghasilkan artefak; konsistensi gambar→video (terutama pada durasi panjang) meningkat tetapi belum sempurna.
  • Risiko misinformasi/deepfake: audio yang lebih kaya + penyisipan/penghapusan objek meningkatkan risiko penyalahgunaan (audio palsu realistis dan klip yang diperpanjang). Google mencatat mitigasi (kebijakan, perlindungan) dan peluncuran Veo sebelumnya merujuk watermarking/SynthID untuk membantu ketertelusuran; namun perlindungan teknis tidak menghilangkan risiko penyalahgunaan.
  • Kendala biaya & throughput: video beresolusi tinggi dan berdurasi panjang mahal secara komputasi dan saat ini dibatasi dalam pratinjau berbayar—antisipasi latensi dan biaya yang lebih tinggi dibanding model gambar. Postingan komunitas dan thread forum Google membahas jendela ketersediaan dan strategi fallback.

Kontrol keamanan: Veo3.1 memiliki kebijakan konten terintegrasi, pensinyalan watermarking/SynthID pada rilis Veo sebelumnya, dan kontrol akses pratinjau; pelanggan disarankan mengikuti kebijakan platform dan menerapkan tinjauan manusia untuk keluaran berisiko tinggi.

Kasus penggunaan praktis

  • Prototipe cepat untuk kreator: storyboard → klip multi-shot dan animatik dengan dialog native untuk tinjauan kreatif awal.
  • Marketing & konten format pendek: iklan produk 15–60 detik, klip sosial, dan teaser konsep di mana kecepatan lebih penting daripada fotorealisme sempurna.
  • Adaptasi gambar→video: mengubah ilustrasi, karakter, atau dua bingkai menjadi transisi halus atau adegan animasi melalui First/Last Frame dan Scene Extension.
  • Augmentasi alat: terintegrasi ke dalam Flow untuk pengeditan iteratif (penyisipan/penghapusan objek, preset pencahayaan) yang mengurangi proses VFX manual.

Perbandingan dengan model terkemuka lainnya

Veo 3.1 vs Veo 3 (pendahulu): Veo 3.1 berfokus pada kepatuhan prompt yang lebih baik, kualitas audio, dan konsistensi multi-shot — pembaruan bertahap namun berdampak, bertujuan mengurangi artefak dan meningkatkan kemampuan pengeditan.

Veo 3.1 vs OpenAI Sora 2: kompromi yang dilaporkan di media: Veo 3.1 menekankan kontrol narasi bentuk panjang, audio terintegrasi, dan integrasi pengeditan Flow; Sora 2 (ketika dibandingkan di media) berfokus pada kekuatan berbeda (kecepatan, pipeline pengeditan yang berbeda). TechRadar dan publikasi lain menggambarkan Veo 3.1 sebagai pesaing terarah Google untuk Sora 2 dalam dukungan narasi dan video yang lebih panjang. Pengujian berdampingan independen masih terbatas.

Fitur untuk Veo 3.1

Jelajahi fitur-fitur utama dari Veo 3.1, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Veo 3.1

Jelajahi harga kompetitif untuk Veo 3.1, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Veo 3.1 dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Kode contoh dan API untuk Veo 3.1

Akses kode sampel komprehensif dan sumber daya API untuk Veo 3.1 guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Veo 3.1 dalam proyek Anda.
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Versi Veo 3.1

Alasan Veo 3.1 memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
ID modeldeskripsiKetersediaanHargaPermintaan
veo3.1-allTeknologi yang digunakan tidak resmi dan generasinya tidak stabil, dll✅$0.2 / perChat format
veo3.1Direkomendasikan, mengarah ke model terbaru✅$0.4/ perAsync Generation

Model Lainnya