Veo 3.1 adalah pembaruan Google yang bertahap namun signifikan terhadap keluarga teks-dan-gambar→video Veo, menambahkan lebih kaya audio asli, keluaran video yang lebih panjang dan lebih terkendali, dan lebih halus mengedit dan tingkat adegan kontrol.
Informasi dasar — fitur inti
Veo 3.1 berfokus pada praktik pembuatan konten fitur:
- Generasi audio asli (dialog, suara ambient, SFX) terintegrasi dalam output. Veo 3.1 menghasilkan audio asli (dialog + suasana + SFX) yang selaras dengan alur waktu visual; model ini bertujuan untuk menjaga sinkronisasi bibir dan keselarasan audio–visual untuk dialog dan isyarat adegan.
- Output yang lebih panjang (dukungan hingga ~60 detik / 1080p versus klip Veo 3 yang sangat pendek, 8 detik), dan multi-prompt multi-tembakan urutan untuk kesinambungan naratif.
- Ekstensi Adegan dan Frame Pertama/Terakhir mode yang memperluas atau menyisipkan rekaman antara bingkai utama.
- Penyisipan objek dan penghapusan objek (yang akan datang) dan mengedit primitif di dalam Flow.
Setiap poin di atas dirancang untuk mengurangi pekerjaan VFX manual: audio dan kontinuitas adegan sekarang merupakan keluaran kelas satu dan bukan sekadar renungan.
Detail teknis (perilaku model & masukan)
Keluarga model & varian: Veo termasuk dalam keluarga Veo-3 Google; ID model pratinjau biasanya veo3.1-pro; veo3.1 (dokumen CometAPI). Menerima petunjuk teks, referensi gambar (bingkai tunggal atau rangkaian), dan tata letak multi-prompt terstruktur untuk pembuatan multi-bidikan.
Resolusi & durasi: Dokumentasi pratinjau menjelaskan keluaran di 720p / 1080p dengan opsi durasi yang lebih lama (hingga ~60 detik dalam pengaturan pratinjau tertentu) dan fidelitas yang lebih tinggi daripada varian Veo sebelumnya.
Rasio aspek: 16:9 (didukung) dan 9:16 (didukung kecuali dalam beberapa aliran gambar referensi).
Bahasa perintah: Bahasa Inggris (pratinjau).
Batasan API: batas pratinjau tipikal meliputi maks 10 permintaan API/menit per proyek, maks 4 video per permintaan, dan durasi video dapat dipilih di antara 4, 6, atau 8 detik (alur gambar referensi mendukung 8 detik).
Kinerja tolok ukur
Laporan evaluasi internal dan ringkasan publik Google preferensi yang kuat untuk keluaran Veo 3.1 di seluruh perbandingan penilai manusia pada metrik seperti perataan teks, kualitas visual, dan koherensi audio-visual (tugas teks→video dan gambar→video).
Veo 3.1 tercapai state-of-the-art hasil perbandingan internal antara manusia dan penilai di beberapa sumbu objektif — preferensi keseluruhan, penyelarasan perintah (teks→video dan gambar→video), kualitas visual, penyelarasan audio-video, dan “fisika realistis secara visual” pada kumpulan data tolok ukur seperti MovieGenBench dan VBench.
Keterbatasan & pertimbangan keselamatan
Keterbatasan:
- Artefak & ketidakkonsistenan: meskipun ada perbaikan, pencahayaan tertentu, fisika berbutir halus, dan oklusi kompleks masih dapat menghasilkan artefak; konsistensi gambar→video (terutama dalam durasi panjang) ditingkatkan tetapi tidak sempurna.
- Risiko misinformasi/deepfake: Audio yang lebih kaya + penyisipan/penghapusan objek meningkatkan risiko penyalahgunaan (audio palsu yang realistis dan klip yang diperpanjang). Google mencatat mitigasi (kebijakan, perlindungan) dan peluncuran Veo sebelumnya merujuk pada tanda air/SynthID untuk membantu identifikasi asal; namun, perlindungan teknis tidak menghilangkan risiko penyalahgunaan.
- Batasan biaya & throughput: Video beresolusi tinggi dan berdurasi panjang membutuhkan komputasi yang tinggi dan saat ini terblokir dalam pratinjau berbayar—perkirakan latensi dan biaya yang lebih tinggi dibandingkan dengan model gambar. Postingan komunitas dan utas forum Google membahas jendela ketersediaan dan strategi cadangan.
Kontrol keselamatan: Veo3.1 telah mengintegrasikan kebijakan konten, pemberian tanda air/sinyal synthID dalam rilis Veo sebelumnya, dan kontrol akses pratinjau; pelanggan disarankan untuk mengikuti kebijakan platform dan menerapkan tinjauan manusia untuk keluaran berisiko tinggi.
Kasus penggunaan praktis
- Pembuatan prototipe cepat untuk para kreatif: storyboard → klip multi-shot dan animatik dengan dialog asli untuk tinjauan kreatif awal.
- Pemasaran & konten bentuk pendek: Iklan produk berdurasi 15–60an, klip sosial, dan teaser konsep yang mengutamakan kecepatan daripada realisme foto yang sempurna.
- Adaptasi gambar→video: mengubah ilustrasi, karakter, atau dua bingkai menjadi transisi halus atau adegan animasi melalui Frame Pertama/Terakhir dan Ekstensi Adegan.
- Penambahan perkakas: diintegrasikan ke dalam Flow untuk pengeditan berulang (penyisipan/penghapusan objek, prasetel pencahayaan) yang mengurangi proses VFX manual.
Perbandingan dengan model terkemuka lainnya
Veo 3.1 vs Veo 3 (pendahulu): Veo 3.1 berfokus pada peningkatan kepatuhan yang cepat, kualitas audio, dan konsistensi multi-tembakan — pembaruan bertahap namun berdampak yang ditujukan untuk mengurangi artefak dan meningkatkan kemampuan mengedit.
Veo 3.1 vs OpenAI Sora 2: tradeoff yang dilaporkan di media: Veo 3.1 menekankan kontrol naratif bentuk panjang, terintegrasi audio, dan integrasi pengeditan Flow; Sora 2 (saat dibandingkan saat peluncuran) berfokus pada keunggulan yang berbeda (kecepatan, alur pengeditan yang berbeda). TechRadar dan media lain menyebut Veo 3.1 sebagai pesaing tertarget Google untuk Sora 2 dalam hal narasi dan dukungan video yang lebih panjang. Pengujian independen secara berdampingan masih terbatas.
Bagaimana cara menelepon Versi 3.1 API dari CometAPI
Versi model: veo3.1; veo3.1-pro
Veo 3.1 Harga API di CometAPI, diskon 20% dari harga resmi:
| veo3.1 | 0.4000 |
| veo3.1-pro | 2.0000 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih "
veo3.1; veo3.1-pro” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda. - Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail kunci:
- URL dasar: https://api.cometapi.com/v1/chat/completions
- Nama Model: veo3.1; veo3.1-pro
- Otentikasi:
Bearer YOUR_CometAPI_API_KEYHeader - Jenis konten:
application/json.
Lihat juga Sora 2


