Cara Menggunakan Veo 3.1 API

Veo 3.1 adalah iterasi terbaru dari keluarga model pembuatan video Veo Google. Versi ini menghadirkan audio asli yang lebih kaya, kontrol naratif dan sinematik yang lebih baik, panduan multi-gambar, dan primitif pengeditan baru (transisi frame pertama/terakhir, "bahan"/gambar referensi, dan alur kerja ekstensi adegan). Bagi para pengembang, cara tercepat untuk mengakses Veo 3.1 adalah melalui API (untuk integrasi yang dihadapi konsumen) dan Vertex AI (untuk beban kerja perusahaan dan cloud).

Apa itu Veo 3.1 API dan apa saja fitur utamanya?

Veo 3.1 adalah model generatif teks-dan-gambar → video dari Google yang dirancang untuk menghasilkan klip sinematik pendek berkualitas tinggi dengan audio asli (dialog, isyarat ambient, efek suara). Rilis ini berfokus pada peningkatan kepatuhan prompt, konsistensi karakter, pembuatan audio, dan kontrol pengeditan yang lebih terperinci (misalnya: transisi frame pertama→terakhir dan panduan melalui hingga tiga gambar referensi).

Kemampuan utama (sekilas)

Teks → Video: Hasilkan video langsung dari petunjuk naratif (dialog & audio disertakan).
Gambar → Video: Ubah gambar menjadi adegan animasi pendek. ()
Gambar referensi (“Bahan-bahan untuk video”): Pasokan hingga 3 gambar (karakter, objek, gaya) untuk menjaga konsistensi visual di seluruh keluaran.
Pembuatan Frame Pertama & Terakhir: Buat transisi yang menjembatani dua gambar (model menghasilkan bingkai yang berubah dengan mulus di antara keduanya, dengan audio yang cocok).
Alur kerja perluasan adegan:Alat untuk memperluas klip yang sudah ada dengan membuat klip baru yang terhubung dengan bagian akhir video sebelumnya (catatan: kemampuan dan dukungan berbeda antara Gemini API dan pratinjau Vertex—lihat bagian “kondisi”).
Audio asli & SFX:Model dapat mensintesis ucapan, suara sekitar, dan efek tersinkronisasi yang sesuai dengan visual yang dihasilkan.

Bagaimana cara menggunakan API Veo 3.1 — apa saja prasyarat dan ketentuannya?

Apa yang Anda perlukan sebelum memanggil API?

Akses & penagihanVeo 3.1 dalam pratinjau berbayar—pastikan Anda memiliki kunci API atau proyek Google Cloud dengan Vertex AI yang diaktifkan dan penagihan telah disiapkan. Beberapa fitur dan varian model terbatas wilayah dalam pratinjau.
Kuota & batasan pratinjauModel pratinjau sering kali memiliki batas kecepatan permintaan per proyek (contoh: 10 RPM untuk varian pratinjau) dan batas video per permintaan. Periksa halaman model di dokumen Vertex AI/Gemini untuk mengetahui angka pasti untuk akun Anda.
Aset & format masukanAnda dapat membuat video dari perintah teks, dari satu atau beberapa gambar, atau memperluas video yang sudah ada yang dihasilkan Veo dengan merujuk URI-nya. Untuk alur kerja konversi gambar ke video, berikan gambar dalam format yang didukung (URL atau byte, tergantung titik akhir).
Keamanan & asal usulKonten yang dihasilkan harus mematuhi kebijakan konten Google. Tanda air atau tanda penggunaan mungkin muncul di pratinjau; bersiaplah untuk menangani langkah-langkah moderasi konten dan asal-usul di aplikasi Anda.

Metode autentikasi apa saja yang didukung?

Kunci APIUntuk titik akhir yang dihosting Gemini atau kunci platform API pihak ketiga. Saya merekomendasikan CometAPI, API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda mengintegrasikan Veo 3.1 API (veo3.1-pro; veo3.1)
Kredensial Google Cloud / ADC: Untuk Vertex AI, gunakan Kredensial Default Aplikasi (akun layanan / autentikasi gcloud) atau kunci API yang dilampirkan ke proyek Google Cloud Anda.

Apa saja titik akhir API Veo 3.1 dan parameter mana yang paling penting?

Jawaban singkat: Anda akan menelepon API CometAPI titik akhir pembuatan video (untuk akses yang dihosting CometAPI, v1/chat/completions). Keduanya menggunakan badan permintaan JSON yang menjelaskan model, prompt, dan video/output konfigurasi; pekerjaan video yang lebih besar dikembalikan sebagai operasi yang berjalan lama.

Titik akhir umum (contoh):

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"model": "veo3.1-pro",  
"stream": true,  
"messages":   
}'

Parameter permintaan umum (rincian logis)

model — pengenal model untuk target (veo3.1-pro; nama veo3.1 yang tercantum di referensi model).
perintah / masukan — teks manusia yang mendeskripsikan adegan; dapat mencakup beberapa perintah atau instruksi multi-shot, tergantung kemampuan model. Gunakan perintah terstruktur untuk mengontrol gerakan kamera, waktu, suasana hati, dan isyarat audio.
referensi_gambar — 1–3 URI gambar atau gambar base64 untuk memandu objek/karakter/gaya (Veo 3.1 mendukung beberapa referensi gambar).
video — digunakan saat memperpanjang keluaran Veo sebelumnya (lulus URI video awal). Beberapa fitur hanya beroperasi pada video yang dihasilkan Veo.
durasi / fps / resolusi / rasio aspek — pilih dari panjang dan format yang didukung (model pratinjau mencantumkan durasi dan framerate yang didukung—misalnya, 4, 6, 8 detik dalam beberapa dokumen pratinjau; ekstensi mungkin memungkinkan keluaran yang lebih panjang di Flow/Studio).

Apa saja pola dan teknik penggunaan tingkat lanjut?

1) Pertahankan konsistensi karakter dengan gambar referensi

Sediakan hingga tiga gambar referensi (wajah/pose/kostum) untuk mempertahankan tampilan karakter di beberapa gambar yang dihasilkan. Alur tipikal:

Unggah atau enkode sebaris gambar referensi Anda.
Serahkan pada mereka config.reference_images saat membuat setiap bidikan.
Gunakan gambar yang sama untuk panggilan generasi berikutnya (atau gabungkan dengan nilai benih) untuk memaksimalkan konsistensi visual.

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"messages": [
{
"role": "user",
"content": "Create a cinematic 6s shot: a fashion editorial on a city rooftop at golden hour. Keep the subject look consistent with the reference images."
}
],
"extra_body": {
"google": {
"referenceImages": [
{ "image": { "uri": "https://example.com/ref1.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref2.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref3.jpg" }, "referenceType": "asset" }
],
"config": {
"resolution": "1080p",
"durationSeconds": 6,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

2) Transisi bingkai pertama dan terakhir (sintesis bidikan)

penggunaan image (bingkai pertama) + config.last_frame untuk menginstruksikan Veo mensintesis gerakan perantara. Ini ideal untuk transisi sinematik — menghasilkan interpolasi visual alami dan audio yang tersinkronisasi.

Menyediakan bingkai pertama (image) Dan bingkai terakhir (lastFrame) dan Veo 3.1 akan menyisipkan gerakan di antara keduanya untuk menghasilkan transisi yang mulus (dengan audio opsional). Contoh cURL (REST) — gambar pertama + terakhir:

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Interpolate between these two images to create an 8s cinematic morph: from 'sunlit victorian parlor' (first) to 'overgrown ruin' (last). Add soft ambient sound."
}
],
"extra_body": {
"google": {
"image": { "uri": "https://example.com/first_frame.jpg" },
"lastFrame": { "uri": "https://example.com/last_frame.jpg" },
"config": {
"resolution": "1080p",
"durationSeconds": 8,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

3) Perluasan adegan (berantai beberapa generasi)

Ada dua pola:

Pendekatan API/Flow (fitur pratinjau): Anda meneruskan video yang ada (objek video atau URI yang dikembalikan) sebagai video=video_to_extend untuk membuat klip lanjutan yang konsisten dengan adegan sebelumnya. Gunakan respons operasi untuk menangkap video.uri dan masukkan ke panggilan berikutnya untuk memperluas narasi. Catatan: ketersediaan dan perilaku dapat bervariasi tergantung platform, jadi validasi di platform pilihan Anda.
Pola awan puncakModel pratinjau Vertex memiliki batasan dokumen yang lebih ketat (misalnya, pratinjau saat ini hanya menampilkan segmen 4/6/8 detik), jadi untuk menghasilkan keluaran berdurasi satu menit, Anda harus merangkai beberapa permintaan dan menggabungkannya dalam aplikasi Anda atau menggunakan alat ekstensi adegan resmi mesin jika tersedia. Periksa halaman "Pratinjau Veo 3.1" Vertex untuk matriks dukungan saat ini.

Ambil sebelumnya dihasilkan oleh Veo video dan memperpanjangnya ke depan (menambahkan detik) sambil mempertahankan gaya dan kontinuitas. API mengharuskan input berupa video yang dihasilkan Veo (ekstensi MP4 sembarangan mungkin tidak didukung). Anda dapat memperpanjangnya dengan lompatan 7 detik hingga batas yang didokumentasikan (batas pratinjau Veo berlaku):

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Extend the last scene: the origami butterfly flies into the garden and a puppy runs up to the flower; continue action for ~7 seconds."
}
],
"extra_body": {
"google": {
"video": { "uri": "https://storage.googleapis.com/your-bucket/butterfly_video_id.mp4" },
"config": {
"numberOfVideos": 1,
"resolution": "720p",
"durationSeconds": 7,
"fps": 24,
"generateAudio": true
}
}
}
}'

4) Kontrol audio & dialog

Veo 3.1 menghasilkan audio asli (ucapan dan efek) dari perintah. Trik:

Letakkan dialog apa pun dalam perintah Anda (bungkus dialog dalam tanda kutip) untuk mendorong sinkronisasi bibir yang realistis.
Tambahkan deskriptor audio (“langkah kaki lembut dari kiri ke kanan”, “suara guntur yang teredam”) untuk membentuk efek suara dan suasana hati.
Gunakan nilai benih untuk mereproduksi hasil audio/visual yang sama di seluruh uji coba.

5) Keluaran deterministik untuk pengujian (benih)

Jika Anda memerlukan keluaran yang dapat diulang untuk pengujian CI atau A/B, berikan seed parameter (uint32). Mengubah prompt atau gambar referensi akan tetap mengubah hasilnya; seed menjamin pengulangan. hanya ketika segala sesuatunya identik.

6) Optimalisasi biaya & kinerja

Kumpulkan pekerjaan yang lebih sedikit dan lebih besar: Jika diizinkan, atur sampleCount untuk menghasilkan beberapa video kandidat dalam satu permintaan (1–4) untuk mengurangi overhead pengaturan. ()
Cache gambar referensi dan gunakan kembali benih untuk reproduktifitas sehingga Anda terhindar dari pengunggahan ulang biner berukuran besar.
Gunakan keluaran Penyimpanan Cloud (Vertex) untuk ukuran keluaran besar guna menghindari pengembalian byte mentah dalam badan permintaan.

7) Pipa multi-langkah dengan model Gemini lainnya

Alur kerja yang berguna: gunakan generator gambar diam (misalnya, model gambar Gemini) untuk membuat aset → berikan gambar terbaik sebagai image + referenceImages ke Veo 3.1 → ulangi perintah audio/dialog dengan model teks untuk narasi yang dihasilkan. Dokumen Gemini secara eksplisit menunjukkan contoh penggabungan pembuatan gambar dan panggilan Veo.

Tips praktis, jebakan, dan praktik terbaik

Gunakan benih ketika Anda menginginkan keluaran yang deterministik dan berulang di antara proses (prompt yang sama + referensi yang sama + seed yang sama → pembangkitan yang sama).
Jaga konsistensi gambar referensi: Potongan yang sama, sudut wajah yang sama, dan pakaian/latar belakang yang konsisten membantu model mempertahankan identitas dan gayanya. Gunakan kembali tiga gambar yang sama di seluruh bidikan untuk menjaga kontinuitas.
Lebih suka URI GCS untuk produksi: menyimpan gambar dan keluaran dalam Cloud Storage menghindari batasan ukuran transfer base64 dan menyederhanakan perangkaian/ekstensi.
Jelaskan transisi & audio secara eksplisit: untuk transisi pertama/terakhir, tambahkan pergerakan kamera, tempo, dan isyarat SFX/suara dalam perintah agar audio tersinkronisasi lebih baik.
Uji loop pendek terlebih dahulu: ulangi dengan durasi pendek (4–8 detik) selagi Anda menyetel perintah, benih, dan gambar referensi, lalu ekstensi berantai untuk adegan yang lebih panjang.
Konfirmasikan nama bidang yang tepat:SDK dapat menggunakan reference_images (kasus_ular), referenceImages (camelCase), atau bersarang image objek dengan content / gcsUriPeriksa dokumen SDK atau skema model Vertex untuk mengetahui nama properti yang tepat pada versi yang Anda gunakan.

Berapa biaya Veo 3.1 dan bagaimana cara penagihannya?

Veo 3.1 ditagih per detik video yang dihasilkan, dan Google memaparkan beberapa varian (misalnya Standar dan Cepat) dengan tarif per detik yang berbeda. Harga pengembang yang dipublikasikan menunjukkan contoh tarif berbayar $0.40/detik untuk Veo 3.1 Standar dan $0.15/detik untuk Veo 3.1 CepatHalaman harga Gemini juga mencatat bahwa Anda hanya akan dikenakan biaya jika video berhasil dibuat (percobaan yang gagal mungkin tidak akan ditagih).

API Veo 3.1 Harga di CometAPI


veo3.1	0.4000
veo3.1-pro	2.0000

Kesimpulan — mengapa Veo 3.1 penting bagi pengembang saat ini

Veo 3.1 merupakan lompatan inkremental yang jelas untuk pembuatan video AI: audio asli yang lebih kaya, panduan gambar referensi, dan primitif pengeditan baru menjadikannya pilihan yang lebih baik untuk penceritaan, pravisualisasi, dan aplikasi kreatif. Kemampuan model yang tepat sedikit berbeda antara titik akhir dan versi pratinjau (misalnya, perbedaan versi antara CometAPI dan Gemini)—jadi, uji dan validasi varian model yang ingin Anda gunakan. Contoh-contoh dalam panduan ini memberikan titik awal yang praktis untuk pembuatan prototipe dan produksi.

Cara Mengakses API Veo 3.1 API

CometAPI adalah platform API terpadu yang menggabungkan lebih dari 500 model AI dari penyedia terkemuka—seperti seri GPT OpenAI, Gemini Google, Claude Anthropic, Midjourney, Suno, dan lainnya—menjadi satu antarmuka yang ramah bagi pengembang. Dengan menawarkan autentikasi yang konsisten, pemformatan permintaan, dan penanganan respons, CometAPI secara drastis menyederhanakan integrasi kapabilitas AI ke dalam aplikasi Anda. Baik Anda sedang membangun chatbot, generator gambar, komposer musik, atau alur kerja analitik berbasis data, CometAPI memungkinkan Anda melakukan iterasi lebih cepat, mengendalikan biaya, dan tetap tidak bergantung pada vendor—semuanya sambil memanfaatkan terobosan terbaru di seluruh ekosistem AI.

Pengembang dapat mengakses API Veo 3.1 melalui CometAPI, versi model terbaru selalu diperbarui dengan situs web resmi. Untuk memulai, jelajahi kemampuan model di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.

Siap untuk berangkat?→ Daftar ke CometAPI hari ini !

Jika Anda ingin mengetahui lebih banyak tips, panduan, dan berita tentang AI, ikuti kami di VK, X dan Discord!