Cara Menggunakan API Veo 3.1

CometAPI
AnnaDec 10, 2025
Cara Menggunakan API Veo 3.1

Veo 3.1 ialah lelaran terkini bagi keluarga model penjanaan video Veo Google. Ia membawakan audio asli yang lebih kaya, kawalan naratif dan sinematik yang lebih baik, panduan berbilang imej dan primitif pengeditan baharu (peralihan bingkai pertama/terakhir, imej "ramuan" / rujukan dan aliran kerja sambungan adegan). Bagi pembangun, cara terpantas untuk mengakses Veo 3.1 ialah API (untuk penyepaduan yang dihadapi pengguna) dan Vertex AI (untuk beban kerja perusahaan dan awan).

Apakah API Veo 3.1 dan apakah ciri utamanya?

Veo 3.1 ialah teks-dan-imej → model penjanaan video daripada Google yang direka untuk menghasilkan klip sinematik pendek, berkualiti tinggi dengan audio yang dijana secara asli (dialog, isyarat ambien, kesan bunyi). Keluaran memfokuskan pada meningkatkan pematuhan segera, ketekalan aksara, penjanaan audio dan kawalan pengeditan yang lebih berbutir (contohnya: pertama→ peralihan bingkai terakhir dan panduan melalui sehingga tiga imej rujukan).

Keupayaan utama (sepintas lalu)

  • Teks → Video: Hasilkan video terus daripada gesaan naratif (termasuk dialog & audio).
  • Imej → Video: Mengubah imej menjadi adegan animasi pendek. ()
  • Imej rujukan ("Ramuan kepada video"): Bekalan sehingga 3 imej (watak, objek, gaya) untuk mengekalkan konsistensi visual merentas output.
  • Penjanaan Bingkai Pertama & Terakhir: Buat peralihan yang merapatkan dua imej (model menjana bingkai yang berubah dengan lancar di antara mereka, dengan audio yang sepadan).
  • Aliran kerja sambungan adegan: Alat untuk memanjangkan klip sedia ada dengan menjana klip baharu yang diikat pada ekor video terdahulu (nota: keupayaan dan sokongan berbeza antara API Gemini dan pratonton Vertex—lihat bahagian "syarat").
  • Audio asli & SFX: Model boleh mensintesis pertuturan, bunyi ambien dan kesan disegerakkan yang sepadan dengan visual yang dijana.

Bagaimanakah cara saya menggunakan API Veo 3.1 — apakah prasyarat dan syaratnya?

Apa yang anda perlukan sebelum memanggil API?

  1. Akses & pengebilan: Veo 3.1 berada dalam pratonton berbayar—pastikan anda mempunyai kunci API atau projek Google Cloud dengan Vertex AI didayakan dan pengebilan disediakan. Sesetengah ciri dan varian model adalah terhad wilayah dalam pratonton.
  2. Kuota & pratonton kekangan: Model pratonton selalunya mempunyai had kadar permintaan setiap projek (contoh: 10 RPM untuk varian pratonton) dan had pada video setiap permintaan. Semak halaman model dalam dokumen Vertex AI / Gemini untuk mendapatkan nombor tepat untuk akaun anda.
  3. Input aset & format: Anda boleh menjana daripada gesaan teks, daripada imej tunggal atau berbilang, atau melanjutkan video yang dijana Veo sedia ada dengan merujuk URInya. Untuk aliran kerja imej-ke-video, bekalkan imej dalam format yang disokong (URL atau bait bergantung pada titik akhir).
  4. Keselamatan & asal usul: Kandungan yang dihasilkan mesti mematuhi dasar kandungan Google. Dalam pratonton, tera air atau bendera penggunaan mungkin muncul; bersedia untuk mengendalikan asal dan langkah penyederhanaan kandungan dalam permohonan anda.

Kaedah pengesahan yang manakah disokong?

  • Kunci API: Untuk titik akhir yang dihoskan Gemini atau kunci platform API pihak ketiga. Saya mengesyorkan CometAPI,  CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan Veo 3.1 API(veo3.1-pro; veo3.1)
  • Bukti kelayakan Google Cloud / ADC: Untuk Vertex AI, gunakan Bukti Kelayakan Lalai Aplikasi (akaun perkhidmatan / gcloud auth) atau kunci API yang dilampirkan pada projek Google Cloud anda.

Apakah titik akhir API Veo 3.1 dan parameter manakah yang paling penting?

Jawapan ringkas: Anda sama ada akan menghubungi API CometAPI titik akhir penjanaan video (untuk akses yang dihoskan CometAPI, v1/chat/completions). Kedua-duanya menggunakan badan permintaan JSON yang menerangkan model, gesaan dan a video/output konfigurasi; kerja video yang lebih besar dikembalikan sebagai operasi yang berjalan lama.

Titik akhir biasa (contoh):

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"model": "veo3.1-pro",  
"stream": true,  
"messages":   
}'

Parameter permintaan biasa (pecahan logik)

  • model — pengecam model untuk disasarkan (veo3.1-pro; nama veo3.1 disenaraikan dalam rujukan model).
  • gesaan / input — teks manusia yang menerangkan tempat kejadian; boleh memasukkan berbilang gesaan atau arahan berbilang tangkapan bergantung pada keupayaan model. Gunakan gesaan berstruktur untuk mengawal pergerakan kamera, masa dalam hari, mood dan isyarat audio.
  • rujukan_imej — 1–3 URI imej atau imej base64untuk membimbing objek/watak/gaya (Veo 3.1 menyokong rujukan imej berbilang).
  • video - digunakan apabila memanjangkan output Veo sebelumnya (lulus URI video awal). Sesetengah ciri hanya beroperasi pada video yang dihasilkan oleh Veo.
  • tempoh / fps / resolusi / Nisbah aspek — pilih daripada panjang dan format yang disokong (model pratonton menyenaraikan tempoh dan kadar bingkai yang disokong—cth, 4, 6, 8s dalam beberapa dokumen pratonton; sambungan mungkin membenarkan output yang lebih panjang dalam Flow/Studio).

Apakah corak dan teknik penggunaan lanjutan?

1) Mengekalkan konsistensi watak dengan imej rujukan

Bekalkan sehingga tiga imej rujukan (wajah/pose/kostum) untuk mengekalkan rupa watak merentas berbilang syot yang dihasilkan. Aliran biasa:

  1. Muat naik atau sebaris mengekod imej rujukan anda.
  2. Masukkan mereka config.reference_images apabila menghasilkan setiap pukulan.
  3. Gunakan imej yang sama untuk panggilan generasi berikutnya (atau gabungkan dengan nilai benih) untuk memaksimumkan konsistensi visual.
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"messages": [
{
"role": "user",
"content": "Create a cinematic 6s shot: a fashion editorial on a city rooftop at golden hour. Keep the subject look consistent with the reference images."
}
],
"extra_body": {
"google": {
"referenceImages": [
{ "image": { "uri": "https://example.com/ref1.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref2.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref3.jpg" }, "referenceType": "asset" }
],
"config": {
"resolution": "1080p",
"durationSeconds": 6,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

2) Peralihan bingkai pertama dan terakhir (sintesis tangkapan)

Penggunaan image (bingkai pertama) + config.last_frame untuk mengarahkan Veo untuk mensintesis gerakan perantaraan. Ini sesuai untuk peralihan sinematik — ia menghasilkan interpolasi visual semula jadi dan audio yang disegerakkan.

Sediakan a bingkai pertama (image) Dan bingkai terakhir (lastFrame) dan Veo 3.1 akan menginterpolasi gerakan antara mereka untuk menghasilkan peralihan yang lancar (dengan audio pilihan). contoh cURL (REST) ​​— imej pertama + terakhir:

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Interpolate between these two images to create an 8s cinematic morph: from 'sunlit victorian parlor' (first) to 'overgrown ruin' (last). Add soft ambient sound."
}
],
"extra_body": {
"google": {
"image": { "uri": "https://example.com/first_frame.jpg" },
"lastFrame": { "uri": "https://example.com/last_frame.jpg" },
"config": {
"resolution": "1080p",
"durationSeconds": 8,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

3) Sambungan adegan (rantai berbilang generasi)

Terdapat dua corak:

  • Pendekatan API/Aliran (ciri pratonton): Anda menghantar video sedia ada (objek video yang dikembalikan atau URI) sebagai video=video_to_extend untuk mencipta klip susulan yang konsisten dengan adegan sebelumnya. Gunakan tindak balas operasi untuk menangkap video.uri dan masukkannya ke dalam panggilan seterusnya untuk memanjangkan naratif. Nota: ketersediaan dan tingkah laku boleh berbeza mengikut platform, jadi sahkan pada platform yang anda pilih.
  • Corak awan puncak: Model pratonton Vertex mempunyai had tersenarai dokumen yang lebih ketat (cth, pratonton semasa hanya mengembalikan segmen 4/6/8 saat), jadi untuk menghasilkan output sepanjang minit anda mesti merantai berbilang permintaan dan mencantumkannya dalam aplikasi anda atau menggunakan alat lanjutan adegan rasmi enjin jika tersedia. Semak halaman "Pratonton Veo 3.1" Vertex untuk matriks sokongan semasa.

Ambil sebelum ini dijana Veo video dan panjangkannya ke hadapan (tambah saat) sambil mengekalkan gaya dan kesinambungan. API memerlukan input untuk menjadi video yang dijana Veo (sambungan MP4 sewenang-wenangnya mungkin tidak disokong). Anda boleh melanjutkan dengan lompatan 7s sehingga had yang didokumenkan (Had pratonton Veo dikenakan):

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Extend the last scene: the origami butterfly flies into the garden and a puppy runs up to the flower; continue action for ~7 seconds."
}
],
"extra_body": {
"google": {
"video": { "uri": "https://storage.googleapis.com/your-bucket/butterfly_video_id.mp4" },
"config": {
"numberOfVideos": 1,
"resolution": "720p",
"durationSeconds": 7,
"fps": 24,
"generateAudio": true
}
}
}
}'

4) Kawalan audio & dialog

Veo 3.1 menjana audio asli (pertuturan dan kesan) daripada gesaan. Helah:

  • Letakkan sebarang baris pertuturan dalam gesaan anda (balut dialog dalam petikan) untuk menggalakkan penyegerakan bibir yang realistik.
  • Tambahkan deskriptor audio ("tapak kaki lembut dari kiri ke kanan", "krescendo guruh teredam") untuk membentuk SFX dan mood.
  • Gunakan nilai benih untuk menghasilkan semula hasil audio/visual yang sama merentas larian ujian.

5) Output deterministik untuk ujian (benih)

Jika anda memerlukan output berulang untuk ujian CI atau A/B, bekalkan a seed parameter (uint32). Menukar imej gesaan atau rujukan masih akan mengubah keputusan; benih menjamin kebolehulangan hanyalah apabila semua yang lain adalah sama.

6) Pengoptimuman kos & prestasi

  • Sekumpulan lebih sedikit, pekerjaan yang lebih besar: Di mana dibenarkan, tetapkan sampleCount untuk menghasilkan berbilang video calon dalam satu permintaan (1–4) untuk mengurangkan overhed persediaan. ()
  • Cache imej rujukan dan gunakan semula benih untuk kebolehulangan supaya anda mengelak memuat naik semula binari besar.
  • Gunakan output Storan Awan (Puncak) untuk saiz keluaran yang besar untuk mengelak daripada mengembalikan bait mentah dalam badan permintaan.

7) Saluran paip berbilang langkah dengan model Gemini yang lain

Saluran paip yang berguna: gunakan penjana imej pegun (cth, model imej Gemini) untuk mencipta aset → hantar imej terbaik sebagai image + referenceImages ke Veo 3.1 → lelaran gesaan audio/dialog dengan model teks untuk penceritaan yang dijana. Dokumen Gemini secara eksplisit menunjukkan contoh penjanaan imej rantaian dan panggilan Veo.

Petua praktikal, gotcha dan amalan terbaik

  • Gunakan biji benih apabila anda mahukan keluaran deterministik, berulang antara larian (gesaan yang sama + rujukan yang sama + benih yang sama → generasi yang sama).
  • Pastikan imej rujukan konsisten: tanaman yang sama, sudut muka yang sama, pakaian/latar belakang yang konsisten membantu model mengekalkan identiti dan gaya. Gunakan semula tiga imej yang sama merentas tangkapan untuk mengekalkan kesinambungan.
  • Lebih suka URI GCS untuk pengeluaran: menyimpan imej dan output dalam Cloud Storage mengelakkan had saiz pemindahan base64 dan memudahkan rantaian / sambungan.
  • Terangkan secara eksplisit peralihan & audio: untuk peralihan pertama/terakhir, tambahkan pergerakan kamera, tempo dan isyarat SFX/suara dalam gesaan untuk audio disegerakkan dengan lebih baik.
  • Uji gelung pendek dahulu: lelaran dengan tempoh yang singkat (4–8s) semasa anda menala gesaan, benih dan imej rujukan, kemudian sambungan rantai untuk adegan yang lebih panjang.
  • Sahkan nama medan yang tepat: SDK boleh menggunakan reference_images (snake_case), referenceImages (CamelCase), atau bersarang image objek dengan content / gcsUri. Semak dokumen SDK atau skema model Vertex untuk nama sifat yang tepat dalam versi yang anda gunakan.

Apakah kos Veo 3.1 dan bagaimana ia dibilkan?

Veo 3.1 dibilkan sesaat video yang dijana, dan Google mendedahkan berbilang variasi (contohnya Standard and Cepat) dengan kadar sesaat yang berbeza. Harga pembangun yang diterbitkan menunjukkan contoh kadar berbayar bagi 0.40 / saat untuk Veo 3.1 Standard** and **0.15 / saat untuk Veo 3.1 Fast. Halaman harga Gemini juga menyatakan bahawa anda hanya dicaj apabila video berjaya dijana (percubaan yang gagal mungkin tidak dibilkan).

API Veo 3.1 Harga dalam CometAPI

veo3.10.4000
veo3.1-pro2.0000

Kesimpulan — mengapa Veo 3.1 penting untuk pembangun sekarang

Veo 3.1 ialah lonjakan tambahan yang jelas untuk penjanaan video AI: audio asli yang lebih kaya, panduan imej rujukan dan primitif pengeditan baharu menjadikannya pilihan yang lebih kukuh untuk bercerita, pravisualisasi dan apl kreatif. Keupayaan tepat model berbeza sedikit antara titik akhir dan binaan pratonton (Sebagai contoh, perbezaan versi antara CometAPI dan Gemini)— jadi uji dan sahkan varian model yang anda ingin gunakan. Contoh-contoh dalam panduan ini memberikan titik permulaan praktikal untuk prototaip dan pengeluaran.

Cara Mengakses API Veo 3.1 API

CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.

Pembangun boleh mengakses API Veo 3.1 melalui CometAPI, versi model terkini sentiasa dikemas kini dengan laman web rasmi. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.

Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !

Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI, ikuti kami VKX and Perpecahan!

SHARE THIS BLOG

500+ Model dalam Satu API

Sehingga 20% Diskaun