Veo 3.1, Google'ın Veo video oluşturma model ailesinin en son sürümüdür. Daha zengin yerel ses, daha iyi anlatım ve sinematik kontrol, çoklu görüntü rehberliği ve yeni düzenleme temelleri (ilk/son kare geçişleri, "malzemeler" / referans görüntüleri ve sahne uzantısı iş akışları) sunar. Geliştiriciler için Veo 3.1'e erişmenin en hızlı yolu, API (tüketici odaklı entegrasyonlar için) ve Vertex AI'dır (kurumsal ve bulut iş yükleri için).
Veo 3.1 API nedir ve temel özellikleri nelerdir?
Veo 3.1, Google'ın metin ve görüntü → video oluşturma modelidir ve yerel olarak üretilen sesle (diyalog, ortam ipuçları, ses efektleri) kısa, yüksek kaliteli, sinematik klipler üretmek üzere tasarlanmıştır. Bu sürüm, anında uyumu, karakter tutarlılığını, ses üretimini ve daha ayrıntılı düzenleme kontrollerini (örneğin: ilk → son kare geçişleri ve üç adede kadar referans görüntü aracılığıyla yönlendirme) iyileştirmeye odaklanmaktadır.
Temel yetenekler (bir bakışta)
- Metin → Video:Anlatımsal istemlerden doğrudan videolar oluşturun (diyalog ve ses dahil).
- Resim → Video: Bir görüntüyü kısa animasyonlu bir sahneye dönüştürün. ()
- Referans görseller (“Videodaki malzemeler”): Tedarik miktarı 3 Çıktılar arasında görsel tutarlılığı sağlamak için görseller (karakterler, nesneler, stiller)
- İlk ve Son Kare oluşturma: İki görüntüyü birbirine bağlayan geçişler oluşturun (model, eşleşen sesle, aralarında sorunsuz bir şekilde geçiş yapan kareler oluşturur).
- Sahne uzantısı iş akışları: Önceki bir videonun sonuna bağlı yeni klipler üreterek mevcut bir klibi genişletmek için araçlar (not: yetenekler ve destek Gemini API ve Vertex önizlemesi arasında farklılık gösterir - "koşullar" bölümüne bakın).
- Yerel ses ve ses efektleri:Model, oluşturulan görsellerle eşleşen konuşma, ortam sesi ve senkronize efektleri sentezleyebilir.
Veo 3.1 API'sini nasıl kullanırım? Ön koşullar ve şartlar nelerdir?
API'yi çağırmadan önce neye ihtiyacınız var?
- Erişim ve faturalandırma: Veo 3.1 ücretli önizleme aşamasındadır; Vertex AI'nın etkinleştirildiği ve faturalandırmanın ayarlandığı bir API anahtarınız veya Google Cloud projeniz olduğundan emin olun. Bazı özellikler ve model varyantları önizleme aşamasında bölgeyle sınırlıdır.
- Kotalar ve önizleme kısıtlamaları: Önizleme modellerinde genellikle proje başına istek oranı sınırları (örneğin: önizleme varyantları için 10 RPM) ve istek başına video sınırlamaları bulunur. Hesabınız için kesin rakamlar için Vertex AI / Gemini belgelerindeki model sayfasını kontrol edin.
- Giriş varlıkları ve biçimi: Metin istemlerinden, tek veya birden fazla görselden oluşturabilir veya mevcut bir Veo tarafından oluşturulmuş videoyu, URI'sine başvurarak genişletebilirsiniz. Görselden videoya dönüştürme iş akışları için, desteklenen formatlarda (bitiş noktasına bağlı olarak URL'ler veya baytlar) görseller sağlayın.
- Güvenlik ve menşei: Oluşturulan içerik, Google'ın içerik politikalarına uygun olmalıdır. Önizlemede filigranlar veya kullanım işaretleri görünebilir; uygulamanızda kaynak ve içerik denetimi adımlarını ele almaya hazır olun.
Hangi kimlik doğrulama yöntemleri destekleniyor?
- API anahtarıGemini'de barındırılan uç noktalar veya üçüncü taraf API platformunun anahtarı için CometAPI'yi öneririm. Kuyrukluyıldız API'si Veo 3.1 API'sini (veo3.1-pro; veo3.1) entegre etmenize yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz
- Google Cloud kimlik bilgileri / ADC: Vertex AI için Uygulama Varsayılan Kimlik Bilgilerini (hizmet hesabı / gcloud kimlik doğrulaması) veya Google Cloud projenize bağlı bir API anahtarını kullanın.
Veo 3.1 API uç noktaları nelerdir ve hangi parametreler en önemlidir?
Kısa cevap: Ya arayacaksınız CometAPI API video oluşturma uç noktası (CometAPI tarafından barındırılan erişim için,
v1/chat/completions). Her ikisi de modeli, istemleri ve bir JSON istek gövdesini tanımlar.video/outputyapılandırma; daha büyük video işleri uzun süren işlemler olarak döndürülür.
Ortak uç noktalar (örnekler):
curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "veo3.1-pro",
"stream": true,
"messages":
}'
Tipik istek parametreleri (mantıksal döküm)
- model — hedef model tanımlayıcısı (veo3.1-pro; veo3.1 adları listelenmiştir) model referansı).
- istem / giriş — Sahneyi tanımlayan insan metni; modelin yeteneklerine bağlı olarak birden fazla komut veya çoklu çekim talimatları içerebilir. Kamera hareketlerini, günün saatini, ruh halini ve ses ipuçlarını kontrol etmek için yapılandırılmış komutlar kullanın.
- resim_referansları — Nesneleri/karakterleri/stilleri yönlendirmek için 1–3 resim URI'si veya base64 resmi (Veo 3.1 birden fazla resim referansını destekler).
- video — ne zaman kullanılır uzatma Önceki bir Veo çıktısı (ilk video URI'sini iletin). Bazı özellikler yalnızca Veo tarafından oluşturulan videolarda çalışır.
- süre / fps / çözünürlük / en boy oranı — desteklenen uzunluklar ve formatlar arasından seçim yapın (önizleme modelleri desteklenen süreleri ve kare hızlarını listeler; örneğin bazı önizleme belgelerinde 4, 6, 8 sn; uzantılar Flow/Studio'da daha uzun çıktılara izin verebilir).
İleri kullanım kalıpları ve teknikleri nelerdir?
1) Referans görsellerle karakter tutarlılığını koruyun
Birden fazla çekimde bir karakterin görünümünü korumak için en fazla üç referans görseli (yüzler/pozlar/kostüm) sağlayın. Tipik akış:
- Referans görsellerinizi yükleyin veya satır içi kodlayın.
- Onları içeri geçir
config.reference_imagesher atışı oluştururken. - Görsel tutarlılığı en üst düzeye çıkarmak için sonraki nesil çağrılarda aynı görselleri kullanın (veya başlangıç değerleriyle birleştirin).
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"messages": [
{
"role": "user",
"content": "Create a cinematic 6s shot: a fashion editorial on a city rooftop at golden hour. Keep the subject look consistent with the reference images."
}
],
"extra_body": {
"google": {
"referenceImages": [
{ "image": { "uri": "https://example.com/ref1.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref2.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref3.jpg" }, "referenceType": "asset" }
],
"config": {
"resolution": "1080p",
"durationSeconds": 6,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'
2) İlk ve son kare geçişleri (çekim sentezi)
Kullanım image (ilk kare) + config.last_frame Veo'ya ara hareketleri sentezlemesi talimatını vermek. Bu, sinematik geçişler için idealdir; doğal görsel enterpolasyon ve senkronize ses üretir.
Bir sağlayın ilk kare (image) Ve son kare (lastFrame) ve Veo 3.1, aralarındaki hareketi, yumuşak bir geçiş (isteğe bağlı sesle) üretmek için interpole edecektir. cURL (REST) örneği — ilk + son resimler:
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Interpolate between these two images to create an 8s cinematic morph: from 'sunlit victorian parlor' (first) to 'overgrown ruin' (last). Add soft ambient sound."
}
],
"extra_body": {
"google": {
"image": { "uri": "https://example.com/first_frame.jpg" },
"lastFrame": { "uri": "https://example.com/last_frame.jpg" },
"config": {
"resolution": "1080p",
"durationSeconds": 8,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'
3) Sahne genişletme (birden fazla nesli zincirleme)
İki desen var:
- API/Akış yaklaşımı (önizleme özellikleri): Mevcut bir videoyu (döndürülebilen bir video nesnesi veya URI) şu şekilde geçirirsiniz:
video=video_to_extendÖnceki sahneyle tutarlı bir takip klibi oluşturmak için. İşlem yanıtını kullanarakvideo.urive anlatıyı genişletmek için bir sonraki çağrıya aktarın. Not: Kullanılabilirlik ve davranış platforma göre değişiklik gösterebilir, bu nedenle seçtiğiniz platformda doğrulama yapın. - Tepe bulut deseni: Vertex'in önizleme modelinin belge listeleme sınırları daha katıdır (örneğin, mevcut önizleme yalnızca 4/6/8 saniyelik bölümler döndürür), bu nedenle dakika uzunluğunda çıktılar üretmek için birden fazla isteği zincirlemeli ve bunları uygulamanıza entegre etmeli veya mümkün olduğunda motorun resmi sahne genişletme araçlarını kullanmalısınız. Güncel destek matrisi için Vertex'in "Veo 3.1 önizleme" sayfasına bakın.
Bir al daha önce Veo tarafından oluşturulmuş Videoyu ileri doğru uzatın (saniye ekleyin) ve stil ve sürekliliği koruyun. API, girdinin Veo tarafından oluşturulmuş bir video olmasını gerektirir (isteğe bağlı MP4 uzantıları desteklenmeyebilir). Belgelenen sınırlara kadar 7 saniyelik atlamalarla uzatabilirsiniz (Veo önizleme sınırları geçerlidir):
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Extend the last scene: the origami butterfly flies into the garden and a puppy runs up to the flower; continue action for ~7 seconds."
}
],
"extra_body": {
"google": {
"video": { "uri": "https://storage.googleapis.com/your-bucket/butterfly_video_id.mp4" },
"config": {
"numberOfVideos": 1,
"resolution": "720p",
"durationSeconds": 7,
"fps": 24,
"generateAudio": true
}
}
}
}'
4) Ses ve diyalog kontrolü
Veo 3.1, komutlardan yerel ses (konuşma ve efektler) üretir. Püf noktaları:
- Gerçekçi dudak senkronizasyonunu teşvik etmek için sözlü repliklerinizi isteminize ekleyin (diyalogları tırnak işaretleri içine alın).
- Ses efektlerini ve ruh halini şekillendirmek için ses tanımlayıcıları ekleyin ("soldan sağa yumuşak ayak sesleri", "boğuk gök gürültüsünün doruk noktası").
- Test çalışmaları boyunca aynı ses/görüntü sonucunu yeniden üretmek için tohum değerlerini kullanın.
5) Test için deterministik çıktılar (tohumlar)
CI veya A/B testi için tekrarlanabilir çıktılara ihtiyacınız varsa, seed parametre (uint32). İstemi veya referans görüntülerini değiştirmek yine de sonucu değiştirecektir; tohum tekrarlanabilirliği garanti eder. bir tek her şey aynıyken.
6) Maliyet ve performans optimizasyonları
- Daha az sayıda, daha büyük işleri toplu olarak yapın: İzin verilen yerlerde, ayarlayın
sampleCountKurulum yükünü azaltmak için tek bir istekte birden fazla aday videosu üretmek (1–4). () - Referans resimlerini önbelleğe alın ve tohumları yeniden kullanın yeniden üretilebilirlik için, büyük ikili dosyaları yeniden yüklemekten kaçınırsınız.
- Bulut Depolama çıktılarını kullanın (Vertex) İstek gövdesinde ham baytların döndürülmesini önlemek için büyük çıktı boyutları için.
7) Diğer Gemini modelleriyle çok adımlı boru hatları
Kullanışlı bir boru hattı: Varlıklar oluşturmak için bir durağan görüntü oluşturucu (örneğin, Gemini görüntü modeli) kullanın → en iyi görüntüleri şu şekilde iletin: image + referenceImages Veo 3.1'e geçin → Oluşturulan anlatım için metin modeliyle ses/diyalog istemlerini yineleyin. Gemini belgeleri, görüntü oluşturma ve Veo çağrılarını birbirine bağlayan örnekleri açıkça göstermektedir.
Pratik ipuçları, püf noktaları ve en iyi uygulamalar
- Tohum kullanın Çalışmalar arasında kesin, tekrarlanabilir çıktılar istediğinizde (aynı komut istemi + aynı referanslar + aynı tohum → aynı nesil).
- Referans görsellerini tutarlı tutunAynı kırpma, aynı yüz açısı, tutarlı kıyafetler/arka plan, modelin kimliğini ve tarzını korumasına yardımcı olur. Sürekliliği korumak için çekimlerde aynı üç görüntüyü tekrar kullanın.
- Üretim için GCS URI'lerini tercih edin: Görüntüleri ve çıktıları Bulut Depolamada depolamak base64 transfer boyutu sınırlarını ortadan kaldırır ve zincirlemeyi/genişletmeyi basitleştirir.
- Geçişleri ve sesi açıkça tanımlayın: İlk/son geçişler için komut satırına kamera hareketi, tempo ve SFX/ses ipuçları ekleyerek daha iyi senkronize ses elde edin.
- Önce kısa döngüleri test edin: İstemleri, başlangıç noktalarını ve referans görüntülerini ayarlarken kısa sürelerle (4–8 saniye) yineleyin, ardından daha uzun sahneler için zincirleme uzantılar yapın.
- Tam alan adlarını onaylayın: SDK'lar şunları kullanabilir:
reference_images(yılan_kılıfı),referenceImages(camelCase) veya iç içe geçmişimageile nesnelercontent/gcsUriKullandığınız sürümdeki tam özellik adları için SDK belgelerini veya Vertex model şemasını kontrol edin.
Veo 3.1'in maliyeti nedir ve nasıl faturalandırılır?
Veo 3.1 faturalandırıldı üretilen videonun saniyesi başınave Google birden fazla varyantı ortaya çıkarır (örneğin Standart ve Hızlı) farklı saniye başına oranlarla. Yayınlanan geliştirici fiyatlandırması, örnek ücretli katman oranlarını göstermektedir Veo 3.1 Standard için saniye başına 0.40 ABD doları ve Veo 3.1 Fast için saniye başına 0.15 ABD dolarıGemini fiyatlandırma sayfası ayrıca yalnızca bir video başarıyla oluşturulduğunda ücretlendirileceğinizi belirtir (başarısız girişimler faturalandırılmayabilir).
Veo 3.1 API CometAPI'de fiyatlandırma
| veo3.1 | 0.4000 |
| veo3.1-pro | 2.0000 |
Sonuç — Veo 3.1'in şu anda geliştiriciler için önemi
Veo 3.1, yapay zeka video üretimi için net bir artımlı sıçramadır: daha zengin yerel ses, referans görüntü rehberliği ve yeni düzenleme temelleri, onu hikaye anlatımı, ön görselleştirme ve yaratıcı uygulamalar için daha güçlü bir seçenek haline getirir. Modelin kesin yetenekleri, uç noktalar ve önizleme sürümleri arasında biraz farklılık gösterir (örneğin, CometAPI ve gemini arasındaki sürüm farkı). Bu nedenle, kullanmayı planladığınız model varyantını test edin ve doğrulayın. Bu kılavuzdaki örnekler, prototipleme ve üretim için pratik bir başlangıç noktası sunar.
Nasıl Erişilir Veo 3.1 API API
CometAPI, OpenAI'nin GPT serisi, Google'ın Gemini, Anthropic'in Claude, Midjourney, Suno ve daha fazlası gibi önde gelen sağlayıcılardan 500'den fazla AI modelini tek bir geliştirici dostu arayüzde toplayan birleşik bir API platformudur. Tutarlı kimlik doğrulama, istek biçimlendirme ve yanıt işleme sunarak CometAPI, AI yeteneklerinin uygulamalarınıza entegrasyonunu önemli ölçüde basitleştirir. İster sohbet robotları, görüntü oluşturucular, müzik bestecileri veya veri odaklı analiz hatları oluşturuyor olun, CometAPI daha hızlı yineleme yapmanızı, maliyetleri kontrol etmenizi ve satıcıdan bağımsız kalmanızı sağlar; tüm bunları yaparken AI ekosistemindeki en son atılımlardan yararlanırsınız.
Geliştiriciler erişebilir Veo 3.1 API CometAPI aracılığıyla, en son model versiyonu Resmi web sitesi aracılığıyla sürekli güncellenmektedir. Başlamak için, modelin yeteneklerini keşfedin. Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Kuyrukluyıldız API'si Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.
Gitmeye hazır mısınız?→ Bugün CometAPI'ye kaydolun !
Yapay zeka hakkında daha fazla ipucu, kılavuz ve haber öğrenmek istiyorsanız bizi takip edin VK, X ve Katılın!


