Hoe Veo 3.1 API te gebruiken

Veo 3.1 is de nieuwste versie van Google's Veo-familie van videogeneratiemodellen. Het biedt rijkere native audio, betere narratieve en filmische controle, multi-image begeleiding en nieuwe bewerkingsprimitieven (overgangen van het eerste/laatste frame, "ingrediënten"/referentiebeelden en workflows voor scène-uitbreiding). Ontwikkelaars krijgen het snelst toegang tot Veo 3.1 via de API (voor integraties voor consumenten) en Vertex AI (voor enterprise- en cloudworkloads).

Wat is de Veo 3.1 API en wat zijn de belangrijkste kenmerken?

Veo 3.1 is een tekst-en-beeld → videogeneratiemodel van Google, ontworpen om korte, hoogwaardige, filmische clips te produceren met native gegenereerde audio (dialoog, omgevingsgeluiden, geluidseffecten). De release richt zich op het verbeteren van prompt-adherentie, karakterconsistentie, audiogeneratie en meer gedetailleerde bewerkingsmogelijkheden (bijvoorbeeld: overgangen tussen eerste en laatste frame en begeleiding via maximaal drie referentiebeelden).

Belangrijkste mogelijkheden (in één oogopslag)

Tekst → Video: Genereer video's rechtstreeks op basis van verhaallijnen (inclusief dialoog en audio).
Afbeelding → Video: Transformeer een afbeelding in een korte geanimeerde scène. ()
Referentiebeelden ("Ingrediënten voor video"): Lever tot 3 afbeeldingen (personages, objecten, stijlen) om visuele consistentie in alle uitvoer te behouden.
Eerste en laatste frame generatie: Maak overgangen die twee afbeeldingen overbruggen (het model genereert frames die vloeiend tussen de twee afbeeldingen overgaan, met bijpassende audio).
Workflows voor scène-uitbreiding: Hulpmiddelen om een bestaande clip uit te breiden door nieuwe clips te genereren die zijn gekoppeld aan het einde van een eerdere video (let op: de mogelijkheden en ondersteuning verschillen tussen Gemini API en Vertex preview - zie het gedeelte 'voorwaarden').
Native audio en geluidseffecten:Het model kan spraak, omgevingsgeluid en gesynchroniseerde effecten synthetiseren die overeenkomen met de gegenereerde beelden.

Hoe gebruik ik de Veo 3.1 API? Wat zijn de vereisten en voorwaarden?

Wat heb je nodig voordat je de API aanroept?

Toegang en facturering: Veo 3.1 is beschikbaar in de betaalde previewversie. Zorg ervoor dat u een API-sleutel of een Google Cloud-project met Vertex AI hebt ingeschakeld en dat de facturering is ingesteld. Sommige functies en modelvarianten zijn regiogebonden in de previewversie.
Quota's en voorbeeldbeperkingenPreviewmodellen hebben vaak limieten voor de aanvraagsnelheid per project (bijvoorbeeld: 10 RPM voor previewvarianten) en limieten voor video's per aanvraag. Raadpleeg de modelpagina in de Vertex AI/Gemini-documentatie voor exacte cijfers voor uw account.
Invoeractiva en -indeling: U kunt genereren vanuit tekstprompts, vanuit één of meerdere afbeeldingen, of een bestaande door Veo gegenereerde video uitbreiden door te verwijzen naar de URI. Voor image-to-video-workflows levert u afbeeldingen aan in de ondersteunde formaten (URL's of bytes, afhankelijk van het eindpunt).
Veiligheid en herkomst: Gegenereerde content moet voldoen aan het contentbeleid van Google. In de preview kunnen watermerken of gebruiksmarkeringen verschijnen; houd er rekening mee dat u in uw applicatie stappen voor herkomst en contentmoderatie moet doorlopen.

Welke authenticatiemethoden worden ondersteund?

API sleutel: Voor de door Gemini gehoste eindpunten of de sleutel van het externe API-platform raad ik CometAPI aan. KomeetAPI bieden een prijs die veel lager is dan de officiële prijs om u te helpen bij de integratie van Veo 3.1 API (veo3.1-pro; veo3.1)
Google Cloud-referenties / ADC: Gebruik voor Vertex AI de standaardreferenties van de toepassing (serviceaccount/gcloud-auth) of een API-sleutel die aan uw Google Cloud-project is gekoppeld.

Wat zijn de Veo 3.1 API-eindpunten en welke parameters zijn het belangrijkst?

Kort antwoord: U belt ofwel de CometAPI API videogeneratie-eindpunt (voor door CometAPI gehoste toegang, v1/chat/completions). Beide gebruiken een JSON-aanvraagbody die het model, de prompt(s) en een video/output configuratie; grotere videotaken worden geretourneerd als langlopende bewerkingen.

Veelvoorkomende eindpunten (voorbeelden):

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"model": "veo3.1-pro",  
"stream": true,  
"messages":   
}'

Typische aanvraagparameters (logische indeling)

model — model-ID om te targeten (veo3.1-pro; veo3.1-namen vermeld in modelreferentie).
prompt / invoer — menselijke tekst die de scène beschrijft; kan meerdere prompts of instructies voor meerdere shots bevatten, afhankelijk van de mogelijkheden van het model. Gebruik gestructureerde prompts om camerabewegingen, tijdstip, stemming en audiosignalen te regelen.
afbeeldingsverwijzingen — 1–3 afbeeldings-URI's of base64-afbeeldingen om objecten/tekens/stijlen te begeleiden (Veo 3.1 ondersteunt meerdere afbeeldingsreferenties).
video- — gebruikt wanneer verlenging een eerdere Veo-uitvoer (geef de initiële video-URI door). Sommige functies werken alleen op door Veo gegenereerde video's.
duur / fps / resolutie / beeldverhouding — Selecteer uit ondersteunde lengtes en formaten (voorbeeldmodellen geven een lijst met ondersteunde duurtijden en framerates, bijvoorbeeld 4, 6, 8 seconden in sommige voorbeelddocumenten; extensies kunnen langere uitvoer in Flow/Studio toestaan).

Wat zijn geavanceerde gebruikspatronen en -technieken?

1) Zorg voor karakterconsistentie met referentiebeelden

Lever maximaal drie referentiebeelden (gezichten/poses/kostuums) om de uitstraling van een personage in meerdere gegenereerde shots te behouden. Typische workflow:

Upload of codeer uw referentiebeelden inline.
Geef ze door config.reference_images bij het maken van elke opname.
Gebruik dezelfde afbeeldingen voor opeenvolgende generatieaanroepen (of combineer ze met zaadwaarden) om de visuele consistentie te maximaliseren.

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"messages": [
{
"role": "user",
"content": "Create a cinematic 6s shot: a fashion editorial on a city rooftop at golden hour. Keep the subject look consistent with the reference images."
}
],
"extra_body": {
"google": {
"referenceImages": [
{ "image": { "uri": "https://example.com/ref1.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref2.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref3.jpg" }, "referenceType": "asset" }
],
"config": {
"resolution": "1080p",
"durationSeconds": 6,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

2) Overgangen tussen eerste en laatste frame (shotsynthese)

Gebruik image (eerste frame) + config.last_frame om Veo de opdracht te geven de tussenliggende beweging te synthetiseren. Dit is ideaal voor filmische overgangen: het produceert natuurlijke visuele interpolatie en gesynchroniseerde audio.

Verschaffen eerste frame (image) En een laatste frame (lastFrame) en Veo 3.1 interpoleert de beweging tussen de twee om een vloeiende overgang te produceren (met optionele audio). cURL (REST)-voorbeeld — eerste + laatste afbeeldingen:

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Interpolate between these two images to create an 8s cinematic morph: from 'sunlit victorian parlor' (first) to 'overgrown ruin' (last). Add soft ambient sound."
}
],
"extra_body": {
"google": {
"image": { "uri": "https://example.com/first_frame.jpg" },
"lastFrame": { "uri": "https://example.com/last_frame.jpg" },
"config": {
"resolution": "1080p",
"durationSeconds": 8,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

3) Scène-uitbreiding (meerdere generaties aan elkaar koppelen)

Er zijn twee patronen:

API/Flow-benadering (previewfuncties): Je geeft een bestaande video (een geretourneerd video-object of URI) door als video=video_to_extend om een vervolgclip te maken die consistent is met de vorige scène. Gebruik de bewerkingsrespons om de video.uri en voer het in het volgende gesprek in om het verhaal verder uit te diepen. Let op: beschikbaarheid en gedrag kunnen per platform verschillen, dus valideer op het platform dat u kiest.
Vertex wolkenpatroon: Het previewmodel van Vertex hanteert strengere, in documenten vermelde limieten (de huidige preview retourneert bijvoorbeeld alleen segmenten van 4/6/8 seconden). Om outputs van een minuut te produceren, moet u dus meerdere verzoeken aan elkaar koppelen en deze in uw applicatie samenvoegen, of de officiële scène-extensietools van de engine gebruiken waar beschikbaar. Raadpleeg de pagina "Veo 3.1 preview" van Vertex voor de actuele ondersteuningsmatrix.

Neem een eerder door Veo gegenereerd video en verleng deze naar voren (seconden toevoegen) met behoud van stijl en continuïteit. De API vereist dat de invoer een door Veo gegenereerde video is (extensies van willekeurige MP4's worden mogelijk niet ondersteund). U kunt met hops van 7 seconden verlengen tot de gedocumenteerde limieten (Veo-previewlimieten zijn van toepassing):

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Extend the last scene: the origami butterfly flies into the garden and a puppy runs up to the flower; continue action for ~7 seconds."
}
],
"extra_body": {
"google": {
"video": { "uri": "https://storage.googleapis.com/your-bucket/butterfly_video_id.mp4" },
"config": {
"numberOfVideos": 1,
"resolution": "720p",
"durationSeconds": 7,
"fps": 24,
"generateAudio": true
}
}
}
}'

4) Audio- en dialoogbediening

Veo 3.1 genereert native audio (spraak en effecten) vanuit prompts. Trucs:

Zet gesproken regels in je prompt (zet de dialoog tussen aanhalingstekens) om realistische lipsynchronisatie te stimuleren.
Voeg audiobeschrijvingen toe ('zachte voetstappen van links naar rechts', 'gedempte dondercrescendo') om de geluidseffecten en de sfeer vorm te geven.
Gebruik zaadwaarden om hetzelfde audiovisuele resultaat te reproduceren tijdens verschillende testruns.

5) Deterministische uitkomsten voor testen (seeds)

Als u herhaalbare uitvoer nodig hebt voor CI- of A/B-testen, geef dan een seed parameter (uint32). Het wijzigen van de prompt of referentie-afbeeldingen zal het resultaat nog steeds veranderen; seed garandeert herhaalbaarheid Slechts als alles verder identiek is.

6) Kosten- en prestatieoptimalisaties

Minder, maar grotere taken tegelijk uitvoeren: Waar toegestaan, instellen sampleCount om meerdere kandidaatvideo's in één aanvraag te produceren (1–4) om de installatiekosten te verminderen. ()
Cache referentie-afbeeldingen en hergebruik zaden voor reproduceerbaarheid, zodat u niet opnieuw grote binaire bestanden hoeft te uploaden.
Gebruik Cloud Storage-uitvoer (Vertex) voor grote uitvoerformaten om te voorkomen dat er onbewerkte bytes in de aanvraagtekst worden geretourneerd.

7) Meerstapspijplijnen met andere Gemini-modellen

Een nuttige pijplijn: gebruik een generator voor stilstaande beelden (bijvoorbeeld het Gemini-afbeeldingsmodel) om assets te creëren → geef de beste afbeeldingen door als image + referenceImages Naar Veo 3.1 → herhaal audio-/dialoogprompts met het tekstmodel voor gegenereerde voice-over. De Gemini-documentatie toont expliciete voorbeelden van het koppelen van beeldgeneratie en Veo-aanroepen.

Praktische tips, valkuilen en best practices

Gebruik zaden als u deterministische, herhaalbare uitvoer tussen runs wilt (dezelfde prompt + dezelfde referenties + dezelfde seed → dezelfde generatie).
Houd referentiebeelden consistent: dezelfde uitsnede, dezelfde gezichtshoek, consistente kleding/achtergrond helpt het model om zijn identiteit en stijl te behouden. Gebruik dezelfde drie afbeeldingen in meerdere shots om de continuïteit te behouden.
Geef de voorkeur aan GCS-URI's voor productie: door afbeeldingen en uitvoer op te slaan in Cloud Storage vermijdt u base64-limieten voor de overdrachtsgrootte en wordt ketenvorming/uitbreiding eenvoudiger.
Beschrijf expliciet overgangen en audio: voor eerste/laatste overgangen, voeg camerabewegingen, tempo en SFX/stemsignalen toe in de prompt voor beter gesynchroniseerde audio.
Test eerst korte lussen: herhaal met korte duur (4–8 seconden) terwijl u prompts, seeds en referentiebeelden afstemt, en rijg vervolgens extensies aan elkaar voor langere scènes.
Bevestig exacte veldnamen: SDK's kunnen gebruik maken van reference_images (slangenhoes), referenceImages (camelCase), of genest image objecten met content / gcsUriRaadpleeg de SDK-documentatie of het Vertex-modelschema voor de exacte eigenschapsnamen in de versie die u gebruikt.

Wat kost Veo 3.1 en hoe wordt het gefactureerd?

Veo 3.1 wordt gefactureerd per seconde gegenereerde video, en Google stelt meerdere varianten bloot (bijvoorbeeld Standaard en Snel) met verschillende snelheden per seconde. De gepubliceerde ontwikkelaarsprijzen tonen voorbeelden van betaalde tarieven van $ 0.40 / seconde voor Veo 3.1 Standard en $0.15 / seconde voor Veo 3.1 FastOp de Gemini-prijzenpagina staat ook dat er alleen kosten in rekening worden gebracht als een video succesvol is gegenereerd (mislukte pogingen worden mogelijk niet in rekening gebracht).

Veo 3.1-API Prijzen in CometAPI


veo3.1	0.4000
veo3.1-pro	2.0000

Conclusie — waarom Veo 3.1 nu belangrijk is voor ontwikkelaars

Veo 3.1 is een duidelijke stap voorwaarts voor het genereren van AI-video: rijkere native audio, referentiebeeldbegeleiding en nieuwe bewerkingsprimitieven maken het een betere optie voor storytelling, previsualisatie en creatieve apps. De exacte mogelijkheden van het model verschillen enigszins tussen eindpunten en preview-builds (bijvoorbeeld het versieverschil tussen CometAPI en Gemini) – test en valideer daarom de modelvariant die u wilt gebruiken. De voorbeelden in deze handleiding bieden een praktisch startpunt voor prototyping en productie.

Hoe toegang te krijgen Veo 3.1-API API

CometAPI is een uniform API-platform dat meer dan 500 AI-modellen van toonaangevende aanbieders – zoals de GPT-serie van OpenAI, Gemini van Google, Claude, Midjourney en Suno van Anthropic – samenvoegt in één, gebruiksvriendelijke interface voor ontwikkelaars. Door consistente authenticatie, aanvraagopmaak en responsverwerking te bieden, vereenvoudigt CometAPI de integratie van AI-mogelijkheden in uw applicaties aanzienlijk. Of u nu chatbots, beeldgenerators, muziekcomponisten of datagestuurde analysepipelines bouwt, met CometAPI kunt u sneller itereren, kosten beheersen en leveranciersonafhankelijk blijven – en tegelijkertijd profiteren van de nieuwste doorbraken in het AI-ecosysteem.

Ontwikkelaars hebben toegang tot Veo 3.1-API via CometAPI, de nieuwste modelversie wordt altijd bijgewerkt met de officiële website. Om te beginnen, verken de mogelijkheden van het model in de Speeltuin en raadpleeg de API-gids voor gedetailleerde instructies. Zorg ervoor dat u bent ingelogd op CometAPI en de API-sleutel hebt verkregen voordat u toegang krijgt. KomeetAPI bieden een prijs die veel lager is dan de officiële prijs om u te helpen integreren.

Klaar om te gaan?→ Meld u vandaag nog aan voor CometAPI !

Als u meer tips, handleidingen en nieuws over AI wilt weten, volg ons dan op VK, X en Discord!