Sådan bruger du Veo 3.1 API

CometAPI
AnnaDec 10, 2025
Sådan bruger du Veo 3.1 API

Veo 3.1 er den seneste version af Googles Veo-familie af videogenereringsmodeller. Den bringer rigere native lyd, bedre narrativ og filmisk kontrol, vejledning til flere billeder og nye redigeringsprimitiver (overgange mellem første og sidste billede, "ingredienser"/referencebilleder og arbejdsgange til sceneudvidelser). For udviklere er den hurtigste måde at få adgang til Veo 3.1 via API'en (til forbrugerrettede integrationer) og Vertex AI (til virksomheds- og cloud-arbejdsbelastninger).

Hvad er Veo 3.1 API'en, og hvad er dens vigtigste funktioner?

Veo 3.1 er en tekst-og-billede → videogenereringsmodel fra Google, der er designet til at producere korte, filmiske klip i høj kvalitet med native genereret lyd (dialog, ambient-signaler, lydeffekter). Udgivelsen fokuserer på at forbedre hurtig overholdelse, karakterkonsistens, lydgenerering og mere detaljerede redigeringskontroller (for eksempel: overgange mellem første og sidste billede og vejledning via op til tre referencebilleder).

Nøglefunktioner (overblik)

  • Tekst → VideoGenerer videoer direkte fra fortællende prompts (inklusive dialog og lyd).
  • Billede → Video: Transformér et billede til en kort animeret scene. ()
  • **Referencebilleder ("Ingredienser til video")**Forsyning op til 3 billeder (tegn, objekter, stilarter) for at sikre visuel konsistens på tværs af output.
  • Første og sidste rammegenereringOpret overgange, der bygger bro mellem to billeder (modellen genererer billeder, der skifter jævnt mellem dem med matchende lyd).
  • SceneudvidelsesworkflowsVærktøjer til at udvide et eksisterende klip ved at generere nye klip knyttet til slutningen af ​​en tidligere video (bemærk: Funktioner og support varierer mellem Gemini API og Vertex preview – se afsnittet "betingelser").
  • Indbygget lyd og SFXModellen kan syntetisere tale, omgivende lyd og synkroniserede effekter, der matcher de genererede visuelle elementer.

Hvordan bruger jeg Veo 3.1 API'en – hvad er forudsætningerne og betingelserne?

Hvad skal du bruge, før du kalder API'en?

  1. Adgang og faktureringVeo 3.1 er i betalt forhåndsvisning – sørg for, at du har en API-nøgle eller et Google Cloud-projekt med Vertex AI aktiveret og fakturering konfigureret. Nogle funktioner og modelvarianter er regionsbegrænsede i forhåndsvisningen.
  2. Kvoter og forhåndsvisningsbegrænsningerForhåndsvisningsmodeller har ofte grænser for ansøgningshastighed pr. projekt (eksempler: 10 RPM for forhåndsvisningsvarianter) og grænser for videoer pr. anmodning. Se modelsiden i Vertex AI/Gemini-dokumentationen for at se de nøjagtige tal for din konto.
  3. Inputaktiver og formatDu kan generere fra tekstprompter, fra enkeltstående eller flere billeder, eller udvide en eksisterende Veo-genereret video ved at referere til dens URI. For billede-til-video-workflows skal du levere billeder i de understøttede formater (URL'er eller bytes afhængigt af slutpunktet).
  4. Sikkerhed og oprindelseGenereret indhold skal overholde Googles indholdspolitikker. I forhåndsvisningen kan der vises vandmærker eller brugsflag; vær forberedt på at håndtere trin til proveniens og indholdsmoderering i din applikation.

Hvilke godkendelsesmetoder understøttes?

  • API-nøgleFor Gemini-hostede slutpunkter eller nøgler til tredjeparts-API-platformen. Jeg anbefaler CometAPI,  CometAPI tilbyde en pris langt lavere end den officielle pris for at hjælpe dig med at integrere Veo 3.1 API (veo3.1-pro; veo3.1)
  • Google Cloud-loginoplysninger / ADCFor Vertex AI skal du bruge standardapplikationslegitimationsoplysninger (servicekonto / gcloud-godkendelse) eller en API-nøgle, der er knyttet til dit Google Cloud-projekt.

Hvad er Veo 3.1 API-slutpunkterne, og hvilke parametre er mest vigtige?

Kort svar: Du skal enten ringe til CometAPI API videogenereringsslutpunkt (til CometAPI-hostet adgang, v1/chat/completionsBegge bruger en JSON-anmodningstekst, der beskriver model, prompt(er) og en video/output konfiguration; større videojob returneres som langvarige operationer.

Almindelige endepunkter (eksempler):

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"model": "veo3.1-pro",  
"stream": true,  
"messages":   
}'

Typiske anmodningsparametre (logisk opdeling)

  • model — modelidentifikator, der skal målrettes (veo3.1-pro; veo3.1-navne anført i modelreference).
  • prompt / input — menneskelig tekst, der beskriver scenen; kan indeholde flere prompter eller instruktioner til flere skud afhængigt af modellens muligheder. Brug strukturerede prompter til at styre kamerabevægelser, tidspunkt på dagen, humør og lydsignaler.
  • billedreferencer — 1-3 billed-URI'er eller base64-billeder til at guide objekter/tegn/stilarter (Veo 3.1 understøtter flere billedreferencer).
  • video — bruges når strækker et tidligere Veo-output (videregiv den indledende video-URI). Nogle funktioner fungerer kun på Veo-genererede videoer.
  • varighed / fps / opløsning / billedformatforhold — vælg mellem understøttede længder og formater (forhåndsvisningsmodeller viser understøttede varigheder og billedhastigheder – f.eks. 4, 6, 8 sekunder i nogle forhåndsvisningsdokumenter; udvidelser kan tillade længere output i Flow/Studio).

Hvad er avancerede brugsmønstre og teknikker?

1) Oprethold karakterkonsistens med referencebilleder

Angiv op til tre referencebilleder (ansigter/positurer/kostumer) for at bevare en karakters udseende på tværs af flere genererede optagelser. Typisk flow:

  1. Upload eller indkod dine referencebilleder.
  2. Send dem ind config.reference_images når man genererer hvert skud.
  3. Brug de samme billeder til efterfølgende generationskald (eller kombiner med seed-værdier) for at maksimere visuel konsistens.
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"messages": [
{
"role": "user",
"content": "Create a cinematic 6s shot: a fashion editorial on a city rooftop at golden hour. Keep the subject look consistent with the reference images."
}
],
"extra_body": {
"google": {
"referenceImages": [
{ "image": { "uri": "https://example.com/ref1.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref2.jpg" }, "referenceType": "asset" },
{ "image": { "uri": "https://example.com/ref3.jpg" }, "referenceType": "asset" }
],
"config": {
"resolution": "1080p",
"durationSeconds": 6,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

2) Overgange mellem første og sidste frame (shot syntese)

Brug image (første billede) + config.last_frame at instruere Veo i at syntetisere den mellemliggende bevægelse. Dette er ideelt til filmiske overgange — det producerer naturlig visuel interpolation og synkroniseret lyd.

Giv en første ramme (image) Og en sidste ramme (lastFrame) og Veo 3.1 vil interpolere bevægelsen mellem dem for at skabe en jævn overgang (med valgfri lyd). cURL (REST) ​​eksempel — første + sidste billeder:

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Interpolate between these two images to create an 8s cinematic morph: from 'sunlit victorian parlor' (first) to 'overgrown ruin' (last). Add soft ambient sound."
}
],
"extra_body": {
"google": {
"image": { "uri": "https://example.com/first_frame.jpg" },
"lastFrame": { "uri": "https://example.com/last_frame.jpg" },
"config": {
"resolution": "1080p",
"durationSeconds": 8,
"fps": 24,
"aspectRatio": "16:9",
"generateAudio": true
}
}
}
}'

3) Sceneudvidelse (kæde flere generationer)

Der er to mønstre:

  • **API/Flow-tilgang (forhåndsvisningsfunktioner)**Du sender en eksisterende video (et returneret videoobjekt eller en URI) som video=video_to_extend for at oprette et efterfølgende klip, der er i overensstemmelse med den foregående scene. Brug handlingsresponsen til at optage video.uri og indfør det i det næste opkald for at udvide fortællingen. Bemærk: Tilgængelighed og adfærd kan variere afhængigt af platformen, så validér på den platform, du vælger.
  • Vertex skymønsterVertex' forhåndsvisningsmodel har strengere begrænsninger for dokumentlistede funktioner (f.eks. returnerer den nuværende forhåndsvisning kun segmenter på 4/6/8 sekunder), så for at producere output på et minut skal du kæde flere anmodninger sammen og sammensætte dem i din applikation eller bruge motorens officielle sceneudvidelsesværktøjer, hvor de er tilgængelige. Se Vertex' side med "Veo 3.1 forhåndsvisning" for den aktuelle supportmatrix.

Tag en tidligere Veo-genereret video og forlænge den fremad (tilføj sekunder), samtidig med at stil og kontinuitet bevares. API'en kræver, at inputtet er en Veo-genereret video (udvidelser af vilkårlige MP4-filer understøttes muligvis ikke). Du kan forlænge med 7 sekunders hop op til dokumenterede grænser (Veo-forhåndsvisningsgrænser gælder):

curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer cometapi_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"messages": [
{
"role": "user",
"content": "Extend the last scene: the origami butterfly flies into the garden and a puppy runs up to the flower; continue action for ~7 seconds."
}
],
"extra_body": {
"google": {
"video": { "uri": "https://storage.googleapis.com/your-bucket/butterfly_video_id.mp4" },
"config": {
"numberOfVideos": 1,
"resolution": "720p",
"durationSeconds": 7,
"fps": 24,
"generateAudio": true
}
}
}
}'

4) Lyd- og dialogkontrol

Veo 3.1 genererer native lyd (tale og effekter) fra prompts. Tricks:

  • Indsæt eventuelle talte replikker i din prompt (sæt dialogen i anførselstegn) for at fremme realistisk læbesynkronisering.
  • Tilføj lydbeskrivelser ("bløde fodtrin fra venstre mod højre", "dæmpet tordencrescendo") for at forme sanglydeffekter og stemning.
  • Brug seed-værdier til at reproducere det samme audiovisuelle/visuelle resultat på tværs af testkørsler.

5) Deterministiske output til testning (seeds)

Hvis du har brug for gentagelige output til CI- eller A/B-testning, skal du angive en seed parameter (uint32). Ændring af prompt- eller referencebilleder vil stadig ændre resultatet; seed garanterer repeterbarhed kun når alt andet er identisk.

6) Omkostnings- og ydeevneoptimeringer

  • Færre, større job i batch: Hvor tilladt, sæt sampleCount at producere flere kandidatvideoer i én anmodning (1-4) for at reducere opsætningsomkostninger. ()
  • Cache referencebilleder og genbrug frø for reproducerbarhed, så du undgår at genuploade store binære filer.
  • Brug Cloud Storage-output (Vertex) for store outputstørrelser for at undgå at returnere rå bytes i anmodningsteksten.

7) Flertrinsrørledninger med andre Gemini-modeller

En nyttig pipeline: brug en stillbilledgenerator (f.eks. Gemini-billedmodel) til at oprette aktiver → send de bedste billeder som image + referenceImages til Veo 3.1 → iterer lyd-/dialogprompter med tekstmodellen til genereret fortælling. Gemini-dokumentationen viser eksplicit eksempler på sammenkædning af billedgenerering og Veo-kald.

Praktiske tips, tricks og bedste praksis

  • Brug frø når du ønsker deterministiske, gentagelige output mellem kørsler (samme prompt + samme referencer + samme seed → samme generation).
  • Hold referencebilleder konsistenteSamme beskæring, samme ansigtsvinkel, ensartet tøj/baggrund hjælper modellen med at bevare identitet og stil. Genbrug de samme tre billeder på tværs af optagelserne for at bevare kontinuiteten.
  • Foretræk GCS URI'er til produktionLagring af billeder og output i Cloud Storage undgår base64-overførselsstørrelsesbegrænsninger og forenkler kædedannelse/udvidelse.
  • Beskriv eksplicit overgange og lydTil første/sidste overgange, tilføj kamerabevægelse, tempo og SFX/stemmesignaler i prompten for bedre synkroniseret lyd.
  • Test korte sløjfer først: iterer med korte varigheder (4-8 sekunder), mens du finjusterer prompts, seeds og referencebilleder, og kæder derefter forlængelser sammen for længere scener.
  • Bekræft nøjagtige feltnavneSDK'er kan bruge reference_images (slange_etui), referenceImages (camelCase) eller indlejret image genstande med content / gcsUriTjek SDK-dokumentationen eller Vertex-modelskemaet for de nøjagtige egenskabsnavne i den version, du bruger.

Hvad koster Veo 3.1, og hvordan faktureres det?

Veo 3.1 er faktureret pr. sekund genereret video, og Google eksponerer flere varianter (f.eks. Standard og Hurtigt) med forskellige rater pr. sekund. De offentliggjorte udviklerpriser viser eksempler på betalte priser på 0.40 USD/sekund for Veo 3.1 Standard og 0.15 USD/sekund for Veo 3.1 FastGemini-prissiden bemærker også, at du kun bliver opkrævet betaling, når en video er genereret (mislykkede forsøg faktureres muligvis ikke).

Veo 3.1 API Prisfastsættelse i CometAPI

veo3.10.4000
veo3.1-pro2.0000

Konklusion — hvorfor Veo 3.1 er vigtig for udviklere lige nu

Veo 3.1 er et klart trinvis spring for AI-videogenerering: rigere native lyd, referencebilledevejledning og nye redigeringsprimitiver gør det til en stærkere mulighed for historiefortælling, prævisualisering og kreative apps. Modellens præcise funktioner varierer en smule mellem endpoints og preview-builds (for eksempel versionsforskellen mellem CometAPI og Gemini) – så test og valider den modelvariant, du har til hensigt at bruge. Eksemplerne i denne vejledning giver et praktisk udgangspunkt for prototyping og produktion.

Sådan får du adgang Veo 3.1 API API

CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, formatering af anmodninger og svarhåndtering forenkler CometAPI dramatisk integrationen af ​​AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.

Udviklere kan få adgang Veo 3.1 API gennem Comet API, den nyeste modelversion opdateres altid med den officielle hjemmeside. For at begynde, udforsk modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.

Klar til at gå? → Tilmeld dig CometAPI i dag !

Hvis du vil vide flere tips, guider og nyheder om AI, følg os på VKX og Discord!

SHARE THIS BLOG

500+ modeller i én API

Op til 20% rabat