Can Veo 3.1 API generate videos from images as well as text prompts?

Ja. Veo 3.1 støtter både tekst-til-video- og bilde-til-video-arbeidsflyter, slik at skapere kan starte fra prompter, bilder eller arbeidsflyter med rammeveiledning.

When should I use Veo 3.1 instead of Sora 2?

Velg Veo 3.1 når lydsynkronisering, bildebaserte arbeidsflyter, produksjon av vertikalt innhold eller integrasjon i økosystemet med Google-verktøy er viktigst.

Can Veo 3.1 create vertical videos for TikTok or Shorts?

Ja. Veo 3.1 støtter 9:16-sideforhold som standard.

What should I do if Veo 3.1 generation fails or produces poor results?

Reduser kompleksiteten i prompter, forenkle kamerainstruksjoner og iterer på prompter.

Is Veo 3.1 suitable for commercial marketing videos and ads?

Ja. Den egner seg godt for merkevareinnhold, produktvideoer og kampanjer i sosiale medier.

Is there a free trial for Veo 3.1 API in CometAPI?

Nye brukere vil motta en gratis nøkkel, og API-prisen vil fortsatt være 20 % av den offisielle prisen.

Claude Opus 5 is now live on CometAPI →

Veo 3.1

Per sekund:$0.32

Utgitt:May 31, 2026

Veo 3.1 er en flaggskipmodell for AI-basert videogenerering, utviklet for filmiske resultater av høy kvalitet med innebygd lydsynkronisering. Den leverer realistiske bevegelser, høy visuell kvalitet og tett samstemt lyd- og bildegenerering for profesjonell videoproduksjon.

Populær

Kommersiell bruk

Playground for Veo 3.1

Utforsk Veo 3.1's Playground — et interaktivt miljø for å teste modeller og kjøre spørringer i sanntid. Prøv prompts, juster parametere og iterer umiddelbart for å akselerere utvikling og validere brukstilfeller.

Tekniske spesifikasjoner for Veo 3.1

Element	Veo 3.1 (offentlige spesifikasjoner)
Offisiell modell-ID	veo-3.1-generate-001
Leverandør	Google DeepMind / Google Cloud
Modelltype	Tekst-til-video og bilde-til-video-generering
Inndatatyper	Tekstprompter, bildeinput, første-bilde + siste-bilde-veiledning
Utdata	AI-generert video
Støttede oppløsninger	720p og 1080p, 4K
Støttede sideforhold	16:9 og 9:16
Støttet bildefrekvens	24 FPS
Videovarighet	4 s, 6 s eller 8 s klipp (modusavhengig)
Promptspråk	Engelsk
Videoer per forespørsel	Opptil 4
API-ratebegrensning	Opptil 50 forespørsler/minutt/prosjekt
Støttede distribusjoner	Vertex AI, Gemini-økosystemintegrasjoner, Flow
Ikke-støttede funksjoner (off. docs)	Dynamisk delt kvote, noen arbeidsflyter med referansebilder, innebygd videoutvidelse i standard API-flyt

Hva er Veo 3.1?

Veo 3.1 er Googles flaggskipfamilie for generative videomodeller, med fokus på filmatisk videokvalitet, sterkere etterlevelse av prompter, bedre scenekonsistens og multimodale arbeidsflyter for videoproduksjon. Den går utover standard tekst-til-video-generering ved å støtte bildeveiledet generering og ramme-kontrollert historiefortelling. Offisiell støtte omfatter tekst-til-video, bilde-til-video, prompt-omskriving og arbeidsflyter for generering av første/siste bilde.

Kjernefunksjoner

Veo 3.1 fokuserer på praktiske funksjoner for innholdsproduksjon:

Innebygd lydgenerering (dialog, omgivelseslyd, SFX) integrert i utdata. Veo 3.1 genererer innebygd lyd (dialog + omgivelse + SFX) justert til den visuelle tidslinjen; modellen tar sikte på å bevare leppesynk og lyd–bilde-samsvar for dialog og scenesignaler.
Lengre utdata (støtte for opptil ~60 sekunder / 1080p versus Veo 3s svært korte klipp, 8 s), og flerprompt, flershot-sekvenser for narrativ kontinuitet.
Scene Extension og First/Last Frame-moduser som forlenger eller interpolerer opptak mellom nøkkelbilder.
Objektinnsetting og (kommer) objektfjerning samt redigeringsprimitiver i Flow.

Hver av punktene over er utformet for å redusere manuelt VFX-arbeid: lyd og scenekontinuitet er nå førsteklasses utdata fremfor ettertanke.

Tekniske detaljer (modellatferd og inndata)

Modellfamilie og varianter: Veo tilhører Googles Veo-3-familie; forhåndsvisningsmodellen er typisk veo3.1-pro; veo3.1 (CometAPI doc). Den aksepterer tekstprompter, bildereferanser (enkeltbilde eller sekvenser) og strukturerte flerpromptoppsett for flershot-generering.

Oppløsning og varighet: Forhåndsvisningsdokumentasjon beskriver utdata i 720p/1080p med alternativer for lengre varigheter (opptil ~60 s i enkelte forhåndsvisningsinnstillinger) og høyere detaljtrohet enn tidligere Veo-varianter.

Sideforhold: 16:9 (støttet) og 9:16 (støttet, unntatt i noen referansebilde-flyter).

Promptspråk: Engelsk (forhåndsvisning).

API-begrensninger: Typiske forhåndsvisningsgrenser inkluderer maks 10 API-forespørsler/min per prosjekt, maks 4 videoer per forespørsel, og videolengder som kan velges blant 4, 6 eller 8 sekunder (referansebilde-flyter støtter 8 s).

Referanseytelse

Googles interne og offentlig oppsummerte evalueringer rapporterer sterk preferanse for Veo 3.1s utdata på tvers av sammenligninger gjort av menneskelige vurderere på metrikker som promptsamsvar, visuell kvalitet og lyd–bilde-koherens (tekst→video og bilde→video-oppgaver).

Veo 3.1 oppnådde state-of-the-art-resultater i interne sammenligninger gjort av menneskelige vurderere på tvers av flere objektive dimensjoner — total preferanse, promptsamsvar (tekst→video og bilde→video), visuell kvalitet, lyd–video-samsvar og “visuelt realistisk fysikk” — på benchmark-datasett som MovieGenBench og VBench.

Begrensninger og sikkerhetshensyn

Begrensninger:

Artefakter og inkonsistens: Til tross for forbedringer kan visse lyssettinger, finmasket fysikk og komplekse okklusjoner fortsatt gi artefakter; bilde→video-konsistens (særlig over lange varigheter) er forbedret, men ikke perfekt.
Feilinformasjon / deepfake-risiko: Rikere lyd + objektinnsetting/fjerning øker misbruksrisikoen (realistisk falsk lyd og forlengede klipp). Google nevner avbøtende tiltak (policy, sikringstiltak), og tidligere Veo-lanseringer refererte vannmerking/SynthID for å støtte proveniens; tekniske sikringer eliminerer likevel ikke misbruksrisiko.
Kostnads- og gjennomstrømningsbegrensninger: Høyoppløselige, lange videoer er beregningsmessig kostbare og for tiden begrenset i en betalt forhåndsvisning — forvent høyere ventetid og kostnad sammenlignet med bildemodeller. Fellesskapsposter og Google-forumtråder diskuterer tilgjengelighetsvinduer og fallback-strategier.

Sikkerhetskontroller: Veo 3.1 har integrerte innholdspolicyer, vannmerking/SynthID-signalisering i tidligere Veo-utgaver, og tilgangskontroller i forhåndsvisning; kunder rådes til å følge plattformens policy og implementere menneskelig gjennomgang for høyrisiko-utdata.

Praktiske brukstilfeller

Rask prototyping for kreative: storyboard → flershot-klipp og animatics med innebygd dialog for tidlig kreativ gjennomgang.
Markedsføring og kortformat-innhold: 15–60 s produktspots, sosiale klipp og konsept-teasere der fart er viktigere enn perfekt fotorealisme.
Bilde→video-tilpasning: gjøre illustrasjoner, karakterer eller to rammer om til jevne overganger eller animerte scener via First/Last Frame og Scene Extension.
Verktøyforbedring: integrert i Flow for iterativ redigering (objektinnsetting/fjerning, lysforhåndsinnstillinger) som reduserer manuelle VFX-runder.

Sammenligning med andre ledende modeller

Veo 3.1 vs Veo 3 (forgjengeren): Veo 3.1 fokuserer på forbedret promptsamsvar, lydkvalitet og flershot-konsistens — inkrementelle, men virkningsfulle oppdateringer som tar sikte på å redusere artefakter og forbedre redigerbarhet.

Veo 3.1 vs OpenAI Sora 2: Kompromisser rapportert i pressen: Veo 3.1 vektlegger lengre narrativ kontroll, integrert lyd og Flow-redigeringsintegrasjon; Sora 2 (i presse-sammenligninger) fokuserer på andre styrker (hastighet, andre redigeringspipeliner). TechRadar og andre medier omtaler Veo 3.1 som Googles målrettede konkurrent til Sora 2 for narrativ og lengre video-støtte. Uavhengig side-om-side-testing er fortsatt begrenset.

Kapasitet	Veo 3.1	Sora 2	Runway Gen-4 / Gen-4.5
Innfødt vertikal utdata	Ja	Begrenset arbeidsflytstøtte	Ja
Bilde-til-video	Ja	Ja	Ja
Fokus på lydintegrasjon	Sterk	Moderat	Moderat
Rammebetingelse	Ja	Ja	Delvis
Optimalisering for sosiale videoer	Sterk	Moderat	Sterk
API-økosystemintegrasjon	Google-økosystem	OpenAI-økosystem	Skaperverktøy-økosystem

Hvordan bruker jeg Veo 3.1 API med CometAPI?

Opprett en CometAPI-nøkkel
Velg veo-3.1-generate-001 som modellendepunkt
Send prompt- eller bildeinndata gjennom video-genererings-API-et
Poll resultater og hent genererte videoer
Iterer prompter for kamerabevegelse, scenekontinuitet og konsistensforbedringer

FAQ

Priser for Veo 3.1

Utforsk konkurransedyktige priser for Veo 3.1, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Veo 3.1 kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

Veo Video Generation Pricing

Pricing (Per Second)

Model	720p	1080p	4K
`veo3`	$0.32	$0.32	$0.48
`veo3-fast`	$0.08	$0.096	$0.24
`veo3.1`	$0.32	$0.32	$0.48
`veo3.1-fast`	$0.08	$0.096	$0.24

💡 Billed per second. Total cost = price per second × video duration (seconds).

Eksempelkode og API for Veo 3.1

Få tilgang til omfattende eksempelkode og API-ressurser for Veo 3.1 for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til Veo 3.1 i prosjektene dine.

POST

/v1/videos

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

cURL Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Versjoner av Veo 3.1

Grunnen til at Veo 3.1 har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.

Modell-ID	beskrivelse	Tilgjengelighet	Forespørsel
veo3.1-all	Teknologien som brukes er uoffisiell, og genereringen er ustabil osv.	✅	Chat format
veo3.1	Anbefalt, peker til den nyeste modellen	✅	Asynkron generering