ModellerPriserBedrift
500+ AI-modell API, Alt I Én API. Bare I CometAPI
Modeller API
Utvikler
HurtigstartDokumentasjonAPI Dashbord
Selskap
Om ossBedrift
Ressurser
AI-modellerBloggEndringsloggStøtte
TjenestevilkårPersonvernerklæring
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

Per sekund:$0.05
Veo 3.1 er Googles inkrementell, men betydelig oppdatering av sin Veo-familie for tekst- og bilde→video, som tilfører rikere innebygd lyd, lengre og mer kontrollerbare videoutdata og mer presis redigering og kontroller på scenenivå.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API
Versjoner

Kjernefunksjoner

Veo 3.1 fokuserer på praktiske funksjoner for innholdsskaping:

  • Native lydgenerering (dialog, omgivelseslyd, SFX) integrert i utdataene. Veo 3.1 genererer native lyd (dialog + ambience + SFX) justert mot den visuelle tidslinjen; modellen har som mål å bevare leppe-synkronisering og lyd–bilde-justering for dialog og scenesignaler.
  • Lengre utdata (støtte for opptil ~60 sekunder / 1080p versus Veo 3s svært korte klipp,8s), og flerprompt-multi-shot-sekvenser for narrativ kontinuitet.
  • Scene Extension- og First/Last Frame-moduser som utvider eller interpolerer opptak mellom nøkkelbilder.
  • Objektinnsetting og (kommer) objektsfjerning og redigeringsprimitiver i Flow.

Hver punktliste over er utformet for å redusere manuelt VFX-arbeid: lyd og scenekontinuitet er nå sentrale utdata, ikke noe som legges til i etterkant.

Tekniske detaljer (modellatferd og inndata)

Modellfamilie og varianter: Veo tilhører Googles Veo-3-familie; forhåndsvisningsmodell-ID er typisk veo3.1-pro; veo3.1 (CometAPI doc). Den aksepterer tekstprompter, bildereferanser (enkeltbilde eller sekvenser) og strukturerte flerprompt-oppsett for multi-shot-generering.

Oppløsning og varighet: Forhåndsdokumentasjon beskriver utdata på 720p/1080p med alternativer for lengre varigheter (opptil ~60s i visse forhåndsvisningsinnstillinger) og høyere fidelitet enn tidligere Veo-varianter.

Bildeforhold: 16:9 (støttet) og 9:16 (støttet, unntatt i noen referansebilde-flyter).

Prompt-språk: Engelsk (forhåndsvisning).

API-begrensninger: typiske forhåndsvisningsgrenser inkluderer maks 10 API-forespørsler/min per prosjekt, maks 4 videoer per forespørsel, og videolengder som kan velges blant 4, 6 eller 8 sekunder (referansebilde-flyter støtter 8s).

Benchmark-ytelse

Googles interne og offentlig oppsummerte evalueringer rapporterer sterk preferanse for Veo 3.1-utdata i menneskelige vurderingssammenligninger på mål som tekstsamsvar, visuell kvalitet og audio–visuell sammenheng (tekst→video- og bilde→video-oppgaver).

Veo 3.1 oppnådde state-of-the-art-resultater i interne menneskelige vurderinger på tvers av flere akser — overordnet preferanse, prompt-tilpasning (tekst→video og bilde→video), visuell kvalitet, lyd–video-justering og «visuelt realistisk fysikk» — på benchmarks som MovieGenBench og VBench.

Begrensninger og sikkerhetsbetraktninger

Begrensninger:

  • Artefakter og inkonsistens: til tross for forbedringer kan enkelte lyssettinger, finmasket fysikk og komplekse okklusjoner fortsatt gi artefakter; bilde→video-konsistens (særlig over lange varigheter) er forbedret, men ikke perfekt.
  • Feilinformasjon / deepfake-risiko: rikere lyd + objektinnsetting/fjerning øker misbruksrisiko (realistisk falsk lyd og utvidede klipp). Google viser til tiltak (policy, sikringer) og tidligere Veo-lanseringer refererte til vannmerking/SynthID for å støtte opprinnelsesverifisering; tekniske sikringer eliminerer likevel ikke misbruksrisiko.
  • Kostnads- og gjennomstrømningsbegrensninger: høyoppløselige, lange videoer er beregningsmessig kostbare og for øyeblikket sperret bak en betalt forhåndsvisning — forvent høyere ventetid og kostnad sammenlignet med bildemodeller. Innlegg i miljøet og Google-forumtråder diskuterer tilgjengelighetsvinduer og fallback-strategier.

Sikkerhetskontroller: Veo3.1 har integrerte innholdspolicyer, vannmerking/SynthID-signalisering i tidligere Veo-utgivelser, og forhåndstilgangskontroller; kunder rådes til å følge plattformpolicy og implementere menneskelig gjennomgang for høyrisikoutdata.

Praktiske bruksområder

  • Rask prototyping for kreative: storyboard → multi-shot-klipp og animatics med native dialog for tidlig kreativ gjennomgang.
  • Markedsføring og kortformatinnhold: 15–60s produktspots, sosiale klipp og konseptteasere der tempo er viktigere enn perfekt fotorealisme.
  • Bilde→video-tilpasning: gjøre illustrasjoner, karakterer eller to bilder om til glatte overganger eller animerte scener via First/Last Frame og Scene Extension.
  • Verktøyforsterkning: integrert i Flow for iterativ redigering (objektinnsetting/fjerning, lysforhåndsinnstillinger) som reduserer manuelle VFX-gjennomganger.

Sammenligning med andre ledende modeller

Veo 3.1 vs Veo 3 (forgjenger): Veo 3.1 fokuserer på forbedret etterlevelse av prompt, lydkvalitet og konsistens på tvers av multi-shot — inkrementelle, men virkningsfulle oppdateringer som tar sikte på å redusere artefakter og forbedre redigerbarhet.

Veo 3.1 vs OpenAI Sora 2: avveiinger rapportert i pressen: Veo 3.1 vektlegger lengre narrativ kontroll, integrert lyd og Flow-redigeringsintegrasjon; Sora 2 (i pressesammenligninger) fokuserer på andre styrker (hastighet, ulike redigeringspipeliner). TechRadar og andre medier omtaler Veo 3.1 som Googles målrettede konkurrent til Sora 2 for narrativ og lengre videostøtte. Uavhengig sammenlikning side om side er fortsatt begrenset.

Funksjoner for Veo 3.1

Utforsk nøkkelfunksjonene til Veo 3.1, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for Veo 3.1

Utforsk konkurransedyktige priser for Veo 3.1, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Veo 3.1 kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Eksempelkode og API for Veo 3.1

Få tilgang til omfattende eksempelkode og API-ressurser for Veo 3.1 for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til Veo 3.1 i prosjektene dine.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Versjoner av Veo 3.1

Grunnen til at Veo 3.1 har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
Modell-idbeskrivelseTilgjengelighetPrisForespørsel
veo3.1-allTeknologien som brukes er uoffisiell og genereringen er ustabil osv✅$0.2 / perChat format
veo3.1Anbefales, peker til den nyeste modellen✅$0.4/ perAsynkron generering

Flere modeller

D

Doubao-Seedance-2-0

Per sekund:$0.07
Seedance 2.0 er ByteDances neste generasjons multimodale grunnmodell for video, med fokus på filmisk, fortellende videogenerering med flere klipp. I motsetning til tekst-til-video-demoer med kun ett klipp, vektlegger Seedance 2.0 referansebasert kontroll (bilder, korte klipp, lyd), konsekvent karakter og stil på tvers av klipp, og innebygd lyd-/videosynkronisering — med mål om å gjøre AI-video nyttig for profesjonelle kreative- og previsualiseringsarbeidsflyter.
O

Sora 2

Per sekund:$0.08
Superkraftig videogenereringsmodell med lydeffekter som støtter chatformat.
M

mj_fast_video

Per forespørsel:$0.6
Midjourney-videogenerering
X

Grok Imagine Video

Per sekund:$0.04
Generer videoer fra tekstprompter, animer stillbilder eller rediger eksisterende videoer ved hjelp av naturlig språk. API-et støtter konfigurerbar varighet, sideforhold og oppløsning for genererte videoer — og SDK-en håndterer asynkron polling automatisk.
G

Veo 3.1 Pro

Per sekund:$0.25
Veo 3.1-Pro betegner den avanserte tilgangs-/konfigurasjonsvarianten i Googles Veo 3.1-familie — en generasjon videomodeller for kortformat med lydstøtte som tilfører rikere innebygd lyd, forbedrede kontroller for fortelling/redigering og verktøy for utvidelse av scener.
G

Veo 3 Pro

G

Veo 3 Pro

Per sekund:$0.25
Veo 3 pro betegner den produksjonsklare Veo 3-videomodellopplevelsen (høy kvalitet, integrert lyd og utvidet verktøystøtte)

Relaterte blogger

Kling 3.0 vs. Veo 3.1: Det ultimate KI-videogenerator-oppgjøret i 2026
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs. Veo 3.1: Det ultimate KI-videogenerator-oppgjøret i 2026

Kling 3.0 leder an med innebygd 4K-fortelling med flere opptak og overlegen kamerakontroll. Veo 3.1 utmerker seg med fotorealistisk fysikk, innebygd lydsynkronisering og integrasjon med Google-økosystemet, noe som gjør den ideell for filmatiske eller bedriftsprosjekter. For de fleste brukere avhenger vinneren av prioriteringene: Kling 3.0 for hastighet, konsistens og pris; Veo 3.1 for førsteklasses realisme og lyd.
Jeg finner ingen offisiell referanse til et produkt eller en modell kalt «Google Veo 3.1 Lite» per oktober 2024. Google Veo er derimot Googles generative videomodell som kan lage video fra tekst- og bildeprompter, og den testes/brukes i verktøy som VideoFX og enkelte YouTube-funksjoner. «3.1 Lite» høres ut som en mulig lettvektsvariant (typisk optimalisert for lavere beregningskostnad og raskere forhåndsvisninger), men jeg kan ikke bekrefte at en slik utgave finnes. Kan du dele lenken eller konteksten der du så dette?
Apr 1, 2026
veo-3-1

Jeg finner ingen offisiell referanse til et produkt eller en modell kalt «Google Veo 3.1 Lite» per oktober 2024. Google Veo er derimot Googles generative videomodell som kan lage video fra tekst- og bildeprompter, og den testes/brukes i verktøy som VideoFX og enkelte YouTube-funksjoner. «3.1 Lite» høres ut som en mulig lettvektsvariant (typisk optimalisert for lavere beregningskostnad og raskere forhåndsvisninger), men jeg kan ikke bekrefte at en slik utgave finnes. Kan du dele lenken eller konteksten der du så dette?

Hva er Veo 3.1 Lite? Veo 3.1 Lite er Googles nyeste, kostnadseffektive videogenereringsmodell for utviklere, lansert 31. mars 2026. Den støtter tekst-til-video og bilde-til-video, leverer video med lyd, og er designet for bruk i stor skala. Google sier at den koster mindre enn halvparten av Veo 3.1 Fast samtidig som den beholder samme hastighet, med utdataformater i 16:9 og 9:16 og støtte for 720p/1080p-oppløsning.
Slik får du Grok Imagine gratis: tilgang, priser og alternativer
Mar 25, 2026
grok-imagine-video

Slik får du Grok Imagine gratis: tilgang, priser og alternativer

Grok Imagine Video er ikke gratis på de offisielle xAI/Grok-plattformene per mars 2026 (gratisnivået ble fjernet på grunn av høy etterspørsel og bekymringer om misbruk), men du kan få tilgang til det rimelig — eller med gratis startkreditter — via tredjepartsaggregatorer som CometAPI. CometAPI tilbyr modellen til bare $0.04 per sekund (480p), og nye brukere får ofte $1–$5 i gratis kreditter ved registrering.
Slik redigerer du videoer med Veo 3.1
Mar 5, 2026
veo-3-1

Slik redigerer du videoer med Veo 3.1

Google introduserte offentlig Veo 3.1 (og en Veo 3.1 Fast-variant) i midten av oktober 2025 som en forbedret tekst-til-video-modell som produserer korte videoer med høyere kvalitet.
Hva er vidu Q3? Det er kanskje den beste AI-videomodellen i 2026.
Jan 31, 2026
vidu-q3

Hva er vidu Q3? Det er kanskje den beste AI-videomodellen i 2026.

Vidu Q3 gjorde sitt inntog tidlig i 2026 som et av de tydeligste signalene så langt på at AI-drevet videogenerering er i ferd med å bevege seg fra korte, gimmickpregede klipp mot genuint narrativ historiefortelling med flere innstillinger. I månedene siden den brede lanseringen har Vidu Q3 blitt et fast innslag i innholdsskaperes arbeidsflyter, forskningspilotprosjekter og kommersielle pilotprosjekter — og med god grunn: den presser varighet, audiovisuell integrasjon og sammenheng på tvers av flere innstillinger lenger enn de fleste tidligere modeller, samtidig som den tilbyr et utviklerrettet API for programmatisk bruk.