Veo 3.1 kommer: Jeg ser er Googles familie af AI-videogenereringsmodeller (Veo 3 / Veo 3 Fast er aktuelle). Google har for nylig udsendt store Veo 3-forbedringer (lodret 9:16, 1080p, Veo 3 Fast, lavere priser), og der er rygter / sociale opslag at Veo 3.1 er nært forestående — men Google har ikke har endnu ikke udgivet en officiel Veo 3.1-udgivelsesbulletin. Jeg vil liste bekræftede fakta, sandsynlige/forventede ændringer og en direkte sammenligning med OpenAI's. Sora 2.
Hvad Jeg ser is
Jeg ser er Googles serie af generative videomodeller (DeepMind / Google Cloud / Gemini-familien), der omdanner tekst eller billeder til korte videoer – og (i Veo 3) genererer lyd direkte (lydeffekter, omgivende lyd og dialog). Det tilbydes på Google Cloud (Vertex AI / Gemini API) til udviklere og virksomheder og inkluderer indbyggede proveniens-/SynthID-vandmærker på output.
Hvad Veo 3 allerede bragt
- Tekst → video og billede → video funktioner (herunder forhåndsvisning af billede-til-video).
- Generering af native lyde (musik, omgivende lyde, dialog) — Veo 3 introducerede førsteklasses lyd.
- To varianter: Veo 3 af høj kvalitet og Jeg ser 3 Fast (optimeret for hastighed/iteration).
- Platform tilgængelighed: gjort tilgængelig i Vertex AI / Gemini API (betalt forhåndsvisning → opdateringer om generel tilgængelighed i midten af 2025).
- Sikkerhed/herkomst: SynthID-vandmærkning og nogle generationsbrugskontroller/godkendelse til generering af personer/underordnede.
Så – hvad er Veo 3.1 forventes at bringe?
Status: Der er i øjeblikket ingen officiel Veo 3.1-produktside fra Google, der beskriver de fulde udgivelsesnoter. Flere Google-udviklerindlæg/fællesskabsindlæg og tweets indikerer dog en kortsigtet trinvis opdatering (mærket "Veo 3.1"), der forventes at fokusere på iterative forbedringer af lyd, kvalitet og formatunderstøttelse snarere end en komplet omskrivning af den nye generation.
Her er nogle konklusioner, jeg har draget baseret på x's indlæg og Veo3's egenskaber:
- Forbedret native lyd (dialog, læbesynkronisering med flere stemmer) —renere dialog, bedre SFX-mixning og spatialisering). Veo 3 genererer allerede lyd indbygget; Veo 3.1 kunne forbedre dialogrealismen og sprogunderstøttelsen for at matche de seneste forbedringer, som konkurrenterne leverer.
- Hurtigere/billigere ruter for nogle almindelige output (mere Veo 3 Fast paritet og optimeringer).
- Forbedret billed-→videokvalitet og bedre karakter-/positurkonsistens i klip med flere billeder.
- Udvidede billedformater/opløsningskontroller (mere fleksibelt 9:16/16:9 og 1080p på tværs af konfigurationer). Google har allerede tilføjet lodret + 1080p; Veo 3.1 kunne udvide disse kontroller.
- Længere klip / afslappet 8-sekunders hætte — efterspørgsel fra fællesskabet og Googles tidligere roadmap antyder, at øget varighed er et sandsynligt mål (Veo 3 er i dag optimeret til 8-sekunders klip).
- Bedre billed-→-videokvalitet og udvidet billed-til-video-understøttelse (forbedringer af realisme, bevægelseskontinuitet), der bygger på billede→video-forhåndsvisningen i Veo 3.

Sammenlign Veo 3 / (forventet) Veo 3.1 → OpenAI Sora 2
Primært fokus
- **Veo 3 (Google)**Korte 8-sekunders videoer i høj kvalitet fra tekst-/billedprompts; native lyd; integreret i Gemini/Gemini API og Vertex AI; optimeret til produktionsbrug og integration med udvikler-API.
- **Sora 2 (OpenAI)**OpenAIs flagskibsmodel inden for video+lyd, der lægger vægt på fysisk realisme, sammenhængende bevægelse, synkroniseret dialog og lyd, og en tilhørende social app (Sora) med et cameo/samtykkesystem til integration af brugerbilleder og med stærkt fokus på realisme og sikkerhedskontroller.
Styrker
- **Veo (nu)**Stærk integration mellem udviklere og virksomheder (Vertex AI, Gemini API), prismuligheder for produktion, klar vej for cloud-kunder, vertikal/1080p + hurtig variant. God til virksomheder, der bygger ind i pipelines.
- Sora 2Bemærkelsesværdig fysisk nøjagtighed og multimodal synkronisering (dialog + visuelle elementer) og en forbrugerrettet app integreret med sociale arbejdsgange (cameo-funktion, moderering). Fantastisk til skabere, der ønsker realistiske fortællende scener og et app-økosystem.
Sådan får du adgang til Veo nu – og hvordan du bliver klar til Veo 3.1
- **Prøv i Gemini (forbruger / web / mobil)**Veo-generering vises i Gemini-apps (tryk på "video"-funktionen i promptlinjen). Adgangsniveauet (Pro/Ultra) påvirker, hvilke Veo-varianter du kan bruge.
- Programmatisk / virksomhedsbaseret: brug API in CometAPI (Veo-model-ID'er er tilgængelige i modeldokumentationen). CometAPI leverer veo3-pro, veo3-fast og veo3. For detaljer, se venligst Veo 3 's dock.
Praktisk tip (udvikler): for at anmode om lodret output, skal du indstille aspectRatio parameter (f.eks. "9:16") og tjek modelkonfigurationen (Veo 3 vs. Veo 3 Fast) og din plan for opløsningsgrænser (720p vs. 1080p).
Sådan får du adgang til Sora 2 (i dag)
Sora-appen: Sora 2 blev lanceret med en Sora-app (udrulning med begrænset adgang via invitationer i USA og Canada ved lanceringen). OpenAI indikerede bredere adgang og API-udvidelse senere. Hvis du vil prøve Sora 2 nu, kan du tjekke CpmetAPI'erne. Sora 2 side. CometAPI har allerede understøttet sora 2 API og genererer sociale klip på ~10 sekunder med vægt på bevægelsesrealisme for folk.
Kom godt i gang
CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, formatering af anmodninger og svarhåndtering forenkler CometAPI dramatisk integrationen af AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.
Udviklere kan få adgang Veo 3.1 API gennem Comet API, den nyeste modelversion opdateres altid med den officielle hjemmeside. For at begynde, udforsk modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.
Klar til at gå? → Tilmeld dig CometAPI i dag !
