Google lancerer Imagen 4, Imagen 4 Ultra og Veo 3 modellerne på Google I/O 2025

Google er klar til at afsløre sine næste generations generative AI-modeller—Billede 4, Imagen 4 Ultraog Veo 3—under den årlige Google I/O-udviklerkonference den 20. maj 2025Tidlige lækager af forhåndsvisningsidentifikatorer (f.eks. imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) signalerer en gradvis udrulning og flere funktionsniveauer på tværs af både billed- og videosyntesedomæner. Imagen 4 sigter mod at levere betydelige forbedringer inden for fotorealisme, hurtig gengivelse og stilistisk konsistens i forhold til Imagen 3, mens "Ultra"-varianten muligvis tilbyder endnu højere opløsning eller specialiserede ydeevnetilstande. På videosiden lover Veo 3 mere sammenhængende klip-til-klip-kontinuitet og robust stiloverholdelse sammenlignet med Veo 2. Alle tre modeller forventes at integrere tæt med Googles Gemini AI-økosystem, hvilket muliggør problemfri overgange fra tekstprompter til billeder eller videoer inden for den samme arbejdsgang.

Forhåndsvisning af identifikatorer og udrulningsstrategi

Iscenesatte forhåndsvisninger: Interne referencer som f.eks.

imagen-4.0-generate-preview-05-20
imagen-4.0-ultra-generate-exp-05-20
veo-3.0-generate-preview

Google lancerer Imagen 4, Imagen 4 Ultra og Veo 3 modellerne på Google I/O 2025

Er dukket op i kodelagre og API-forhåndsvisninger, hvilket indikerer Googles intention om at tilbyde både standard- og "Ultra"-ydeevneniveauer til billedgenerering samt en avanceret forhåndsvisning af videomodellen til tidlige testere.

Google I/O-lancering:

Disse identifikatorer tyder stærkt på, at Google vil fremvise og potentielt give forhåndsvisningsadgang til udviklere ved I/O den 20. maj 2025, hvilket afspejler tidligere udrulninger for Imagen 3 og Veo 2.

Nyheder i Imagen 4

Fotorealisme og troskab

Forbedret gengivelseImagen 4 opnår angiveligt større fotorealistiske detaljer, reducerer artefakter og forbedrer farvenøjagtigheden. Tidlige rygter tyder på forbedringer i forståelsen af komplekse prompter, såsom nuanceret belysning eller refleksioner.
Hurtig overholdelseModellen forventes at følge brugerinstruktionerne mere præcist og levere billeder, der bedre matcher både indholds- og stilretningslinjer (f.eks. "oliemaleri af solnedgang over bjerge").

Stilkonsistens

Multi-billedkohæsionImagen 4 er designet til at opretholde en ensartet visuel stil på tværs af flere output, hvilket gavner brugsscenarier som storyboarding eller oprettelse af produktkataloger, hvor ensartethed er afgørende.
Ultravariant"Ultra"-niveauet (imagen-4.0-ultra) tilbyder sandsynligvis output med højere opløsning eller specialiserede optimeringer (f.eks. ultra-høj kvalitet til trykte medier) til virksomheder og kreative fagfolk.

Nyheder i Veo 3

Forbedret sammenhæng

Klip-til-klip-kontinuitetVeo 3 sigter mod at generere videosekvenser, hvor successive optagelser opretholder ensartet komposition, belysning og karakterudseende, og dermed imødegå begrænsninger i Veo 2 omkring visuel drift over tid.
StiltroskabModellen fokuserer på at genskabe kunstneriske eller filmiske stilarter mere naturtro, hvilket gør det nemmere at producere videoer i en ønsket æstetik (f.eks. noir, pastel animation).

Integration af SynthID-vandmærkning

Digital vandmærkeVed at udnytte DeepMinds SynthID-teknologi (introduceret med Veo 2) vil Veo 3 integrere umærkelige vandmærker for at hjælpe med at identificere AI-genereret indhold og begrænse misbrug.

Integration med Gemini AI

Problemfri adgangBåde Imagen 4 og Veo 3 forventes at være direkte tilgængelige via Googles Gemini-grænseflader – hvilket gør det muligt for brugerne at generere billeder eller videoer i chatbaserede prompts eller via produktgrænseflader som Google Fotos og Google Slides.
Gemini ædelsteneTilpassede AI-"Gems" kan inkorporere disse modeller, hvilket giver brugerne mulighed for at oprette specialiserede assistenter (f.eks. en rejseplanlægnings-Gems, der genererer rejseplanbilleder og oversigtsvideoer) og dele dem på en markedsplads, der ligner ChatGPTs GPT Store.

Tilgængelighed og næste trin

Public PreviewUdviklere og virksomhedstestere kan modtage invitationer til at eksperimentere med Imagen 4 (standard og Ultra) og Veo 3 fra starten. 20. maj 2025 ved Google I/O, med bredere udrulning til Labs og Vertex AI i de følgende uger.

Feedback og iterationLigesom med tidligere lanceringer vil Google sandsynligvis indhente brugerfeedback for at forbedre sikkerhedsfiltre, vandmærkningsrobusthed og ydeevneoptimeringer inden generel tilgængelighed.

Se dette rumInteresserede udviklere bør overvåge CometAPI.

Den nye model-API vil blive listet på CometAPI, og det loves lavere priser end Google for at lette din integration. Fortsæt venligst med at være opmærksom. API-dok.