Google skal avduke neste generasjons generative AI-modeller –Bilde 4, Imagen 4 Ultraog Veo 3– under den årlige Google I/O-utviklerkonferansen den 20. mai 2025Tidlige lekkasjer av forhåndsvisningsidentifikatorer (f.eks. imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) signaliserer en trinnvis utrulling og flere funksjonsnivåer på tvers av både bilde- og videosyntesedomener. Imagen 4 tar sikte på å levere betydelige gevinster innen fotorealisme, rask gjengivelse og stilistisk konsistens i forhold til Imagen 3, mens «Ultra»-varianten kan tilby enda høyere oppløsning eller spesialiserte ytelsesmoduser. På videosiden lover Veo 3 mer sammenhengende klipp-til-klipp-kontinuitet og robust stiltilpasning sammenlignet med Veo 2. Alle tre modellene forventes å integreres tett med Googles Gemini AI-økosystem, noe som muliggjør sømløse overganger fra tekstmeldinger til bilder eller videoer i samme arbeidsflyt.
Forhåndsvisningsidentifikatorer og utrullingsstrategi
Etappede forhåndsvisninger: Interne referanser som
imagen-4.0-generate-preview-05-20imagen-4.0-ultra-generate-exp-05-20veo-3.0-generate-preview


Har dukket opp i kodelagre og API-forhåndsvisninger, noe som indikerer Googles intensjon om å tilby både standard og "Ultra" ytelsesnivåer for bildegenerering, samt en avansert forhåndsvisning av videomodell for tidlige testere.
Google I/O-lansering:
Disse identifikatorene tyder sterkt på at Google vil vise frem og potensielt gi forhåndsvisningstilgang til utviklere ved I/O den 20. mai 2025, som speiler tidligere utrullinger for Imagen 3 og Veo 2.
Hva er nytt i Imagen 4
Fotorealisme og gjengivelse
- Forbedret gjengivelseImagen 4 skal visstnok oppnå større fotorealistiske detaljer, redusere artefakter og forbedre fargenøyaktigheten. Tidlige rykter tyder på forbedringer i forståelsen av komplekse instruksjoner, som nyansert belysning eller refleksjoner.
- Rask overholdelseModellen forventes å følge brukerinstruksjonene mer presist, og levere bilder som bedre samsvarer med både innholds- og stilretningslinjer (f.eks. «oljemaleri av solnedgang over fjell»).
Stilkonsistens
- FlerbildekohesjonImagen 4 er designet for å opprettholde en konsistent visuell stil på tvers av flere utganger, noe som er gunstig for bruksområder som storyboarding eller produktkatalogutvikling, der ensartethet er avgjørende.
- Ultravariant«Ultra»-nivået (imagen-4.0-ultra) tilbyr sannsynligvis utskrifter med høyere oppløsning eller spesialiserte optimaliseringer (f.eks. ultrahøy kvalitet for trykte medier) for bedrifter og kreative fagfolk.
Hva er nytt i Veo 3
Forbedret sammenheng
- Klipp-til-klipp-kontinuitetVeo 3 har som mål å generere videosekvenser der påfølgende opptak opprettholder konsistent komposisjon, belysning og karakterutseende, og adresserer begrensninger i Veo 2 rundt visuell drift over tid.
- StiltroskapModellen fokuserer på å gjenskape kunstneriske eller filmatiske stiler mer naturtro, noe som gjør det enklere å produsere videoer i en ønsket estetikk (f.eks. noir, pastell animasjon).
Integrering av SynthID-vannmerking
- Digital vannmerkeVed å utnytte DeepMinds SynthID-teknologi (introdusert med Veo 2), vil Veo 3 innebygge umerkelige vannmerker for å identifisere AI-generert innhold og begrense misbruk.
Integrasjon med Gemini AI
- Sømløs tilgangBåde Imagen 4 og Veo 3 forventes å være direkte tilgjengelige via Googles Gemini-grensesnitt – slik at brukere kan generere bilder eller videoer i chatbaserte forespørsler eller gjennom produktgrensesnitt som Google Foto og Google Presentasjoner.
- Gemini edelstenerTilpassede AI-«Gems» kan innlemme disse modellene, slik at brukere kan opprette spesialiserte assistenter (f.eks. en reiseplanleggings-Gems som genererer reiserutebilder og oversiktsvideoer) og dele dem på en markedsplass som ligner på ChatGPTs GPT Store.
Tilgjengelighet og neste trinn
Public PreviewUtviklere og bedriftstestere kan motta invitasjoner til å eksperimentere med Imagen 4 (standard og Ultra) og Veo 3 fra og med 20. mai 2025 på Google I/O, med bredere utrulling til Labs og Vertex AI i de påfølgende ukene.
Tilbakemelding og iterasjonSom med tidligere lanseringer vil Google sannsynligvis be om tilbakemeldinger fra brukere for å forbedre sikkerhetsfiltre, vannmerkingens robusthet og ytelsesoptimaliseringer før generell tilgjengelighet.
Se dette rommetInteresserte utviklere bør overvåke CometAPI.
Den nye modell-API-en vil bli oppført på CometAPI, og det er lovet lavere priser enn Google for å legge til rette for integreringen. Fortsett å følge med. API-dok.
