Google lanserer Imagen 4, Imagen 4 Ultra og Veo 3 på Google I/O 2025

CometAPI
AnnaMay 18, 2025
Google lanserer Imagen 4, Imagen 4 Ultra og Veo 3 på Google I/O 2025

Google skal avduke neste generasjons generative AI-modeller –Bilde 4, Imagen 4 Ultraog Veo 3– under den årlige Google I/O-utviklerkonferansen den 20. mai 2025Tidlige lekkasjer av forhåndsvisningsidentifikatorer (f.eks. imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) signaliserer en trinnvis utrulling og flere funksjonsnivåer på tvers av både bilde- og videosyntesedomener. Imagen 4 tar sikte på å levere betydelige gevinster innen fotorealisme, rask gjengivelse og stilistisk konsistens i forhold til Imagen 3, mens «Ultra»-varianten kan tilby enda høyere oppløsning eller spesialiserte ytelsesmoduser. På videosiden lover Veo 3 mer sammenhengende klipp-til-klipp-kontinuitet og robust stiltilpasning sammenlignet med Veo 2. Alle tre modellene forventes å integreres tett med Googles Gemini AI-økosystem, noe som muliggjør sømløse overganger fra tekstmeldinger til bilder eller videoer i samme arbeidsflyt.


Forhåndsvisningsidentifikatorer og utrullingsstrategi

Etappede forhåndsvisninger: Interne referanser som

  • imagen-4.0-generate-preview-05-20
  • imagen-4.0-ultra-generate-exp-05-20
  • veo-3.0-generate-preview

Google lanserer Imagen 4, Imagen 4 Ultra og Veo 3 på Google I/O 2025
Google lanserer Imagen 4, Imagen 4 Ultra og Veo 3 på Google I/O 2025

Har dukket opp i kodelagre og API-forhåndsvisninger, noe som indikerer Googles intensjon om å tilby både standard og "Ultra" ytelsesnivåer for bildegenerering, samt en avansert forhåndsvisning av videomodell for tidlige testere.

Google I/O-lansering:

Disse identifikatorene tyder sterkt på at Google vil vise frem og potensielt gi forhåndsvisningstilgang til utviklere ved I/O den 20. mai 2025, som speiler tidligere utrullinger for Imagen 3 og Veo 2.


Hva er nytt i Imagen 4

Fotorealisme og gjengivelse

  • Forbedret gjengivelseImagen 4 skal visstnok oppnå større fotorealistiske detaljer, redusere artefakter og forbedre fargenøyaktigheten. Tidlige rykter tyder på forbedringer i forståelsen av komplekse instruksjoner, som nyansert belysning eller refleksjoner.
  • Rask overholdelseModellen forventes å følge brukerinstruksjonene mer presist, og levere bilder som bedre samsvarer med både innholds- og stilretningslinjer (f.eks. «oljemaleri av solnedgang over fjell»).

Stilkonsistens

  • FlerbildekohesjonImagen 4 er designet for å opprettholde en konsistent visuell stil på tvers av flere utganger, noe som er gunstig for bruksområder som storyboarding eller produktkatalogutvikling, der ensartethet er avgjørende.
  • Ultravariant«Ultra»-nivået (imagen-4.0-ultra) tilbyr sannsynligvis utskrifter med høyere oppløsning eller spesialiserte optimaliseringer (f.eks. ultrahøy kvalitet for trykte medier) for bedrifter og kreative fagfolk.

Hva er nytt i Veo 3

Forbedret sammenheng

  • Klipp-til-klipp-kontinuitetVeo 3 har som mål å generere videosekvenser der påfølgende opptak opprettholder konsistent komposisjon, belysning og karakterutseende, og adresserer begrensninger i Veo 2 rundt visuell drift over tid.
  • StiltroskapModellen fokuserer på å gjenskape kunstneriske eller filmatiske stiler mer naturtro, noe som gjør det enklere å produsere videoer i en ønsket estetikk (f.eks. noir, pastell animasjon).

Integrering av SynthID-vannmerking

  • Digital vannmerkeVed å utnytte DeepMinds SynthID-teknologi (introdusert med Veo 2), vil Veo 3 innebygge umerkelige vannmerker for å identifisere AI-generert innhold og begrense misbruk.

Integrasjon med Gemini AI

  • Sømløs tilgangBåde Imagen 4 og Veo 3 forventes å være direkte tilgjengelige via Googles Gemini-grensesnitt – slik at brukere kan generere bilder eller videoer i chatbaserte forespørsler eller gjennom produktgrensesnitt som Google Foto og Google Presentasjoner.
  • Gemini edelstenerTilpassede AI-«Gems» kan innlemme disse modellene, slik at brukere kan opprette spesialiserte assistenter (f.eks. en reiseplanleggings-Gems som genererer reiserutebilder og oversiktsvideoer) og dele dem på en markedsplass som ligner på ChatGPTs GPT Store.

Tilgjengelighet og neste trinn

Public PreviewUtviklere og bedriftstestere kan motta invitasjoner til å eksperimentere med Imagen 4 (standard og Ultra) og Veo 3 fra og med 20. mai 2025 på Google I/O, med bredere utrulling til Labs og Vertex AI i de påfølgende ukene.

Tilbakemelding og iterasjonSom med tidligere lanseringer vil Google sannsynligvis be om tilbakemeldinger fra brukere for å forbedre sikkerhetsfiltre, vannmerkingens robusthet og ytelsesoptimaliseringer før generell tilgjengelighet.

Se dette rommetInteresserte utviklere bør overvåke CometAPI.

Den nye modell-API-en vil bli oppført på CometAPI, og det er lovet lavere priser enn Google for å legge til rette for integreringen. Fortsett å følge med. API-dok.

Les mer

500+ modeller i ett API

Opptil 20 % rabatt