Google lanceert de Imagen 4, Imagen 4 Ultra en Veo 3 modellen op Google I/O 2025

CometAPI
AnnaMay 18, 2025
Google lanceert de Imagen 4, Imagen 4 Ultra en Veo 3 modellen op Google I/O 2025

Google staat op het punt zijn volgende generatie generatieve AI-modellen te onthullen:Afbeelding 4, Afbeelding 4 Ultraen Veo 3—tijdens de jaarlijkse Google I/O-ontwikkelaarsconferentie op 20 mei 2025Vroege lekken van preview-identifiers (bijv. imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) signaleren een gefaseerde uitrol en meerdere capaciteitsniveaus in zowel beeld- als videosynthesedomeinen. Imagen 4 streeft naar aanzienlijke verbeteringen in fotorealisme, promptgetrouwheid en stilistische consistentie ten opzichte van Imagen 3, terwijl de "Ultra"-variant mogelijk een nog hogere resolutie of gespecialiseerde prestatiemodi biedt. Wat video betreft, belooft Veo 3 een coherentere clip-tot-clip continuïteit en robuuste stijlgetrouwheid in vergelijking met Veo 2. Alle drie de modellen zullen naar verwachting nauw integreren met Google's Gemini AI-ecosysteem, waardoor naadloze overgangen van tekstprompts naar afbeeldingen of video's binnen dezelfde workflow mogelijk zijn.


Preview-identificatiegegevens en uitrolstrategie

Gefaseerde previews: interne referenties zoals

  • imagen-4.0-generate-preview-05-20
  • imagen-4.0-ultra-generate-exp-05-20
  • veo-3.0-generate-preview

Google lanceert de Imagen 4, Imagen 4 Ultra en Veo 3 modellen op Google I/O 2025
Google lanceert de Imagen 4, Imagen 4 Ultra en Veo 3 modellen op Google I/O 2025

Zijn opgedoken in codeopslagplaatsen en API-voorbeelden, wat aangeeft dat Google van plan is om zowel standaard- als 'Ultra'-prestatieniveaus aan te bieden voor het genereren van afbeeldingen, evenals een geavanceerde preview van het videomodel voor vroege testers.

Google I/O-lancering:

Deze identificatiegegevens suggereren sterk dat Google ontwikkelaars op I/O-evenementen zal laten zien en mogelijk preview-toegang zal verlenen. 20 mei 2025, een weerspiegeling van eerdere uitrol voor Imagen 3 en Veo 2.


Wat is er nieuw in Imagen 4

Fotorealisme en getrouwheid

  • Verbeterde renderingImagen 4 zou naar verluidt meer fotorealistische details bereiken, artefacten verminderen en de kleurnauwkeurigheid verbeteren. Vroege geruchten suggereren verbeteringen in het begrijpen van complexe signalen, zoals genuanceerde belichting of reflecties.
  • Snelle naleving:Van het model wordt verwacht dat het de instructies van de gebruiker nauwkeuriger opvolgt en afbeeldingen levert die beter aansluiten bij zowel de inhoudelijke als de stijlrichtlijnen (bijvoorbeeld 'olieverfschilderij van zonsondergang over bergen').

Stijlconsistentie

  • Multi-afbeeldingscohesie:Imagen 4 is ontworpen om een ​​consistente visuele stijl te behouden in meerdere uitkomsten, wat van pas komt bij gebruiksscenario's zoals storyboarding of het maken van productcatalogi, waarbij uniformiteit van cruciaal belang is.
  • Ultra-variant:De “Ultra”-laag (imagen‑4.0‑ultra) biedt waarschijnlijk uitvoer met een hogere resolutie of gespecialiseerde optimalisaties (bijvoorbeeld ultrahoge betrouwbaarheid voor gedrukte media) voor zakelijke en creatieve professionals.

Wat is er nieuw in Veo 3

Verbeterde coherentie

  • Clip-to-Clip continuïteit:Veo 3 heeft als doel videosequenties te genereren waarin opeenvolgende shots een consistente kadrering, belichting en karakteruitstraling behouden, waarmee de beperkingen van Veo 2 met betrekking tot visuele drift na verloop van tijd worden aangepakt.
  • Stijlgetrouwheid:Het model richt zich op het nauwkeuriger nabootsen van artistieke of filmische stijlen, waardoor het gemakkelijker wordt om video's in de gewenste esthetiek te produceren (bijvoorbeeld noir, pastelanimatie).

Integratie van SynthID-watermerken

  • Digitale watermerken:Veo 2 maakt gebruik van de SynthID-technologie van DeepMind (geïntroduceerd met Veo 3) en zal onmerkbare watermerken invoegen om door AI gegenereerde content te identificeren en misbruik tegen te gaan.

Integratie met Gemini AI

  • Naadloze toegang:Zowel Imagen 4 als Veo 3 zullen naar verwachting direct toegankelijk zijn via de Gemini-interfaces van Google, waardoor gebruikers afbeeldingen of video's kunnen genereren binnen chatgebaseerde prompts of via productinterfaces zoals Google Photos en Google Slides.
  • Tweelingen edelstenen:Op maat gemaakte AI-'Gems' kunnen deze modellen bevatten, waardoor gebruikers gespecialiseerde assistenten kunnen creëren (bijvoorbeeld een Gem voor reisplanning die afbeeldingen van routes en overzichtsvideo's genereert) en deze kunnen delen op een marktplaats die vergelijkbaar is met de GPT Store van ChatGPT.

Beschikbaarheid en volgende stappen

Public Preview:Ontwikkelaars en enterprise-testers kunnen vanaf nu uitnodigingen ontvangen om te experimenteren met Imagen 4 (standaard en Ultra) en Veo 3. 20 mei 2025 op Google I/O, met een bredere uitrol naar Labs en Vertex AI in de komende weken.

Feedback en iteratieNet als bij eerdere lanceringen zal Google waarschijnlijk om feedback van gebruikers vragen om de veiligheidsfilters, de robuustheid van watermerken en de prestatie-optimalisaties te verfijnen voordat de app algemeen beschikbaar wordt.

Bekijk deze ruimte: geïnteresseerde ontwikkelaars moeten de KomeetAPI.

De nieuwe model-API zal worden vermeld op CometAPI en belooft lagere prijzen dan die van Google om uw integratie te vergemakkelijken. Blijf opletten. API-document.

Lees Meer

500+ modellen in één API

Tot 20% korting