Google s'apprête à dévoiler ses modèles d'IA génératifs de nouvelle génération.Image 4, Imagen 4 Ultraet Véo 3—lors de sa conférence annuelle des développeurs Google I/O le 20 mai 2025. Fuites précoces d'identifiants d'aperçu (par exemple, imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) signalent un déploiement progressif et plusieurs niveaux de capacités dans les domaines de la synthèse d'images et de vidéos. Imagen 4 vise à offrir des gains significatifs en termes de photoréalisme, de fidélité des invites et de cohérence stylistique par rapport à Imagen 3, tandis que la variante « Ultra » pourrait offrir une résolution encore plus élevée ou des modes de performance spécialisés. Côté vidéo, Veo 3 promet une continuité clip à clip plus cohérente et une adhésion au style robuste par rapport à Veo 2. Les trois modèles devraient s'intégrer étroitement à l'écosystème Gemini AI de Google, permettant des transitions fluides des invites textuelles aux images ou vidéos au sein du même flux de travail.
Identifiants d'aperçu et stratégie de déploiement
Aperçus mis en scène : références internes telles que
imagen-4.0-generate-preview-05-20imagen-4.0-ultra-generate-exp-05-20veo-3.0-generate-preview


Ils sont apparus dans les référentiels de code et les aperçus d'API, indiquant l'intention de Google d'offrir des niveaux de performance standard et « Ultra » pour la génération d'images, ainsi qu'un aperçu avancé du modèle vidéo pour les premiers testeurs.
Lancement de Google I/O :
Ces identifiants suggèrent fortement que Google présentera et accordera potentiellement un accès préliminaire aux développeurs lors de l'I/O sur 20 mai 2025, reflétant les déploiements précédents pour Imagen 3 et Veo 2.
Quoi de neuf dans Imagen 4
Photoréalisme et fidélité
- Rendu amélioréImagen 4 offrirait des détails photoréalistes plus précis, réduisant les artefacts et améliorant la précision des couleurs. Les premières rumeurs suggèrent une meilleure compréhension des signaux complexes, tels que les nuances d'éclairage ou les reflets.
- Adhésion rapide:Le modèle est censé suivre les instructions de l'utilisateur avec plus de précision, en fournissant des images qui correspondent mieux aux directives de contenu et de style (par exemple, « peinture à l'huile d'un coucher de soleil sur les montagnes »).
Cohérence du style
- Cohésion multi-images:Imagen 4 est conçu pour maintenir un style visuel cohérent sur plusieurs sorties, ce qui profite aux cas d'utilisation tels que le storyboard ou la création de catalogues de produits, où l'uniformité est essentielle.
- Ultra Variante:Le niveau « Ultra » (imagen-4.0-ultra) offre probablement des sorties à plus haute résolution ou des optimisations spécialisées (par exemple, ultra-haute fidélité pour les supports imprimés) pour les entreprises et les professionnels de la création.
Quoi de neuf dans Veo 3
Cohérence améliorée
- Continuité clip à clip: Veo 3 vise à générer des séquences vidéo où les prises de vue successives maintiennent un cadrage, un éclairage et une apparence des personnages cohérents, répondant aux limitations de Veo 2 concernant la dérive visuelle au fil du temps.
- Fidélité du style:Le modèle se concentre sur la réplication plus fidèle des styles artistiques ou cinématographiques, ce qui facilite la production de vidéos dans une esthétique souhaitée (par exemple, noir, animation pastel).
Intégration du filigrane SynthID
- Watermarking numérique:En s'appuyant sur la technologie SynthID de DeepMind (introduite avec Veo 2), Veo 3 intégrera des filigranes imperceptibles pour aider à identifier le contenu généré par l'IA et à limiter les abus.
Intégration avec Gemini AI
- Accès transparent:Imagen 4 et Veo 3 devraient être directement accessibles via les interfaces Gemini de Google, permettant aux utilisateurs de générer des images ou des vidéos dans des invites basées sur le chat ou via des interfaces de produits comme Google Photos et Google Slides.
- Gemmes Gémeaux:Les « Gems » d'IA personnalisés peuvent intégrer ces modèles, permettant aux utilisateurs de créer des assistants spécialisés (par exemple, un Gem de planification de voyage qui génère des images d'itinéraire et des vidéos d'aperçu) et de les partager sur un marché similaire au GPT Store de ChatGPT.
Disponibilité et prochaines étapes
Public Preview:Les développeurs et les testeurs d'entreprise peuvent recevoir des invitations pour expérimenter Imagen 4 (standard et Ultra) et Veo 3 à partir de 20 mai 2025 à Google I/O, avec un déploiement plus large vers Labs et Vertex AI dans les semaines suivantes.
Commentaires et itérations:Comme pour les lancements précédents, Google sollicitera probablement les commentaires des utilisateurs pour affiner les filtres de sécurité, la robustesse du filigrane et les optimisations des performances avant la disponibilité générale.
Surveillez cet endroit: les développeurs intéressés doivent surveiller le API Comet.
La nouvelle API de modèle sera référencée sur CometAPI et promet des prix inférieurs à ceux de Google pour faciliter votre intégration. Veuillez rester attentifs. API doc.
