Google I/O 2025 publie la dernière mise à jour des modèles de la série Gemini 2.5

Lors de la conférence Google I/O 2025, qui s'est tenue à Mountain View, en Californie, les équipes de Google DeepMind et de Google AI ont dévoilé des améliorations significatives apportées à leur série Gemini 2.5 de modèles à langage étendu. Ces mises à jour couvrent à la fois Gémeaux 2.5 Pro et Gémeaux 2.5 Flash Des variantes, intégrant des capacités de raisonnement avancées, une sortie audio native, une prise en charge multilingue, des mesures de sécurité et des gains d'efficacité substantiels, ont été ajoutées. Collectivement, ces améliorations visent à offrir aux développeurs, aux entreprises et aux utilisateurs finaux des services d'IA plus fiables, plus naturels et plus rentables via Google AI Studio, l'API Gemini et Vertex AI.

Améliorations de Gemini 2.5 Pro

Deep Think : Raisonnement multi-hypothèses amélioré

Une fonctionnalité phare de la version 2.5 Pro est Réfléchissez profondément, un mode de raisonnement expérimental qui permet au modèle de générer, comparer et affiner en interne plusieurs solutions avant de produire son résultat final. Les premiers benchmarks démontrent les prouesses de Deep Think : il est en tête de l'examen de mathématiques USAMO 2025, en tête du LiveCodeBench pour le codage de niveau compétition et obtient 84.0 % au test de raisonnement multimodal MMMU.

À partir de ce mois-ci, Deep Think est accessible aux « testeurs de confiance » via l'API Gemini. Google a indiqué avoir besoin de plus de temps pour réaliser des évaluations de sécurité avant de rendre Deep Think plus largement disponible.

Google I/O 2025 publie la dernière mise à jour des modèles de la série Gemini 2.5

Audio natif et dialogue multilingue

S'appuyant sur ses capacités de texte, Gemini 2.5 Pro prend désormais en charge sortie audio native Disponible dans 24 langues, cette fonctionnalité offre une prosodie contextuelle et une inflexion émotionnelle, rendant les interactions avec l'IA plus humaines. Outre l'audio, le système de dialogue du modèle adapte dynamiquement le ton, amplifiant ainsi l'empathie dans les applications de service client et éducatives. Les premières démonstrations comprenaient des conversations vocales en temps réel avec une emphase nuancée et des présentations de code multilingues, soulignant la volonté de Google de mettre en place une IA véritablement conversationnelle.

Sécurité et fiabilité

Les améliorations de sécurité de la version 2.5 Pro visent à atténuer les attaques indirectes par injection de prompts. Le framework mis à jour utilise un nettoyage plus strict des entrées et un filtrage contextuel dynamique, essentiels pour les secteurs réglementés manipulant des données sensibles. Selon le blog des développeurs de Google, ces mesures réduisent la vulnérabilité jusqu'à 40 % lors des évaluations internes des équipes rouges, posant ainsi les bases d'une adoption plus large par les entreprises.

Optimisations Flash Gemini 2.5

Efficacité et rapidité

Gemini 2.5 Flash, le frère optimisé en termes de latence du 2.5 Pro, a été révisé pour 22 % d'efficacité de calcul en plus et des temps de réponse plus rapides. Lors de sa présentation, Demis Hassabis a souligné que Flash « est désormais plus performant dans presque tous les domaines » par rapport à son prédécesseur, avec une préversion disponible pour les développeurs dans Google AI Studio, Vertex AI et l'application mobile Gemini. La disponibilité générale est prévue pour début juin 2025. La dernière version Flash Gemini 2.5 est actuellement disponible. gemini-2.5-flash-preview-05-20 à l'I/O 2025 de Google.

Capacités multimodales étendues

Les versions Flash et Pro partagent de nouvelles capacités de raisonnement multimodal, permettant aux utilisateurs de co-itérer sur du texte, des images, de l'audio et même de la vidéo. Parmi les cas d'utilisation notables présentés lors de la conférence I/O, on peut citer les visualisations fractales générées à partir d'une invite unique et les pipelines « Vidéo vers application d'apprentissage » qui convertissent des vidéos pédagogiques en expériences éducatives interactives.

Mises à jour de l'écosystème des développeurs

Intégration de Google AI Studio

Google AI Studio offre désormais un accès transparent à Gemini 2.5 Pro et Flash. L'éditeur de code natif intègre directement les modèles, permettant aux développeurs de générer des applications web prêtes à la production grâce à de simples invites. Les modèles de démarrage présentent des tâches allant des agents conversationnels avec audio aux tableaux de bord d'analyse de données en temps réel, réduisant ainsi les cycles de prototypage de plusieurs semaines à quelques minutes.

Progrès de l'API Gemini

La API Gémeaux reçu plusieurs mises à jour :

Appel de fonctions simplifié:Les définitions de schéma simplifiées réduisent l’effort d’intégration de 30 %.
Réflexions sur les contrôles budgétaires:Les développeurs peuvent désormais ajuster la profondeur du raisonnement pour les compromis coût-performance.
Flux de travail d'agentic: Les nouveaux points de terminaison prennent en charge l'orchestration d'agents en plusieurs étapes via Projet Mariner, permettant à l'IA d'effectuer de manière autonome jusqu'à 10 tâches liées (par exemple, la récupération de données, la synthèse et la génération de rapports) avec un seul appel.

Disponibilité générale de Gemini Code Assist

Gémeaux 2.5 pouvoirs Assistance au code Gémeaux Pour les particuliers et les intégrations GitHub, désormais disponible gratuitement et en version payante. Cet outil excelle dans la transformation de code, la génération d'interfaces utilisateur front-end et la refactorisation automatisée, répondant aux besoins des programmeurs débutants comme des ingénieurs expérimentés.

Disponibilité et prix

La Série Gemini 2.5 est accessible à tous les clients Google Cloud via Vertex AI, avec des niveaux de performances déterminés par le niveau d'abonnement :

IA Pro (19.99 $/mois) donne accès aux fonctionnalités Flash de Gemini 2.5 et aux fonctionnalités standard de 2.5 Pro.
IA Ultra (249.99 $/mois) débloque Deep Think, le débit prioritaire et la suite complète de capacités multimodales et agentiques, ainsi que des services groupés tels que 30 To de stockage cloud et YouTube Premium.

Conclusion et perspectives

Avec les dernières mises à jour de Gemini 2.5 Pro et de Flash, Google établit une nouvelle référence en matière de raisonnement IA, d'interactivité et de productivité des développeurs. L'évaluation multi-hypothèses de Deep Think, combinée à l'audio natif, aux avancées en matière de sécurité et aux gains d'efficacité, ouvre la voie à des systèmes d'IA plus intelligents, fiables et accessibles. Avec le déploiement de ces modèles en juin, leur intégration à Google AI Studio, à l'API Gemini et à Vertex AI accélérera l'innovation – des assistants de codage plus intelligents aux outils pédagogiques immersifs – transformant ainsi la façon dont les individus et les organisations exploitent l'intelligence artificielle.

Pour commencer

CometAPI fournit une interface REST unifiée qui regroupe des centaines de modèles d'IA, dont la famille Gemini, sous un point de terminaison cohérent, avec gestion intégrée des clés API, des quotas d'utilisation et des tableaux de bord de facturation. Plus besoin de jongler avec plusieurs URL et identifiants de fournisseurs.

Les développeurs peuvent accéder Pré-API Flash Gemini 2.5 (modèle:gemini-2.5-flash-preview-05-20) et API Gemini 2.5 Pro (modèle:gemini-2.5-pro-preview-05-06)etc. à travers API CometPour commencer, explorez les capacités du modèle dans le Playground et consultez le Guide de l'API Pour des instructions détaillées, veuillez vous connecter à CometAPI et obtenir la clé API avant d'y accéder.