Gemini 3 Pro (Preview) est le tout nouveau modèle phare de raisonnement multimodal de Google/DeepMind au sein de la famille Gemini 3. Il est présenté comme leur « modèle le plus intelligent à ce jour », conçu pour le raisonnement profond, des workflows agentiques, le codage avancé et la compréhension multimodale sur de longs contextes (texte, images, audio, vidéo, code et intégrations d’outils).
Fonctionnalités clés
- Modalités : Texte, image, vidéo, audio, PDF (et sorties d’outils structurées).
- Agentique/outillage : Appels de fonctions intégrés, recherche en tant qu’outil, exécution de code, contexte d’URL et prise en charge de l’orchestration d’agents multi-étapes. Un mécanisme de « signature de la pensée » préserve le raisonnement multi-étapes entre les appels.
- Codage et « vibe coding » : Optimisé pour la génération de front-end, la création d’interfaces interactives et le codage agentique (il est en tête des classements pertinents rapportés par Google). Présenté comme leur modèle de « vibe coding » le plus puissant à ce jour.
- Nouveaux contrôles pour développeurs :
thinking_level(low|high) pour arbitrer entre coût/latence et profondeur de raisonnement, etmedia_resolutionqui contrôle la fidélité multimodale par image ou trame vidéo. Ils aident à équilibrer performances, latence et coût.
Performances sur benchmarks
- Gemini3Pro a obtenu la première place sur LMARE avec un score de 1501, dépassant les 1484 points de Grok-4.1-thinking et devançant également Claude Sonnet 4.5 et Opus 4.1.
- Il a également obtenu la première place dans l’arène de programmation WebDevArena avec un score de 1487.
- En raisonnement académique sur Humanity’s Last Exam, il a atteint 37.5 % (sans outils) ; sur GPQA Diamond en sciences, 91.9 % ; et sur la compétition de mathématiques MathArena Apex, 23.4 %, établissant un nouveau record.
- En capacités multimodales, MMMU-Pro a atteint 81 % ; et en compréhension vidéo sur Video-MMMU, 87.6 %.
Détails techniques et architecture
- Paramètre « thinking level » : Gemini 3 expose un contrôle
thinking_levelqui permet aux développeurs d’arbitrer entre profondeur de raisonnement interne et latence/coût. Le modèle traitethinking_levelcomme une marge relative pour le raisonnement interne multi-étapes plutôt qu’une garantie stricte de jetons. La valeur par défaut est généralementhighpour Pro. Il s’agit d’un nouveau contrôle explicite permettant d’ajuster la planification multi-étapes et la profondeur de la chaîne de raisonnement. - Sorties structurées et outils : Le modèle prend en charge des sorties JSON structurées et peut être combiné avec des outils intégrés (ancrage via Google Search, contexte d’URL, exécution de code, etc.). Certaines fonctionnalités combinant sorties structurées et outils ne sont disponibles qu’en préversion pour
gemini-3-pro-preview. - Intégrations multimodales et agentiques : Gemini 3 Pro est explicitement conçu pour des workflows agentiques (outillage + multiples agents sur code/terminaux/navigateur).
Limitations et mises en garde connues
- Factualité imparfaite — des hallucinations restent possibles. Malgré les améliorations substantielles revendiquées par Google, une vérification fondée et une revue humaine restent nécessaires dans les contextes à forts enjeux (juridique, médical, financier).
- Les performances sur longs contextes varient selon la tâche. La prise en charge d’une fenêtre d’entrée de 1M est une capacité ferme, mais l’efficacité empirique peut diminuer sur certains benchmarks à des longueurs extrêmes (des baisses ponctuelles ont été observées à 1M sur certains tests de long contexte).
- Arbitrages coût et latence. Les grands contextes et des réglages de thinking_level plus élevés augmentent le calcul, la latence et le coût ; des paliers de tarification s’appliquent selon les volumes de jetons. Utilisez thinking_level et des stratégies de segmentation pour maîtriser les coûts.
- Sécurité et filtres de contenu. Google continue d’appliquer des politiques de sécurité et des couches de modération ; certains contenus et actions restent restreints ou déclenchent des modes de refus.
Comparaison de Gemini 3 Pro Preview avec les autres modèles de pointe
Comparaison de haut niveau (préversion → qualitative) :
Face à Gemini 2.5 Pro : Améliorations franches du raisonnement, de l’usage d’outils agentiques et de l’intégration multimodale ; gestion de contextes bien plus vastes et meilleure compréhension des formats longs. DeepMind montre des gains constants en raisonnement académique, en codage et sur les tâches multimodales.
Face à GPT-5.1 et Claude Sonnet 4.5 (selon les rapports) : Sur la série de benchmarks de Google/DeepMind, Gemini 3 Pro est présenté comme en tête sur plusieurs métriques agentiques, multimodales et de long contexte (voir Terminal-Bench, MMMU-Pro, AIME). Les résultats comparatifs varient selon la tâche.
Cas d’usage typiques et à forte valeur
- Résumé et questions-réponses sur de grands documents / livres : la prise en charge de longs contextes le rend attractif pour les équipes juridiques, de recherche et de conformité.
- Compréhension et génération de code à l’échelle d’un dépôt : l’intégration aux chaînes d’outils de développement et le raisonnement amélioré facilitent les refactorings de grandes bases de code et les workflows de revue de code automatisée.
- Assistants produit multimodaux : workflows image + texte + audio (support client ingérant des captures d’écran, extraits d’appels et documents).
- Génération et édition de médias (photo → vidéo) : les fonctionnalités antérieures de la famille Gemini incluent désormais des capacités photo→vidéo de type Veo/Flow ; la préversion suggère une génération multimédia plus poussée pour des prototypes et des workflows médias.
Comment accéder à l’API Gemini 3 Pro
Étape 1 : S’inscrire pour obtenir la clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Récupérez la clé API d’identification de l’interface. Cliquez sur « Add Token » dans les jetons API du centre personnel, obtenez la clé de jeton : sk-xxxxx et soumettez.
Étape 2 : Envoyer des requêtes à l’API Gemini 3 Pro
Sélectionnez l’endpoint « gemini-3-pro » pour envoyer la requête API et définir le corps de requête. La méthode et le corps de requête sont disponibles dans la documentation API de notre site. Notre site fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre véritable clé CometAPI de votre compte. L’URL de base est Gemini Generating Content et Chat
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API renvoie l’état de la tâche et les données de sortie.