Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Entrée:$1.60/M
Sortie:$9.60/M
Contexte:200.0k
Sortie maximale:200.0k
Gemini 3 Pro Preview est un modèle polyvalent de la famille Gemini, disponible en préversion pour l’évaluation et le prototypage. Il prend en charge le suivi d’instructions, le raisonnement multi‑tours et des tâches de code et de données, avec des sorties structurées et des appels d’outils et de fonctions pour l’automatisation des flux de travail. Les cas d’usage typiques incluent des assistants de chat, la synthèse et la réécriture, les questions‑réponses augmentées par la recherche, l’extraction de données et une assistance légère au codage dans des applications et des services. Les points forts techniques incluent un déploiement via API, des réponses en streaming, des contrôles de sécurité et une préparation à l’intégration, avec des capacités multimodales selon la configuration de la préversion.
Aperçu
Playground
Fonctionnalités
Tarification
API
Versions

Gemini 3 Pro (Preview) est le tout dernier modèle phare de raisonnement multimodal de Google/DeepMind au sein de la famille Gemini 3. Il est présenté comme leur « modèle le plus intelligent à ce jour », conçu pour le raisonnement profond, les workflows agentiques, le coding avancé et la compréhension multimodale en long contexte (texte, images, audio, vidéo, code et intégrations d’outils).

Fonctionnalités clés

  • Modalités : Texte, image, vidéo, audio, PDF (et sorties d’outils structurées).
  • Agentique/outillage : Appels de fonctions intégrés, recherche en tant qu’outil, exécution de code, contexte d’URL, et prise en charge de l’orchestration d’agents multi‑étapes. Un mécanisme de « thought‑signature » préserve le raisonnement multi‑étapes entre les appels.
  • Coding et « vibe coding » : Optimisé pour la génération front‑end, la création d’UI interactives et le coding agentique (il domine les classements pertinents rapportés par Google). Présenté comme leur modèle de « vibe coding » le plus performant à ce jour.
  • Nouveaux contrôles développeur : thinking_level (low|high) pour arbitrer coût/latence vs profondeur de raisonnement, et des contrôles media_resolution pour régler la fidélité multimodale par image ou par frame vidéo. Ces contrôles aident à équilibrer performances, latence et coût.

Performances sur benchmarks

  • Gemini3Pro a obtenu la première place sur LMARE avec un score de 1501, dépassant les 1484 points de Grok-4.1-thinking et devançant également Claude Sonnet 4.5 et Opus 4.1.
  • Il a également pris la première place dans l’arène de programmation WebDevArena avec un score de 1487.
  • Sur Humanity’s Last Exam (raisonnement académique), il a atteint 37,5 % (sans outils) ; sur GPQA Diamond (sciences), 91,9 % ; et dans la compétition MathArena Apex (mathématiques), 23,4 %, établissant un nouveau record.
  • En capacités multimodales, MMMU-Pro a atteint 81 % ; et en compréhension vidéo sur Video-MMMU, 87,6 %.

image

Détails techniques et architecture

  • Paramètre « thinking level » : Gemini 3 expose un contrôle thinking_level permettant d’arbitrer profondeur du raisonnement interne vs latence/coût. Le modèle traite thinking_level comme une allocation relative pour le raisonnement interne multi‑étapes plutôt qu’une garantie stricte de tokens. La valeur par défaut est généralement high pour Pro. C’est un nouveau contrôle explicite pour régler la planification multi‑étapes et la profondeur de chain‑of‑thought.
  • Sorties structurées et outils : Le modèle prend en charge les sorties JSON structurées et peut être combiné avec des outils intégrés (ancrage via Google Search, contexte d’URL, exécution de code, etc.). Certaines fonctionnalités combinant sorties structurées + outils ne sont disponibles qu’en préversion pour gemini-3-pro-preview.
  • Intégrations multimodales et agentiques : Gemini 3 Pro est explicitement conçu pour des workflows agentiques (outillage + multiples agents sur code/terminaux/navigateur).

Limitations et mises en garde connues

  1. Factualité imparfaite — des hallucinations restent possibles. Malgré les améliorations revendiquées par Google, une vérification ancrée et une revue humaine demeurent nécessaires dans les contextes sensibles (juridique, médical, financier).
  2. Performances sur longs contextes variables selon la tâche. La prise en charge d’une fenêtre d’entrée de 1M est bien présente, mais l’efficacité empirique peut baisser sur certains benchmarks à des longueurs extrêmes (baisses ponctuelles observées à 1M sur certains tests de long contexte).
  3. Arbitrages coût et latence. Les contextes volumineux et des réglages thinking_level plus élevés augmentent le calcul, la latence et le coût ; une tarification par paliers s’applique selon le volume de tokens. Utiliser thinking_level et des stratégies de découpage pour maîtriser les coûts.
  4. Sécurité et filtres de contenu. Google continue d’appliquer des politiques de sécurité et des couches de modération ; certains contenus et actions restent restreints ou déclenchent des modes de refus.

Comment Gemini 3 Pro Preview se compare aux autres modèles de pointe

Comparaison de haut niveau (aperçu → qualitative) :

Contre Gemini 2.5 Pro : Sauts notables en raisonnement, utilisation agentique d’outils et intégration multimodale ; gestion de contexte bien plus large et meilleure compréhension des contenus longs. DeepMind montre des gains constants sur le raisonnement académique, le coding et les tâches multimodales.

Contre GPT-5.1 et Claude Sonnet 4.5 (selon les rapports) : Sur le panel de benchmarks de Google/DeepMind, Gemini 3 Pro est présenté comme en tête sur plusieurs métriques agentiques, multimodales et de long contexte (voir Terminal-Bench, MMMU-Pro, AIME). Les résultats comparatifs varient selon la tâche.


Cas d’utilisation typiques et à forte valeur

  • Résumé de grands documents/livres et Q&R : la prise en charge de longs contextes le rend attractif pour les équipes juridiques, de recherche et de conformité.
  • Compréhension et génération de code à l’échelle d’un dépôt : l’intégration aux chaînes d’outils de développement et le raisonnement amélioré aident pour les refactorings de grandes bases de code et les workflows d’automatisation de revue de code.
  • Assistants produit multimodaux : workflows image + texte + audio (support client ingérant des captures d’écran, extraits d’appels et documents).
  • Génération et édition média (photo → vidéo) : des capacités de la famille Gemini antérieure (Veo / Flow) étendues vers des fonctionnalités photo→vidéo ; la préversion suggère une génération multimédia plus poussée pour des prototypes et des workflows média.

Playground pour Gemini 3 Pro Preview

Explorez le Playground de Gemini 3 Pro Preview — un environnement interactif pour tester les modèles et exécuter des requêtes en temps réel. Essayez des invites, ajustez les paramètres et itérez instantanément pour accélérer le développement et valider les cas d'utilisation.

Fonctionnalités pour Gemini 3 Pro Preview

* **ID du modèle (aperçu) :** `gemini-3-pro-preview`. * **Types d'entrée :** Texte, Image, Vidéo, Audio, PDF. Sortie : Texte * **Limites de contexte / de jetons :** Entrée ≈ **1,048,576 jetons** ; Sortie ≤ **65,536 jetons**. * **Date de coupure des connaissances :** **janvier 2025** (utilise Search Grounding pour des informations plus récentes). * **Capacités (sélectionnées) :** appel de fonctions, exécution de code, recherche de fichiers, sorties structurées, Search Grounding. Non pris en charge : génération audio, génération d’images, API en direct, segmentation d’images, Google Maps grounding (certaines fonctionnalités diffèrent de Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Tarification pour Gemini 3 Pro Preview

Découvrez des tarifs compétitifs pour Gemini 3 Pro Preview, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Gemini 3 Pro Preview peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)
Entrée:$1.60/M
Sortie:$9.60/M
Entrée:$2.00/M
Sortie:$12.00/M

Exemple de code et API pour Gemini 3 Pro Preview

Gemini 3 Pro est le tout dernier modèle phare de raisonnement multimodal de Google/DeepMind au sein de la famille Gemini 3. Il est présenté comme leur « modèle le plus intelligent à ce jour », conçu pour le raisonnement approfondi, des flux de travail pilotés par des agents, la programmation avancée et une compréhension multimodale à long contexte (texte, images, audio, vidéo, code et intégrations d’outils).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versions de Gemini 3 Pro Preview

La raison pour laquelle Gemini 3 Pro Preview dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.