Spécifications techniques — Gemini 3.1 Pro
| Élément | gemini-3-pro (résumé public) |
|---|---|
| Fournisseur | |
| ID canonique du modèle | gemini-3-pro (aperçu public) |
| Types d’entrée | Texte, image, vidéo, audio, PDF |
| Types de sortie | Texte (langage naturel, sorties structurées, charges utiles d’appel de fonction) |
| Limite de jetons en entrée (contexte) | 1 048 576 jetons |
| Limite de jetons en sortie | 65 536 jetons |
| Appel de fonctions / usage d’outils | Pris en charge (appel de fonctions, sorties structurées, intégrations d’outils) |
| Multimodalité | Prise en charge multimodale complète (images, vidéo, audio, documents) |
| Exécution de code et flux agentiques | Pris en charge (mode agent, assistance au code, orchestration d’outils) |
| Date limite des connaissances | Janvier 2025 |
Qu’est-ce que Gemini 3.1 Pro ?
Gemini 3.1 Pro est le modèle phare public de Google dans la famille Gemini 3, positionné comme un modèle de raisonnement multimodal de pointe avec des capacités avancées en matière d’agents et d’outillage pour développeurs. Le modèle met l’accent sur la gestion de contextes de grande capacité (plus de 1M de jetons en entrée), une large prise en charge des médias (images, vidéo, audio, PDF) et des intégrations poussées pour l’usage d’outils, l’appel de fonctions et les flux de travail centrés sur le code (par ex., Gemini Code Assist et les modes agent).
Gemini 3 Pro est présenté par Google comme optimisé à la fois pour les expériences développeur interactives (codage à faible latence et flux de travail agentiques) et pour une compréhension multimodale haute fidélité (interprétation et raisonnement à travers des entrées multimédias mixtes).
Principales fonctionnalités de Gemini 3.1 Pro
Gemini-3.1 Pro (via son aperçu) introduit les fonctionnalités suivantes :
Intégration multimodale
Traite des entrées de type :
- Langage naturel
- Images
- Parole/audio
- Vidéo
avec une représentation unifiée en jetons pour le raisonnement intermodal.
Fenêtre de contexte étendue
Une capacité de contexte exceptionnellement grande, allant jusqu’à ~1 million de jetons, permet de traiter :
- De longs documents
- La synthèse de multiples documents
- Des bases de code et des transcriptions.
Cela dépasse de nombreux modèles concurrents qui prennent généralement en charge ~32 K–262 K jetons.
Mise à l’échelle par Sparse Mixture-of-Experts (MoE)
Le routage Sparse MoE permet d’augmenter la capacité interne du modèle sans coûts de calcul proportionnels, améliorant le raisonnement à grande échelle.
Raisonnement / planification avancés
Des innovations telles que l’entraînement au chain-of-thought, l’apprentissage par renforcement à partir de retours humains et des benchmarks spécialisés le rendent performant sur les tâches logiques et mathématiques.
Benchmarks supposés :
AIME 2025 : 100 % (avec exécution de code)
SWE-Bench Verified : 83,9 %
ARC-AGI-2 : 71,8 %
LiveCodeBench Pro : 2844 Elo
Terminal-Bench 2.0 : 63,5 %
MMMLU : 93,6 %
Cas d’usage représentatifs en entreprise
- Pipelines média de bout en bout : ingestion de vidéos, de transcriptions et d’images pour produire à grande échelle des résumés synchronisés, des métadonnées et des insights structurés.
- Génération et revue de code à grande échelle : utilisation dans les IDE et les pipelines CI pour générer automatiquement du code, refactoriser des projets multifichiers et produire des suggestions de tests sur de grandes bases de code.
- Automatisation agentique : coordination d’agents multi-outils interagissant avec des services cloud, des systèmes d’orchestration et des API internes via des appels de fonctions structurés.
- Recherche et production de contenu : rédaction de contenus longs (rapports, livres) combinant texte et multimédia intégré avec préservation des références croisées internes.
Comment accéder à l’API Gemini 3.1 Pro
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Obtenez la clé API d’accès à l’interface. Cliquez sur « Add Token » dans la section des jetons API du centre personnel, récupérez la clé de jeton : sk-xxxxx et soumettez-la.
Étape 2 : Envoyer des requêtes à l’API Gemini 3.1 Pro
Sélectionnez le point de terminaison « gemini-3.1-pro » pour envoyer la requête API et définissez le corps de la requête. La méthode de requête et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre véritable clé CometAPI depuis votre compte. L’URL de base est Gemini Generating Content et Chat.
Insérez votre question ou votre demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse API pour obtenir la réponse générée. Après traitement, l’API répond avec le statut de la tâche et les données de sortie.
Voir aussi Gemini 3 Pro API