Spécifications techniques — Gemini 3.1 Pro
| Élément | gemini-3-pro (résumé public) |
|---|---|
| Fournisseur | |
| ID de modèle canonique | gemini-3-pro (aperçu public) |
| Types d’entrée | Texte, image, vidéo, audio, PDF |
| Types de sortie | Texte (langage naturel, sorties structurées, charges utiles d’appels de fonction) |
| Limite de jetons en entrée (contexte) | 1,048,576 jetons |
| Limite de jetons en sortie | 65,536 jetons |
| Appel de fonctions / utilisation d’outils | Pris en charge (appel de fonctions, sorties structurées, intégrations d’outils) |
| Multimodalité | Prise en charge multimodale complète (images, vidéo, audio, documents) |
| Exécution de code et flux pilotés par des agents | Pris en charge (mode agent, assistance au code, orchestration d’outils) |
| Date limite de connaissances | janvier 2025 |
Qu'est-ce que Gemini 3.1 Pro ?
Gemini 3.1 Pro est le fleuron public de Google au sein de la famille Gemini 3, positionné comme un modèle de raisonnement multimodal de pointe avec des outils avancés pour les agents et les développeurs. Le modèle met l’accent sur une gestion de contexte à haute capacité (entrées de plus de 1M de jetons), une large prise en charge des médias (images, vidéo, audio, PDF) et des intégrations poussées pour l’utilisation d’outils, les appels de fonction et les workflows centrés sur le code (p. ex., Gemini Code Assist et des modes agent).
Gemini 3 Pro est présenté par Google comme optimisé à la fois pour les expériences interactives des développeurs (codage à faible latence et workflows d’agents) et pour une compréhension multimodale de haute fidélité (interprétation et raisonnement à travers des entrées média mixtes).
Principales fonctionnalités de Gemini 3.1 Pro
Gemini-3.1 Pro (via son aperçu) introduit les fonctionnalités suivantes :
Intégration multimodale
Traite des entrées issues :
- Langage naturel
- Images
- Parole/audio
- Vidéo
avec une représentation unifiée en jetons pour le raisonnement intermodal.
Fenêtre de contexte étendue
Une capacité de contexte exceptionnellement grande, jusqu’à ~1 million de jetons, permet de traiter :
- De longs documents
- Synthèse multi-documents
- Des bases de code et des transcriptions.
Cela dépasse de nombreux modèles concurrents qui prennent généralement en charge ~32 K–262 K jetons.
Mise à l’échelle Sparse Mixture-of-Experts (MoE)
Le routage MoE clairsemé permet de mettre à l’échelle la capacité interne du modèle sans coûts de calcul proportionnels, améliorant le raisonnement à grande échelle.
Raisonnement / planification avancés
Des innovations comme l’entraînement au raisonnement en chaîne (chain-of-thought), l’apprentissage par renforcement à partir de retours humains et des benchmarks spécialisés le rendent performant sur les tâches logiques et mathématiques.
Benchmarks supposés :
AIME 2025 : 100 % (avec exécution de code)
SWE-Bench Verified : 83.9 %
ARC-AGI-2 : 71.8 %
LiveCodeBench Pro : 2844 Elo
Terminal-Bench 2.0 : 63.5 %
MMMLU : 93.6 %
Cas d’usage représentatifs en entreprise
- Pipelines média de bout en bout : Ingérer des vidéos, des transcriptions et des images pour produire, à grande échelle, des résumés synchronisés, des métadonnées et des informations structurées.
- Génération et revue de code à grande échelle : Utiliser dans les IDE et les pipelines CI pour générer automatiquement du code, refactorer des projets multi-fichiers et proposer des suggestions de tests sur de larges bases de code.
- Automatisation pilotée par des agents : Coordonner des agents multi-outils qui interagissent avec des services cloud, des systèmes d’orchestration et des API internes via des appels de fonction structurés.
- Recherche et production de contenu : Rédiger des contenus longs (rapports, livres) combinant texte et multimédia intégré, en préservant les renvois internes.
Comment accéder à l’API Gemini 3.1 Pro
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre CometAPI console. Obtenez la clé API d’identification d’accès de l’interface. Cliquez sur « Add Token » au niveau du jeton API dans le centre personnel, récupérez la clé de jeton : sk-xxxxx et soumettez.
Step 2: Send Requests to Gemini 3.1 Pro API
Sélectionnez le point de terminaison « gemini-3.1-pro » pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site Web. Notre site propose également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle provenant de votre compte. L’URL de base est Gemini Generating Content et Chat.
Insérez votre question ou requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API renvoie l’état de la tâche et les données de sortie.
Voir aussi Gemini 3 Pro API