Spécifications techniques de Gemini 3.1 Flash Image Preview
| Élément | Gemini 3.1 Flash Image Preview |
|---|---|
| Fournisseur | |
| Famille de modèles | Gemini 3.1 (niveau Flash) |
| Objectif principal | Génération multimodale rapide avec aperçu d’image |
| Types d’entrée | Texte, Image |
| Types de sortie | Texte, Image (génération d’aperçu) |
| Fenêtre de contexte | Jusqu’à 1M de jetons (standard du niveau Flash Gemini 3.x) |
| Niveau de latence | Faible latence, haut débit |
| Prise en charge du streaming | Oui |
| Appel d’outils | Oui (framework d’outils Gemini API) |
| Version | 3.1 |
Qu’est-ce que Nano Banana 2
Nano Banana 2 est le surnom populaire utilisé par la presse et la communauté des développeurs pour le nouveau modèle Gemini-3.1-Flash-Image. Google le présente comme le moteur d’images de niveau « Flash » qui apporte une fidélité visuelle quasi Pro à un niveau de latence et de coût bien inférieur — adapté à la génération à grand volume, aux éditions itératives rapides et aux workflows produits intégrés dans les services Google. Il hérite des capacités de raisonnement multimodal de Gemini 3.1 et ajoute des capacités centrées sur l’image (texte lisible dans les images, composition multi‑images, prise en charge de rapports d’aspect étendus, 4K native).
Principales fonctionnalités
- Génération haute vitesse et multi‑résolution : vitesse de niveau Flash avec options de sorties 0.5K / 1K / 2K / 4K et nouveaux rapports d’aspect extrêmes (1:4, 4:1, 1:8, 8:1).
- Ancrage Web en temps réel : intègre les résultats de recherche texte et image pour arrimer le contenu généré aux informations Web actuelles lorsque « Thinking » ou l’ancrage via la recherche est activé. Utile pour des références à jour et des infographies factuelles.
- Rendu de texte amélioré : meilleur rendu des textes courts et graphiques (polices, tailles) que les modèles Flash précédents ; encore imparfait sur les longs paragraphes/les très petits textes.
- Édition multi‑entrées et workflows multi‑tours : prise en charge avancée de la combinaison de plusieurs images en entrée et des éditions itératives sur plusieurs tours.
📊 Performances de benchmark — Génération et édition d’images (scores Elo)
| Capacité | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Texte vers image — Préférence globale | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Texte vers image — Qualité visuelle | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Texte vers image — Infographies (factualité) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Édition — Général | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Édition — Personnage | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Édition — Créatif | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Édition — Objet/Environnement | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Édition — Multi‑entrées | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Édition — Stylisation | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Points clés à retenir de ce tableau de benchmarks :
- Sur les catégories de génération texte‑vers‑image et d’édition d’images, Gemini 3.1 Flash Image mène régulièrement ou égalise les meilleurs scores parmi les modèles d’images de niveau Flash et de nombreux concurrents.
- Le modèle montre des résultats particulièrement solides sur les benchmarks de Qualité visuelle et Infographies (factualité) — indiquant qu’il excelle non seulement en qualité esthétique mais aussi dans le rendu de contenus structurellement corrects.
- En édition Multi‑entrées, Nano Banana 2 montre également une généralisation robuste, avec des scores supérieurs à ceux de sa génération Flash précédente.
Ces évaluations sont réalisées via des comparaisons Elo côte à côte par des évaluateurs humains sur un ensemble varié de benchmarks, reflétant à la fois la préférence et la fidélité sur des tâches courantes de génération/édition d’images.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modèle | Positionnement | Benchmark représentatif/notes |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Niveau Flash : vitesse + haute qualité visuelle (2K–4K) | Préférence globale 1079.0 ± 7.0 ; qualité visuelle 1140 ± 6.0 (GenAI-Bench interne). |
| Gemini 2.5 Flash Image (Nano Banana) | Version Flash antérieure (fidélité plus faible) | Scores de préférence/visuels légèrement inférieurs à 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Niveau Pro : fidélité perçue supérieure pour les tâches complexes, coût/latence plus élevés | Arbitrages différents ; certaines métriques montrent des classements relatifs différents sur des tâches spécialisées. |
| GPT-Image 1.5 / autres modèles commerciaux | Concurrents (ouverts/fermés) | Dans les benchmarks internes de Google, GPT-Image et d’autres ont obtenu des scores inférieurs à Gemini 3.1 en qualité visuelle et préférence globale dans l’évaluation rapportée. Les comparaisons indépendantes de tiers varient. |
Quand choisir Flash Image Preview :
- Aperçu d’image en temps réel dans les applications
- Génération d’images à grande échelle sensible aux coûts
- Assistants de conception interactifs
Comment accéder à Nano Banana 2 et l’intégrer
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Récupérez la clé API d’authentification de l’interface. Cliquez sur « Ajouter un jeton » dans la section des jetons API du centre personnel, obtenez la clé de jeton : sk-xxxxx, puis validez.
Étape 2 : Envoyer des requêtes à l’API Nano Banana 2
Sélectionnez le point de terminaison « gemini-3.1-flash-image-preview8 » pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site Web. Notre site propose également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre véritable clé CometAPI de votre compte. Où l’appeler : Génération d’images Gemini
Nano Banana 2 prend en charge l’édition d’images, la génération d’images et les workflows multi‑images. Pour l’édition d’images, vous devez fournir l’URL de l’image à modifier. Pour plus de paramètres, veuillez consulter la documentation.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir le résultat généré. Après traitement, l’API renvoie le statut de la tâche et les données de sortie. Vous pouvez télécharger directement l’image sur votre machine locale dans le playground (habituellement au format PNG). Une URL d’image est générée au cours du processus d’API ; veuillez la télécharger rapidement.