Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Entrée:$1.5616/M
Sortie:$9.3696/M
Nano Banana Pro est un modèle d’IA destiné à fournir une assistance polyvalente dans des flux de travail centrés sur le texte. Il convient aux prompts de type instruction pour générer, transformer et analyser du contenu avec une structure contrôlable. Les cas d’utilisation typiques incluent les assistants de chat, la synthèse de documents, la question-réponse (QA) basée sur les connaissances et l’automatisation des flux de travail. Les détails techniques publics sont limités ; l’intégration s’aligne sur les schémas courants des assistants d’IA, tels que les sorties structurées, les prompts augmentés par la recherche et l’appel d’outils ou de fonctions.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Fonctionnalités de base

  • Texte → Image : génération entièrement pilotée par prompt avec une forte conformité au prompt.
  • Image → Image (retouches) : retouches fines et ciblées en conservant la cohérence du sujet/personnage sur plusieurs retouches.
  • Résolution de sortie maximale : jusqu’à 4K (les exemples et les tailles exactes prises en charge dépendent du format d’image ; l’API propose des préréglages 1K/2K/4K)
  • Planification itérative et autocorrection : pipeline interne « multi‑étapes » qui détecte et corrige les erreurs visuelles courantes (perspective, texte, géométrie fine).
  • Rendu avancé du texte dans l’image : texte multilingue clair et lisible (des courts libellés aux longs paragraphes), adapté aux posters, maquettes et infographies.
  • 5 personnages et fidélité jusqu’à 14 objets/images de référence au sein d’un même flux.
  • Filigrane / provenance : toutes les images générées incluent un filigrane SynthID ; le modèle intègre des métadonnées C2PA pour la provenance dans certaines intégrations produit.

Versions et dénomination de Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Détails techniques

Architecture

  • Lignée / ossature : Nano Banana Pro est construit sur la pile image Gemini de Google en constante évolution — plus précisément la nouvelle architecture Gemini 3 Pro Image / GEMPIX 2 (un cadre multimodal image+texte de plus grande capacité). Il s’agit d’une évolution de Gemini 2.5 Flash Image (l’« nano‑banana » d’origine) vers un modèle d’image nativement multimodal avec des capacités élargies de raisonnement vision‑langage.
  • Comportement du modèle : multimodalité native (image + texte + connaissances du monde), pipelines explicites pour la fusion multi‑images, et planificateur interne par étapes qui affine les sorties en plusieurs passes plutôt que de produire un seul échantillon statique. Les premiers retours indiquent un raisonnement géométrique/optique plus robuste (verre, réfraction) par rapport aux versions précédentes.
  • Réflexion / raffinement interne : le modèle utilise en interne un processus de « réflexion » pour affiner la composition (la documentation de l’API décrit ce comportement et précise que ces étapes internes ne sont pas facturées comme des jetons d’image finaux).
  • Ancrage & outils : prise en charge de l’ancrage via la recherche (peut incorporer des faits web dans la génération de schémas/infographies). Prend également en charge des instructions système pour un contrôle plus déterministe.

Paramètres clés de l’API :

  • thinking_level (low / high) pour arbitrer entre latence et profondeur de raisonnement ;
  • media_resolution (low/medium/high) pour contrôler les jetons de lecture OCR/détails d’image ;
  • generationConfig.imageConfig pour définir le format d’image/résolution des sorties.

Limites d’image :

  • Modalités d’entrée prises en charge : texte et images (le modèle n’accepte pas l’audio ni la vidéo comme entrées pour la génération d’images).
  • Nombre maximal d’images par prompt : 14 (pour l’aperçu Gemini 3 Pro Image).
  • Taille maximale d’image (envoi) : 7 Mo par image d’entrée.
  • Formats d’image pris en charge : 1:1, 3:2, 16:9, 9:16, 21:9, etc.

Images / jetons de sortie : limites élevées, avec prise en charge du 4K/4096 px.

Performances aux benchmarks

Résumé court : les benchmarks publics/précoces sont pour l’instant surtout qualitatifs/issus de la communauté, mais signalent systématiquement des améliorations substantielles en résolution, réduction des artefacts et fidélité physique par rapport au nano‑banana d’origine (Gemini 2.5 Flash Image). Des « challenges » nommés ont montré des gains visuels clairs, mais il n’existe pas encore de tableaux de benchmarks numériques standardisés (publics) de Google comparant v1 → v2 sur des métriques de génération d’images standard.

  • Tests qualitatifs de la communauté : bords plus nets, micro‑détails plus précis, couleurs plus fidèles et meilleure adhérence au prompt (moins d’objets hallucinés, personnages plus cohérents). Des tests informels populaires incluent le « Wine Glass Test » et le « Glass Burger Challenge », où GEMPIX2 (Nano Banana Pro) gère nettement mieux la transparence et la réfraction que les versions antérieures.
  • Gestion du texte : Nano Banana Pro montre une typographie et un placement du texte visiblement améliorés dans les images (un point faible persistant pour de nombreux modèles d’image). Les comparaisons communautaires indiquent moins de glyphes rendus de manière illisible.
  • Débit / UX : vitesse d’itération plus rapide et une UX qui effectue un raffinement multi‑étapes en back‑end afin que les utilisateurs obtiennent des résultats plus fiables dès le premier passage (réduisant les relances manuelles).

Limitations et risques

  • Filtres de contenu & détection : les plateformes intégrant le modèle (p. ex., Whisk/des apps tierces) peuvent activer une détection stricte des célébrités ou des ressemblances et bloquer certaines sorties, ce qui affecte les workflows créatifs reposant sur des ressemblances réalistes de célébrités.
  • Hallucinations / cas limites de raisonnement : bien que réduites, elles peuvent encore survenir, notamment avec du texte symbolique dense dans les images ou des schémas très techniques — NB2 semble toutefois diminuer ces erreurs par rapport aux versions précédentes.
  • Sécurité & mésusage : les modèles de génération d’images peuvent être utilisés pour créer du contenu problématique ou nuisible. Google applique des contraintes, des filtres de contenu et le filigrane SynthID pour aider à la traçabilité ; néanmoins, des usages abusifs ont eu lieu (controverse très médiatisée liée à une image Nano Banana générée dans un contexte politiquement sensible).

Comparaison de Nano Banana Pro avec d’autres modèles

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — forte intégration mobile, fusion multi‑images, autocorrection itérative, 2K native/4K par suréchantillonnage, intégration étroite dans les apps Google (Search, Photos, Workspace/Gemini). Idéal pour les workflows nécessitant des retouches fiables, de la continuité et une intégration avec les services Google.
  • Midjourney — excelle dans les rendus artistiques stylisés et le prompt engineering communautaire ; pas spécialement ciblé sur la fusion multi‑images photo‑réaliste ni sur des pipelines d’édition multimodaux profonds.
  • Stable Diffusion / poids ouverts — totalement ouvert, hautement personnalisable et hébergeable localement ; l’écosystème de checkpoints et d’affinage est un atout décisif pour la recherche et l’usage hors‑ligne. Moins d’intégration mobile « en un clic » et moins de cohérence d’édition multi‑images prête à l’emploi que Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — récemment positionné explicitement comme concurrent de Nano Banana, mettant l’accent sur un rendu ultra‑rapide, des sorties 2K et la prise en charge de nombreuses images de référence (jusqu’à six). Positionné comme une alternative pro/créateurs.

(Ces comparaisons sont de haut niveau ; choisissez l’outil en fonction de votre workflow : ouverture/personnalisation → Stable Diffusion ; art stylisé → Midjourney ; édition mobile intégrée et cohérente avec itération agressive → famille Nano Banana Pro/Gemini 3 Pro Image.)

Cas d’usage réels

  • Retouche photo mobile & filtres créatifs (intégrations Google Photos — restylage, fusion d’arrière‑plan, recomposition de portraits).
  • Contenus marketing & publicitaires — génération rapide de concepts, personnages de marque cohérents sur plusieurs plans/angles.
  • Concept art & storyboard — la fusion multi‑images aide à conserver la continuité des personnages entre les panneaux.
  • E‑commerce / maquettes produit — générer des visuels produit cohérents dans différents contextes/éclairages.
  • Prototypage rapide pour assets AR/VR — sorties 2K/4K de haute qualité pouvant être suréchantillonnées pour des usages immersifs.
  • Comment accéder à l’API gemini-3-pro-image (Nano Banana Pro)

Étapes requises

  • Connectez‑vous à cometapi.com. Si vous n’êtes pas encore utilisateur, inscrivez‑vous d’abord.
  • Obtenez la clé d’API (identifiant d’accès) de l’interface. Cliquez sur « Add Token » dans la section API token de votre centre personnel, récupérez la clé de jeton : sk-xxxxx et validez.
  • Récupérez l’URL de ce site : https://api.cometapi.com/

Méthode d’utilisation

  1. Sélectionnez le point de terminaison “gemini-3-pro-image” pour envoyer la requête API et définissez le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site. Notre site propose également des tests Apifox pour votre commodité.
  2. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle depuis votre compte.
  3. Insérez votre question ou demande dans le champ content — c’est à cela que le modèle répondra.
  4. Traitez la réponse de l’API pour obtenir la sortie générée.

CometAPI fournit une API REST entièrement compatible — pour une migration sans friction. Détails clés :

  • URL de base : https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Noms de modèle : gemini-3-pro-image
  • Authentification : en‑tête Bearer YOUR_CometAPI_API_KEY
  • Content-Type : application/json .

FAQ

Can Gemini 3 Pro Image generate 4K resolution images?

Oui, Nano Banana Pro (Gemini 3 Pro Image) prend en charge une sortie native jusqu'en 4K avec des rapports d'aspect incluant 1:1, 3:2, 16:9, 9:16 et 21:9. Il prend également en charge des préréglages 1K et 2K via le paramètre imageConfig.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro propose un rendu de texte avancé dans l'image, avec un texte clair et lisible et une prise en charge multilingue — de courtes légendes à de longs paragraphes. Cela le rend idéal pour des affiches, des infographies, des maquettes d'interface (UI) et des supports marketing.

Can I edit images conversationally with Gemini 3 Pro Image?

Oui, Nano Banana Pro prend en charge l'édition conversationnelle multi-tours. Il suffit de demander des modifications telles que 'Mets un coucher de soleil en arrière-plan' et le modèle conserve le contexte visuel entre les tours grâce aux Thought Signatures.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excelle dans l'auto-correction itérative, la préservation cohérente des personnages à travers de multiples modifications, et une intégration étroite à l'écosystème Google. Il gère jusqu'à 14 images de référence pour des flux de travail de fusion multi-image complexes.

Does Nano Banana Pro use Google Search for grounded image generation?

Oui, Nano Banana Pro peut utiliser l'ancrage via la recherche pour vérifier les faits avant de générer des images. Par exemple, il peut récupérer des données météo actuelles pour créer une infographie météo de Tokyo précise.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro prend en charge jusqu'à 14 images d'entrée par invite, avec un maximum de 7MB par image. Il maintient la cohérence des sujets et des personnages jusqu'à 5 personnages dans des scénarios de fusion multi-image complexes.

Fonctionnalités pour Nano Banana Pro

Découvrez les fonctionnalités clés de Nano Banana Pro, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.

Tarification pour Nano Banana Pro

Découvrez des tarifs compétitifs pour Nano Banana Pro, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Nano Banana Pro peut améliorer vos projets tout en maîtrisant les coûts.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Exemple de code et API pour Nano Banana Pro

Accédez à des exemples de code complets et aux ressources API pour Nano Banana Pro afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Nano Banana Pro dans vos projets.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Versions de Nano Banana Pro

La raison pour laquelle Nano Banana Pro dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.
ID du modèleDescriptionDisponibilitéRequête
nano-banana-pro-allLa technologie utilisée est non officielle et la génération est instable, etc., format Chat✅Chat format
gemini-3-pro-imageRecommandé, pointant vers le modèle le plus récent✅Gemini génère une image
gemini-3-pro-image-previewAperçu officiel✅Gemini génère une image

Plus de modèles