Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

CometAPI
AnnaDec 10, 2025
Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

La récente publication de Google Image Flash Gemini 2.5 — surnommée « Nano-Banana » est rapidement devenu la référence en matière de retouche d'images conversationnelle : il assure la cohérence des ressemblances entre les modifications, fusionne proprement plusieurs images et prend en charge les modifications locales très naturelles basées sur des invites. Je vais vous expliquer ci-dessous ce qu'est Nano Banana et comment l'utiliser via Les Gémeaux de Google et par l'intermédiaire d' accès tiers (par exemple, CometAPI), donnez des exemples concrets et du code à intégrer à un projet, et partagez des conseils de développement pour le montage multi-tours, la mise à l'échelle et les invites avancées. J'écris ceci en tant que développeur utilisant quotidiennement des modèles d'images ; considérez ceci comme un guide pratique, avec un peu d'opinion.

Qu'est-ce que Nano-Banana ?

Que signifie réellement « Gemini 2.5 Flash Image / Nano-Banana » ?

Nano-Banane est le surnom / nom de code de la communauté pour Image Flash Gemini 2.5Le dernier modèle de génération et d'édition d'images de Google DeepMind. Conçu pour prompt-first édition (vous lui donnez des instructions en langage naturel) avec une attention particulière sur cohérence des caractères (en gardant la même personne/animal/objet à l'œil nu à travers les modifications), fusion multi-images (fusion d'objets sur des photos sources) et utilisation interactive à faible latence dans des applications comme Gemini et Google AI Studio. Le modèle est disponible via l'API Gemini de Google, AI Studio, et est déjà en cours de mise en avant dans CometAPI.

En tant que développeur, considérez Nano-Banana non pas principalement comme un générateur d'images « à partir de zéro », mais comme un outil hautement performant. assistant de retouche photo et de compositionIl comprend le contenu de votre image, mémorise le sujet d'une modification à l'autre et répond aux instructions en langage naturel de manière à s'adapter à une boucle de conception itérative rapide. Cela le rend particulièrement utile pour les maquettes de produits, les prises de vue cohérentes avec les personnages, les itérations rapides de concepts et les jeux créatifs sociaux.

résumé destiné aux développeurs

  • Nom du modèle: aperçu-de-l'image-flash-gemini-2.5 / image-flash-gemini-2.5.
  • Cohérence et continuité : Nano-Banana conserve les détails des personnages à travers les modifications de manière plus fiable que de nombreux concurrents, ce qui le rend préférable pour les modifications séquentielles et la narration.
  • La vitesse: Les utilisateurs signalent une génération rapide (souvent moins de 10 secondes pour de nombreuses modifications), utile pour les flux de travail itératifs.
  • Conception axée sur l'édition : Alors que de nombreux modèles sont optimisés pour la génération purement textuelle, l'UX et les API de Nano-Banana mettent l'accent sur l'édition (montages en une seule fois, fusion multi-images, transfert de style).

Comment puis-je éditer avec Nano-Banana sur CometAPI ?

CometAPI est une place de marché/wrapper API qui regroupe de nombreux modèles (y compris API d'images Flash Gemini 2.5 (Nano Banana)) derrière un point de terminaison unique compatible OpenAI. Si vous souhaitez prototyper rapidement ou éviter de provisionner des comptes Google Cloud/Vertex pour un premier test, CometAPI est une solution pratique : vous obtenez une clé API, choisissez gemini-2.5-flash-image (ou gemini-2.5-flash-image-preview ), puis envoyez des requêtes à la manière d'une modification d'image de type Chat. CometAPI propose également des exemples et guide pour essayer le modèle.

Pourquoi utiliser CometAPI ?

  • Une clé API pour les gouverner tous — simplifie les tests de plusieurs fournisseurs.
  • Échangez les fournisseurs en production si les prix ou les SLA changent.
  • Utile pour les équipes qui souhaitent un contrôle au niveau du service (limitation du débit, journalisation centralisée).

Comment appeler Nano-Banana (CometAPI) — exemple pratique

Voici un exemple simple. Remplacer YOUR_COMET_KEY et les chemins de fichiers avec les vôtres.

CURL — édition de base (image + invite → image modifiée)

Exemple :

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

**Description :**Tout d’abord, convertissez votre fichier image source en une chaîne Base64 et placez-le dans inline_data.dataDeuxièmement, n'incluez pas de préfixes tels que data:image/jpeg;base64, . La sortie est également située dans candidates.content.parts et comprend:

  • Une partie de texte facultative (description ou invite).
  • La partie image comme inline_data (OÙ data est le Base64 de l'image de sortie).

Si vous souhaitez simplement essayer la retouche d'images sur Nano-Banana, CometAPI offre des crédits gratuits aux nouveaux utilisateurs. Vous pouvez essayer Nano-Banana dans l'aire de jeux ou utiliser l'API Flash Image Gemini 2.5. Si vous souhaitez une utilisation illimitée, vous pouvez bénéficier d'une réduction de 20 % sur le prix Gemini.

Nano-Banana présente plusieurs avantages fondamentaux : une ressemblance cohérente, des modifications locales ciblées via le langage naturel et la fusion multi-images.

Ensuite, je vais vous montrer les avantages de Nano-Banana à travers plusieurs cas d’utilisation, et vous verrez sa magie.

Exemple 1 : Combiner plusieurs images en un seul collage

Télécharger une image :

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Exemple de description d'entrée : Un mannequin pose, adossé à une BMW rose. Elle porte les articles suivants sur fond gris clair. L'alien vert est un porte-clés attaché au sac à main rose. Le mannequin porte également un perroquet rose sur l'épaule. Un carlin est assis à côté d'elle, portant un collier rose et des écouteurs dorés.

Base64 renvoyé reconverti en image :

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Code:

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Remarques : convertissez votre fichier image source en une chaîne Base64 et insérez-le dans inline_data.data (n'incluez pas de préfixes comme data:image/jpeg;base64,).

Analyse de cas d'utilisation : Grâce à la fusion multi-images, les designers peuvent accroître leur créativité. Par exemple, les décorateurs d'intérieur peuvent combiner des images pour obtenir un rendu approximatif de l'effet. Les consommateurs peuvent associer leurs photos de corps entier aux articles qu'ils souhaitent acheter pour les aider à prendre leur décision. Cela peut également servir de référence pour la production d'animations et de bandes dessinées.

Exemple 2 : Modifier les images pour préserver la similarité

Ci-dessous, je vais fournir plusieurs séries d'édition pour tester la nano banane.

Tout d’abord, téléchargez une image :

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

En second lieu, Prompt : Ajoutez un chiot à la pelouse

Sortie:

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Enfin, Prompt : Utilisez l'image de référence du personnage ci-jointe. Préservez le chien. Placez le personnage dans une rue pluvieuse et lumineuse, la nuit. Conservez les traits du visage identiques à ceux de la référence.

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Analyse de cas d'utilisation : On peut constater qu’une cohérence assez élevée est maintenue dans plusieurs cycles de modification d’image.

Exemple 3 : Transfert de style et modification des détails du visage

Télécharger une image :

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Prompt : Affinez légèrement le visage, ajoutez 6 % de grain de film et recadrez à 16:9. Ne modifiez pas les traits du visage. Ajoutez une douce lumière périphérique sur le côté droit.

sortie:

Guide ultime de la nano-banane : comment l'utiliser et obtenir les meilleurs résultats

Autres cas d'utilisation de Nano-Banana

1) Portraits d'entreprise et portraits professionnels

Utilisation : créez rapidement des portraits de marque uniformes (marketing, LinkedIn, biographies d'entreprise). Nano-Banana conserve la fidélité du visage même en changeant de tenue, d'arrière-plan ou d'éclairage.

Invite — tenue + éclairage (modifier)

Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.

Invite — échange d'arrière-plan + retouche

Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.

2) E-commerce et visualisation de produits

Utilisation : placez des produits dans des scènes de style de vie, générez des photos de produits cohérentes sous différents angles ou affichez des variantes de couleurs.

Invite — produit dans la scène (fusion multi-images)

Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.

Invite — variantes de couleurs (modifier)

Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.

3) Contenu social et marketing d'influence

Utilisation : modifications stylistiques rapides, échanges de tenues, superpositions saisonnières ou recadrages multi-formats pour les plateformes sociales.

Invite — modification saisonnière pour le flux et l'histoire

Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.

Prompt — variante promotionnelle stylisée

Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.

4) Cohérence des personnages/actifs de marque (mascottes, personnages récurrents)

Utilisation : garder les logos, mascottes ou personnages visuellement identiques dans toutes les scènes, campagnes ou épisodes.

Invite — application de la feuille de personnage

Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.

5) Réparation et colorisation de photos historiques

Utilisation : restaurer ou coloriser des images d'archives tout en préservant la composition et les détails fins du visage.

Invite — colorier + réparer

Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.

Quelles techniques d’invite avancées augmentent la fiabilité ?

Utilisez le ancres de référence et micro-contraintes

Les ancres de référence sont des informations brèves et vérifiables que vous ajoutez pour réduire toute ambiguïté : noms exacts de vêtements (« blazer bleu marine, veste droite, revers crantés »), références d'éclairage (« éclairage Rembrandt ») ou termes d'appareil photo (« objectif portrait 50 mm, f/2.8 »). Les micro-contraintes indiquent au modèle ce qu'il ne doit pas modifier (par exemple, « ne pas modifier les tatouages ​​sur l'avant-bras droit »). Elles réduisent la liberté du modèle de manière productive et améliorent généralement la fidélité du résultat.

Boucle d'itération : demander, évaluer, affiner

  1. Premier passage : utilisez une invite précise mais concise.
  2. Évaluer les résultats : notez ce que le modèle a mal fait (par exemple, la forme du visage a changé, un accessoire a été perdu).
  3. Correction ciblée : Envoyez une brève invite de suivi faisant référence au résultat précédent (« Conservez tout du dernier résultat, mais conservez la boucle d'oreille gauche d'origine et épaississez les sourcils »). Les capacités d'édition conversationnelle de Nano-Banana vous permettent de récupérer rapidement.

Chaîne d'édition pour les transformations complexes

Pour les modifications importantes, divisez le travail en une chaîne de modifications plus petites plutôt qu'une seule instruction volumineuse. Exemple : (1) changement d'arrière-plan → (2) mise à jour de la tenue → (3) étalonnage → (4) retouche finale. Cela permet de concentrer chaque invite et de réduire les effets croisés inattendus.

Comment structurer les invites pour Nano-Banana ? (Anatomie des invites)

Les bonnes images ont une structure cohérente. Utilisez les éléments suivants : anatomie rapide pour obtenir des résultats précis et reproductibles :

Anatomie rapide (ordre recommandé)

  1. Action / Objectif — que voulez-vous que le modèle fasse do? (par exemple, « Modifiez ce selfie pour créer un portrait professionnel » ou « Générez une photo de style de vie de produit combinant ces deux images »).
  2. Sujets) — Qui ou quoi est représenté sur l'image ? Précisez l'identité, l'âge, le nombre de personnes, les objets, etc.
  3. Attributs — caractéristiques visuelles : vêtements, expressions faciales, couleur des yeux, cheveux, accessoires.
  4. Environnement et éclairage — emplacement, heure de la journée, éclairage d’ambiance, distance focale, conseils d’objectif (« portrait 35 mm »).
  5. Style et finition — style photographique (cinématographique, studio, grain de film, hyperréaliste) ou style artistique (peinture à l'huile, vecteur, bande dessinée).
  6. Contraintes / Sécurité — tout ce qu’il faut éviter (pas de logos, pas de nudité, pas de texte médical).
  7. Jeton de cohérence (facultatif) — courte phrase que vous réutilisez pour maintenir la reconnaissance des caractères dans plusieurs invites (par exemple, « Utiliser la référence de caractère « écharpe Luna » »).

Conseils pour la cohérence des caractères (étapes pratiques)

  • Utiliser une « phrase de référence »: incluez une phrase courte et unique liée au sujet (par exemple, « jeton de personnage : 'Maya-blue-jacket' ») dans chaque invite. Le modèle liera plus efficacement les modifications au même personnage si vous réutilisez cette phrase.
  • Inclure les détails ancrés: spécifiez des caractéristiques distinctives et immuables (par exemple, « cicatrice sur le sourcil gauche, tache de naissance verte sur la joue droite ») afin que le modèle ait des ancrages fixes à maintenir.
  • Maintenir la pose et le cadrage lorsque cela est possible: si vous souhaitez une véritable continuité, gardez l'angle de la caméra/la description de la pose similaire dans toutes les invites.
  • Commencez à partir de la même image originalePour les flux de travail d'édition, fournissez toujours la même image source comme ancre. Lorsque vous devez modifier des photos, incluez l'image d'origine comme entrée supplémentaire et expliquez la transformation.

Quels sont les modes de défaillance courants et comment les corriger ?

Échec : dérive identitaire (le sujet a une apparence différente)

Cause: le modèle a sur-généralisé un style demandé ou a mal interprété une contrainte.
Corrections: ajoutez une clause explicite de « préservation », joignez l'image d'origine comme référence ou effectuez des modifications par étapes plus petites et validez les sorties intermédiaires.

Échec : accessoires ou mains incohérents

Cause: les mains et les petits accessoires sont historiquement délicats pour de nombreux modèles d'image.
Corrections: inclure des micro-contraintes (« conserver la montre au poignet droit »), fournir une référence détaillée en gros plan pour les petits éléments ou exécuter une étape de correction ciblée finale se concentrant uniquement sur l'élément problématique.

Échec : l'éclairage ou les ombres ne semblent pas naturels

Cause: des modifications importantes (échange d'arrière-plan ou rééclairage majeur) peuvent créer des décalages.
Corrections: demandez au modèle de faire correspondre « lumière directionnelle en haut à gauche, ombres douces » ou de fournir l'image de référence d'éclairage souhaitée.

Conclusion

Nano-Banana (Gemini 2.5 Flash Image) représente une avancée notable dans la retouche et la génération d'images grand public : rapide, cohérent et intégré à l'écosystème Gemini et aux outils de sécurité de Google. Les meilleurs résultats sont obtenus grâce à des invites claires et axées sur les tâches, des instructions de préservation explicites pour garantir la cohérence des identités, et des workflows par étapes séparant les aperçus rapides des rendus finaux. À mesure que le modèle et l'écosystème évoluent, les ingénieurs doivent continuer à tester, consigner les résultats et créer des contrôles orientés utilisateur qui rendent l'édition transparente et réversible.

SHARE THIS BLOG

500+ Modèles en Une API

Jusqu'à 20% de réduction