7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

CometAPI
AnnaAug 29, 2025
7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

En tant que créateur d'IA, je suis ravi de vous présenter Nano Banane — le surnom ludique de Image Flash Gemini 2.5 — Le tout nouveau modèle de génération et de retouche d'images haute fidélité de Google. Dans cet article, je vous expliquerai en quoi il consiste, comment l'utiliser (application et API), comment l'utiliser efficacement, je donnerai des exemples concrets, j'inclurai du code prêt à l'emploi et je vous présenterai le processus. sept utilisations créatives et pratiques vous pouvez commencer à postuler dès aujourd'hui.

Qu'est-ce que Gemini 2.5 Flash Image (Nano Banana) ?

Gemini 2.5 Flash Image est un nouveau modèle de génération et d'édition d'images de la famille Gemini. Il étend la famille Gemini 2.5 Flash pour produire et éditer des images (et pas seulement du texte), combinant le raisonnement multimodal, la connaissance du monde et les commandes pilotées par invite de Gemini pour créer ou modifier des images à partir de textes et/ou d'images. L'équipe et la documentation du développeur l'appellent explicitement « Gemini 2.5 Flash Image » et mentionnent son surnom interne. nano-banane.

Lors de l'annonce, le prix publié pour le niveau Gemini 2.5 Flash Image était 30 $ par 1 million de jetons de sortie, avec un exemple de coût par image indiqué comme 1290 jetons de sortie ≈ $0.039 par image. Le modèle est proposé en avant-première (ID développeur/avant-première comme gemini-2.5-flash-image-preview) et est déjà disponible via des partenaires sélectionnés (CometAPI) et les propres plateformes de développement de Google.

Quelles sont les fonctionnalités remarquables de Gemini 2.5 Flash Image ?

Cohérence du caractère et du style entre les modifications

L’une des principales améliorations est cohérence des caractères: le modèle est explicitement optimisé pour préserver la cohérence visuelle d'un sujet (personne, animal ou produit) entre les différentes retouches et les différents contextes, une faiblesse récurrente des modèles d'image antérieurs. Cela améliore les flux de travail nécessitant des ressources de marque cohérentes, des personnages récurrents dans la narration ou des photographies de produits multi-prises générées automatiquement.

Édition localisée et basée sur des invites

Vous pouvez fournir une image et une instruction en langage naturel, comme « enlever la tache sur la chemise », « changer de tenue pour une veste bleue » ou « flouter l'arrière-plan et augmenter la luminosité du sujet », et le modèle effectue des modifications ciblées et locales sans nécessiter de masques manuels dans de nombreux cas. Cela facilite l'édition itérative et conversationnelle.

Fusion multi-images et transfert de style

Gemini 2.5 Flash Image peut prendre plusieurs images et composer Vous pouvez les intégrer dans une scène unique ou transférer le style/la texture d'une image à une autre. Cela permet de réaliser des maquettes de produits (placer un produit dans une scène), de mettre en scène des meubles ou de combiner des images pour le marketing et le e-commerce.

Connaissances du monde autochtone

Parce qu'il est construit sur la famille Gemini, le modèle exploite la connaissance du monde — par exemple, la compréhension des accessoires, des environnements ou des relations d'objets contextuellement correctes — ce qui aide à la construction de scènes réalistes et à des montages sémantiquement cohérents (pas seulement des sorties esthétiquement plausibles).

Faible latence et rentabilité

La famille « Flash » de Gemini vise une faible latence et une utilisation économique par rapport aux niveaux de raisonnement plus importants. L'annonce des développeurs met l'accent sur la vitesse et un rapport qualité/prix avantageux pour de nombreux cas d'utilisation concrets.

Provenance intégrée : filigrane SynthID

Toutes les images créées/éditées avec le modèle incluent un filigrane numérique invisible SynthID afin que les images puissent être vérifiées ultérieurement comme étant générées ou modifiées par l'IA. Cela fait partie des mesures de protection mises en place par Google contre les abus et le suivi de la provenance.

1) Comment puis-je créer un personnage cohérent pour une campagne de bande dessinée ou de marque de longue durée ?

Pourquoi ça marche

Nano Banana a été spécifiquement conçu pour conserver la même apparence de personnage d'un montage à l'autre et dans de nouveaux contextes, ce qui est utile lorsque vous souhaitez que le même visage, la même tenue ou la même mascotte apparaissent dans les épisodes, les vignettes ou les images de héros. Les développeurs appellent cela la « cohérence des personnages ».

Comment inviter

  • Commencez par un bloc descriptif qui capture les caractéristiques d’identité (tranche d’âge, caractéristiques du visage, marques distinctives, éléments vestimentaires).
  • Ajoutez une instruction de « jeton de cohérence » telle que « Utilisez le même caractère dans toutes les sorties — ne modifiez pas les marques d’identification ».
  • Pour les sorties multi-images, fournissez une ou plusieurs images de référence en entrée pour verrouiller la ressemblance.

Comment demander des modifications cohérentes

  • Commencez par décrire les principaux attributs d’identité que vous souhaitez préserver : l’âge, la couleur des cheveux, les traits distinctifs (par exemple, « a un petit grain de beauté sur la joue gauche ») et le style vestimentaire.
  • Utilisez une invite en deux parties lors de l'édition : décrivez d'abord ce que doit restent identiques, puis décrivez le Change Vous voulez. Exemple : « Préserver : femme d’Asie de l’Est de 28 ans, coupe courte au carré noir, petit grain de beauté sur la joue gauche. Modifier : la placer dans un restaurant des années 1970, vêtue d’une veste en cuir rouge, souriante, sous un éclairage tungstène chaleureux. »
  • Lorsque vous effectuez des modifications en plusieurs étapes, incluez un petit jeton de référence comme « (KEEP_ID : A) » dans l'invite et réutilisez-le pour signaler le même sujet dans les invites.

Exemple d'invite

« Créez un portrait photoréaliste de Amina, une romancière graphique de 28 ans avec une coupe courte asymétrique, un grain de beauté en croissant sur la joue gauche, des yeux marron chaleureux et une veste en cuir verte. Conservez les traits distinctifs d'Amina dans les six scènes suivantes : « Amina au café le matin », « Amina dessinant dans le parc », etc. Utilisez la même ressemblance pour chaque scène. »

Extrait de code (Python, générer plusieurs images)

Cet exemple utilise le client API Gemini présenté dans les documents de Google : transmettez votre invite descriptive et vos variantes de scène en boucle.

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()
base_description = (
    "Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
    "crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)

scenes = [
    "Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
    "Amina sketching in the park, windy afternoon, soft bokeh background.",
    # add more scenes...

]

for i, scene in enumerate(scenes, start=1):
    prompt = f"{base_description} Scene: {scene}"
    response = client.models.generate_content(
        model="gemini-2.5-flash-image-preview",
        contents=,
    )
    parts = response.candidates.content.parts
    for part in parts:
        if part.inline_data:
            img = Image.open(BytesIO(part.inline_data.data))
            img.save(f"amina_scene_{i}.png")

2) Comment Nano Banana peut-il accélérer la photographie de produits de commerce électronique et l'imagerie A/B ?

Pourquoi c'est créatif et utile

Les équipes produit consacrent des ressources considérables à la création de multiples plans, configurations d'éclairage et variations (couleurs, arrière-plans). Nano Banana's fusion multi-images et un montage rapide et précis vous permettent de générer rapidement des variantes de produits cohérentes et des composites de style de vie - pour les photos de catalogue, les scènes de style de vie et les ressources sociales - réduisant ainsi le temps d'itération et les coûts de production.

Comment demander des variantes de produits

  • Fournissez une brève spécification du produit (dimensions, matériaux, palette de couleurs) et le style photographique (par exemple, « fond blanc studio, angle de 45°, ombre douce »).
  • Pour les variantes : « Créez 4 variantes de ce casque Bluetooth : noir, rose, gris avec des embouts orange et gris avec des reflets bleus – toutes avec le même éclairage, le même angle de caméra et dans une pièce blanche. »
  • Utilisez la fusion multi-images pour placer le produit dans différentes scènes : « Placez ce sac à dos sur une couverture de pique-nique à l'heure dorée avec une faible profondeur de champ. »

Exemple d'invite (produit)

Image A (référence produit) : sac à dos en cuir haut de gamme. Créez trois variantes de catalogue avec fond blanc – vert forêt, beige, anthracite – prises à 45°, avec une ombre douce et naturelle, et une sensibilité ISO de 100.

Extrait de code : génération rapide de Python (variante de catalogue)

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=,
)

# Save images from response parts (example)

for i, part in enumerate(response.candidates.content.parts):
    if part.inline_data:
        img = Image.open(BytesIO(part.inline_data.data))
        img.save(f"backpack_variant_{i}.png")

Cet extrait reflète le modèle d'utilisation documenté de Google et constitue un bon point de départ pour automatiser la création de variantes de produits.

Image de sortie :

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

3) Comment puis-je créer des illustrations pédagogiques combinant photos et schémas ?

Pourquoi ça marche

Nano Banana s'intègre connaissance du monde (Raisonnement multimodal de Gemini) afin qu'il puisse interpréter des diagrammes dessinés à la main, annoter des images ou créer des visuels explicatifs à partir d'un mélange de photos et d'instructions textuelles - pratique pour l'apprentissage en ligne, les documents techniques et les tuteurs interactifs.

Comment inviter

  • Fournissez des images (par exemple, une photo d’une expérience physique) et une invite telle que « Annotez cette image avec des étiquettes et des flèches qui expliquent les composants clés et créez une deuxième image qui montre le système en coupe transversale. »

Exemple d'invite

Générer quatre éléments d'explication d'image de connaissances : RÉSEAUX NEURONAUX du CERVEAU HUMAIN, PRODUCTION D'ATP de la RESPARATION CELLULAIRE, CODE GÉNÉTIQUE de la DOUBLE HÉLICE d'ADN, PHOTOSTHYSSS des PLANTES de CHLOROLPAST

Image de sortie :

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

4) Comment puis-je transformer de vraies photos en variantes marketing de marque (tenue, éclairage, arrière-plan) ?

Pourquoi ça marche

Le modèle prend en charge transformation ciblée et des modifications locales exprimées en langage naturel : changer une tenue, ajuster l'éclairage, remplacer l'arrière-plan ou supprimer des objets, tout en préservant l'identité du sujet et le réalisme général. Cela permet des variantes marketing rapides (tenues saisonnières, scènes localisées).

Comment inviter

  • Fournissez la photo originale en entrée.
  • Demandez modifications ciblées avec des instructions explicites, par exemple : « Remplacez la veste par un caban en laine rouge, changez l'arrière-plan en rue de la ville au crépuscule, ajoutez une lumière de contour chaude. »

Exemple d'invite

« À partir de la photo téléchargée, remplacez la veste en jean bleue par un caban en laine rouge sur mesure, définissez l'arrière-plan sur une rue de la ville en début de soirée avec un léger bokeh et ajoutez un éclairage de contour doux pour séparer le sujet de l'arrière-plan. »

Allusions

  • Si vous avez besoin d’un contrôle itératif, faites des montages multi-tours : demandez un premier montage, puis affinez (« retirez le chapeau », « réchauffez maintenant la température de couleur »).

5) Comment les équipes de création d'animation et de prévisualisation peuvent-elles prototyper des scènes et des storyboards ?

Pourquoi c'est utile

Les réalisateurs et directeurs de la photographie peuvent prototyper rapidement les configurations d'éclairage, les costumes et le cadrage des caméras. Nano Banana peut produire des storyboards avec des personnages cohérents, ce qui facilite la planification et la prévisualisation. ()

H3 : Exemple d'invite

There is a tree house in the forest at night with colorful lights hanging on the trees

Image de sortie :

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

6) Comment Nano Banana peut-il être utilisé pour l'art conceptuel, les ressources du jeu et les personnages cohérents dans le jeu ?

Pourquoi les studios de jeux et les développeurs indépendants devraient s'en soucier

Créer des ressources artistiques et réviser l'apparence des personnages nécessite généralement des retouches répétées. La cohérence des personnages de Nano Banana permet de générer de nombreuses poses, tenues et configurations d'éclairage fidèles à l'identité d'un personnage unique, ce qui représente un gain de temps considérable en préproduction et en prototypage rapide.

Comment demander des ressources de jeu

  • Définissez la fiche de personnage « canonique » dans le texte : taille, morphologie, traits clés, essentiels de la garde-robe.
  • Demander plusieurs sorties : « Générer trois variantes d'armures de combat avec les mêmes traits du visage, chacune affichée de face, de profil et en pose ¾. »
  • Pour l'art environnemental, utilisez la fusion multi-images : donnez une image du personnage et une de l'environnement et proposez de les fusionner.

Exemple d'invite (ressources du jeu)

Créez trois variantes d'armure pour « Kael, le garde-vent » : conservez les traits du visage (mâchoire étroite, cicatrice au-dessus du sourcil droit). Armure A : cuir + tissu bleu sarcelle ; Armure B : écailles + laiton ; Armure C : noir mat furtif. Obtenez une vue complète du corps de face, de profil, de ¾.

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

Armor C : Stealth Noir Mat

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

Armure B : Écailles + Laiton

7 utilisations créatives de l'image Flash Gemini 2.5 (Nano Banana)

Armure A : Cuir + Tissu bleu sarcelle

7) Comment puis-je automatiser les flux de travail de retouche photo avec l'édition multi-tours conversationnelle ?

Pourquoi ça marche

Nano Banana prend en charge l'édition d'images conversationnelle multi-tours : vous pouvez demander une modification, inspecter le résultat et donner des instructions supplémentaires en langage naturel. C'est idéal pour créer un pipeline de retouche avec intervention humaine, où un éditeur oriente le modèle sur plusieurs passes.

Comment mettre en œuvre le flux de travail

  • Téléchargez une photo initiale et demandez une retouche de base (éclairage, suppression des imperfections).
  • À chaque tour, renvoyez l'image nouvellement éditée au modèle avec l'instruction suivante (« réduire les hautes lumières, faire ressortir les ombres, recadrer à 4:5 »).
  • Enregistrez chaque étape afin de pouvoir revenir en arrière ou appliquer le même passage à un lot.

Mini extrait de flux de travail (Python)

# 1) Initial retouch

prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png

# 2) Follow-up tweak

prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png

Comment puis-je inciter Nano Banana à obtenir les meilleurs résultats ?

Quels principes d’incitation dois-je suivre ?

Nano Banana répond mieux à invites descriptives de style narratif qui expliquent la scène, la perspective, l'éclairage et l'ambiance, et non pas seulement une liste de mots-clés. Les directives officielles recommandent de fournir des indications sur l'appareil photo, l'objectif, l'éclairage et le style pour le photoréalisme, ou des indications de style et de palette pour les illustrations. Indiquez également explicitement les contraintes (format d'image, arrière-plan, exigences textuelles).

Comment structurer une invite forte ?

Voici des modèles courts et réutilisables :

  • Modèle photoréaliste :
    A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: .
  • Modèle de transfert de style / composition :
    Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style: .

Conseils d'ingénierie rapides (liste rapide)

  • Utilisez le une phrase narrative claire plutôt que de nombreuses balises disjointes.
  • Ajouter détails de la caméra pour le photoréalisme (par exemple, « 85 mm, faible profondeur de champ »).
  • Pour des caractères cohérents entre les modifications, faites référence à l'image précédente et à l'attribut que vous souhaitez conserver (par exemple, « conserver les taches de rousseur et l'écharpe bleue du sujet, changer la coiffure en… »).
  • Lors de l'édition, téléchargez l'image source et décrivez exactement quelles régions ou quels éléments modifier.
  • Utilisez des modifications itératives à plusieurs tours pour affiner les petits détails visuels (Nano Banana prend en charge le raffinement conversationnel).

Note finale

Nano Banana (Gemini 2.5 Flash Image) est un véritable saut créatif : il permet aux créateurs de préserver la continuité du personnage et du produit, tout en autorisant de nouvelles modifications audacieuses, la fusion de plusieurs images et une itération rapide. Utilisez-le pour accélérer la narration, réduire les frictions de production et prototyper rapidement des visuels, tout en associant ces avantages à une révision rigoureuse et à des garde-fous éthiques.

Pour commencer

CometAPI est une plateforme d'API unifiée qui regroupe plus de 500 modèles d'IA provenant de fournisseurs leaders, tels que la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, Midjourney, Suno, etc., au sein d'une interface unique et conviviale pour les développeurs. En offrant une authentification, un formatage des requêtes et une gestion des réponses cohérents, CometAPI simplifie considérablement l'intégration des fonctionnalités d'IA dans vos applications. Que vous développiez des chatbots, des générateurs d'images, des compositeurs de musique ou des pipelines d'analyse pilotés par les données, CometAPI vous permet d'itérer plus rapidement, de maîtriser les coûts et de rester indépendant des fournisseurs, tout en exploitant les dernières avancées de l'écosystème de l'IA.

Les développeurs peuvent accéder Image Flash Gemini 2.5(Liste des API Nano Banana Comet gemini-2.5-flash-image-preview/gemini-2.5-flash-image (entrées de style dans leur catalogue.) via CometAPI, les dernières versions des modèles répertoriées sont celles à la date de publication de l'article. Pour commencer, explorez les fonctionnalités du modèle dans la section cour de récréation et consultez le Guide de l'API Pour des instructions détaillées, veuillez vous connecter à CometAPI et obtenir la clé API avant d'y accéder. API Comet proposer un prix bien inférieur au prix officiel pour vous aider à vous intégrer.

En savoir plus

500+ Modèles en Une API

Jusqu'à 20% de réduction