Comment utiliser Nano Banana via l'API ? (Gemini-2-5-flash-image)

CometAPI
AnnaDec 10, 2025
Comment utiliser Nano Banana via l'API ? (Gemini-2-5-flash-image)

Nano Banana est le surnom communautaire (et le raccourci interne) de Google Image Flash Gemini 2.5 — un modèle de génération et d'édition d'images multimodales de haute qualité et à faible latence. Ce guide détaillé (avec code, modèles, étapes de déploiement et exemples CometAPI) présente trois méthodes d'appel pratiques utilisables en production : (1) une interface de chat compatible OpenAI (texte → image), (2) l'interface officielle de Google generateContent interface texte→image et (3) l'interface officielle de Google generateContent Interface image→image utilisant les entrées/sorties Base64. Vous bénéficierez de conseils détaillés sur la distribution et le déploiement, la configuration de l'environnement, l'obtention d'opérations API depuis CometAPI, des notes sur les tarifs et les filigranes, ainsi que des astuces pour des résultats fiables et rentables.

Qu'est-ce que Nano Banana (Gemini 2.5 Flash Image) ?

Nano Banana est le nom informel donné à Gemini 2.5 Flash Image, le dernier modèle d'image de la famille Gemini de Google. Conçu pour la génération d'images photoréalistes et l'édition précise (montages locaux, fusion multi-images, préservation cohérente des caractères entre les modifications), il est disponible via l'API Gemini de Google, Google AI Studio et Vertex AI. Le modèle est fourni avec un filigrane SynthID invisible pour la provenance.

Pourquoi cela est important pour les développeurs : Nano Banana vous offre un modèle multimodal unique et de haute qualité capable de gérer :

  • Texte → Image (créer de nouvelles images à partir d'invites de texte)
  • Image → Image (modifier/transformer une photo fournie)
  • Fusion multi-images (combiner plusieurs images en un seul composite)
    Tout cela est accessible soit via le site officiel de Google, generateContent Points de terminaison (API Vertex AI / Gemini) ou via des points de terminaison compatibles OpenAI proposés par des passerelles API tierces telles que CometAPI et OpenRouter. Vous pouvez ainsi intégrer l'image Flash Gemini 2.5 à des bases de code compatibles OpenAI existantes ou appeler directement les SDK officiels de Google.

Ce dans quoi il excelle

  • Modifications ciblées et locales (changer la couleur d'une chemise, supprimer des objets, modifier les poses).
  • Maintenir la cohérence sujet/personnage à travers les rééditions.
  • Mélanger/fusionner plusieurs images en un composite cohérent.
  • Faible latence et inférence rentable par rapport aux modèles de recherche plus lourds (Google positionne les modèles « Flash » comme des options à haut débit).

Comment dois-je configurer mon environnement de développement pour appeler Nano Banana via l'API ?

Vous trouverez ci-dessous une liste de contrôle étape par étape que vous pouvez utiliser comme base pour l’une des trois méthodes d’appel décrites plus loin.

Prérequis (comptes, clés, quota)

  1. Compte Google + projet Cloud — Si vous prévoyez d'appeler Gemini directement via Google (API Gemini / Vertex AI), créez un projet Google Cloud et activez les API Vertex AI / Gemini. Vous aurez besoin de la facturation et des rôles appropriés (par exemple, Vertex AI Admin or Service Account avec droits d'inférence).
  2. Accès à l'API Gemini — Certains modèles d'images Gemini sont en préversion/disponibilité limitée ; vous devrez peut-être demander l'accès ou utiliser le modèle via Google AI Studio ou Vertex AI en fonction de votre compte.
  3. CometAPI (passerelle facultative) — Si vous préférez une API unique, indépendante du fournisseur, capable de gérer différents modèles (y compris Gemini), inscrivez-vous sur CometAPI pour obtenir une clé API et consulter leur liste de modèles (ils proposent des variantes Flash de Gemini 2.5 et un point de terminaison compatible OpenAI). CometAPI simplifie le développement et vous permet de changer de fournisseur sans modifier le code de votre application.

Outillage local

  • Exécutions linguistiques: Node.js 18+, Python 3.10+ recommandé.
  • Client HTTP: fetch/axios pour JS; requests/httpx pour Python (ou SDK officiels).
  • Aides à l'image: Pillow (Python) ou sharp (Nœud) pour le redimensionnement, la conversion de format et l'encodage/décodage Base64.
  • Sécurité: stockez les clés dans des variables d'environnement ou dans un coffre de secrets (HashiCorp Vault, AWS Secrets Manager, Google Secret Manager). Ne validez jamais les clés d'API.

Installer le SDK Google/compatible (facultatif)

Google fournit des SDK et openai Compatibilité des bibliothèques : vous pouvez utiliser les bibliothèques clientes OpenAI avec Gemini en modifiant quelques lignes (URL de base + clé API), mais le client natif Gemini/Google est recommandé pour bénéficier de fonctionnalités multimodales complètes. Si vous utilisez CometAPI ou une passerelle compatible OpenAI, l'utilisation du client OpenAI peut accélérer le développement. Exemples :

Itinéraire officiel de Google (Python) :

python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai           # official Google GenAI SDK

pip install Pillow requests jq     # for local image handling in examples

Client compatible CometAPI / OpenAI (Python) :

pip install openai requests

Comment choisir entre les trois méthodes d'appel pour Nano Banana ?

Le choix d'une méthode d'appel dépend de votre architecture, de vos exigences en matière de latence et de coût, et de votre choix entre le point de terminaison officiel de Google ou une passerelle tierce compatible OpenAI. Les trois modèles courants sont :

1) Interface de chat compatible OpenAI (texte en image)

Utilisez cette option si vous disposez déjà de code ou de SDK de type OpenAI et souhaitez changer de modèle avec un minimum de modifications. De nombreuses passerelles (CometAPI, OpenRouter) exposent les modèles Gemini sous une interface REST compatible OpenAI, de sorte que votre modèle existant chat or completions les appels fonctionnent avec juste un autre base_url et le nom du modèle. C'est souvent le chemin le plus rapide vers la production si vous ne souhaitez pas gérer l'authentification Google Cloud.

2) Officiel Gemini generateContent — texte en image

Utilisez le service officiel de Google generateContent via le genai Client (Google) ou Vertex AI si vous souhaitez le SDK officiel et entièrement pris en charge, ainsi qu'un accès aux dernières fonctionnalités (paramètres de génération précis, streaming, API de fichiers pour les ressources volumineuses), et bénéficier de la facturation et de la surveillance Google Cloud. Cette option est recommandée si vous avez besoin d'un support de production et de contrôles de niveau entreprise.

3) Officiel Gemini generateContent — image à image (entrée/sortie Base64)

Utilisez ceci lorsque vous devez soumettre des images binaires en ligne (Base64) ou souhaitez des pipelines d'édition d'images / d'image à image. generateContent Prend en charge les images en ligne (base64) et une API de fichiers pour les ressources plus volumineuses ou réutilisables. Les réponses aux images générées/modifiées sont généralement renvoyées sous forme de chaînes Base64 que vous décodez et enregistrez. Cela offre un contrôle multimodal plus explicite.

Comment puis-je appeler Nano Banana via une interface de chat compatible OpenAI (texte en image) ?

Un point de terminaison de chat compatible OpenAI accepte une séquence de {role, content} Messages ; vous décrivez l'image souhaitée dans un message utilisateur, et la passerelle (CometAPI ou un module compatible OpenAI) traduit cette information en un appel au modèle Gemini sous-jacent. Ceci est pratique si votre application utilise déjà des flux de chat ou si vous souhaitez combiner la génération de texte et d'images dans un seul échange.

Étapes

1.Inscrivez-vous à CometAPI et obtenez une clé APIInscrivez-vous sur CometAPI, créez un projet et copiez votre clé API. CometAPI expose plusieurs modèles derrière une seule base_url. ()

  1. Installer un client compatible OpenAI:Python: pip install openai ou utilisez la version la plus récente openai/OpenAI Wrapper SDK utilisé par de nombreuses passerelles.

  2. Dirigez le SDK vers CometAPI et appelez le point de terminaison des complétions de chat:

curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2-5-flash-image-preview",
     "stream": true,   
     "messages": [{"role": "user", 
                   "content": "Generate a cute kitten sitting on a cloud, in a                cartoon style"}]
      }'

Remarques :

  1. stream doit être vrai ; la réponse sera renvoyée sous forme de flux ;

  2. La structure de réponse est encapsulée par CometAPI pour la compatibilité OpenAI.

  3. La réponse inclut une image Base64 ; décodez-la et enregistrez-la sur le client si nécessaire :

Comment puis-je appeler Nano Banana en utilisant le Gemini officiel generateContent interface texte-image ?

Google fournit un API du développeur Gemini (l'API Gemini) et expose également les modèles Gemini via IA des sommetsPour un accès programmatique à Gemini 2.5 Flash Image (Nano Banana) de manière prise en charge, le generateContent La méthode est le point d'entrée canonique pour la génération de texte seul ou multimodal. Utilisez Google Kit de développement logiciel GenAI (Python: google-genai) ou appelez directement le point de terminaison REST. Il donne un accès direct aux paramètres et modalités du modèle et constitue le moyen recommandé d'utiliser des fonctionnalités avancées (édition précise, fusion multi-images) lors de l'appel des points de terminaison de Google.

  1. Utilisez Google Kit de développement logiciel GenAI (Python: google-genai)

Étapes de distribution / d'appel (aperçu) :

  1. Obtenir une clé API depuis Google AI Studio ou configurez un compte de service Vertex AI (selon la plateforme).
  2. Installer SDK (pip install --upgrade google-genai) et authentifiez-vous (clé API ou informations d'identification par défaut de l'application Google).
  3. Choisir le modèle: gemini-2.5-flash-image ou le slug d'aperçu affiché dans les documents (le slug exact dépend de l'état GA/aperçu).
  4. Appeler client.models.generate_content(...) avec une invite en texte brut (texte en image).
  5. Décoder images renvoyées (si renvoyées Base64) et enregistrées/stockées.

Exemple Python (client officiel) — texte→image:

from google import genai
from base64 import b64decode, b64encode

client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
  "content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
  "mime_type": "text/plain"
}
# request generateContent for image output

result = client.generate_content(
  model="gemini-2-5-flash-image-preview",
  prompt=prompt,
  response_modalities=,
  image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)

(Remarque : consultez l’API client officielle pour connaître les noms exacts des paramètres ; les exemples ci-dessus suivent les modèles des documents Google.)

2. Appel Nano Banane via le point de terminaison REST

Point de terminaison EST (exemple de conversion de texte en image) : https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.

Options d'authentification : fournir l'en-tête x-goog-api-key: $CometAPI_API_KEY. (Créez une clé dans CometAPI.)

Cela publie une invite de texte et enregistre l'image base64 renvoyée :

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        { "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
      ]
    }]
  }' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png

Remarques : L'image binaire est renvoyée en base64 dans candidates.content.parts.inline_data.data. L'exemple ci-dessus utilise jq pour récupérer les données en ligne et les décoder. La documentation officielle présente le même processus.

Comment puis-je appeler Nano Banana en utilisant le Gemini officiel generateContent interface image à image (entrée/sortie Base64) ?

Quand faut-il utiliser l'image à image (base64 en entrée/sortie) ?

Utilisez la conversion image par image lorsque vous avez besoin de :

  • Modifier une photo existante (inpainting, transfert de style, remplacement d'objet).
  • Combinez plusieurs images sources en une seule composition.
  • Préserver l'identité d'un sujet à travers les modifications (l'un des points forts de Nano Banana).

Gémeaux generateContent Prend en charge les données d'image en ligne via Base64 (ou sous forme d'URI de fichier) et renvoie les images générées ou modifiées sous forme de chaînes Base64. La documentation fournit des exemples explicites de fourniture. inline_data avec mime_type et data.

Étapes de distribution/d'appel (image à image)

  1. Préparer image(s) d'entrée : lecture des octets du fichier, codage en Base64 ou transmission des octets bruts via l'assistant SDK.
  2. Construire a contents tableau dont une partie est l'image en ligne (avec mimeType et data) et les parties suivantes incluent les instructions d'édition textuelle.
  3. POSTEZ à generateContent (SDK officiel ou REST).
  4. Obtenez Réponse : l'API renvoie les images générées/modifiées encodées sous forme de chaînes Base64. Décodez-les et enregistrez-les localement.

Exemple — Python (image à image à l'aide d'octets en ligne via le SDK GenAI)

# pip install google-genai

from google import genai
from google.genai import types
import base64

client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")

# Read local image

with open("input_photo.jpg", "rb") as f:
    img_bytes = f.read()

# Using SDK helper to attach bytes as a part

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[
        types.Part.from_bytes(
            data=img_bytes,
            mime_type="image/jpeg"
        ),
        "Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
    ],
)

# The returned image will typically be in response.candidates[].content.parts with base64-encoded data

# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data  # example path

with open("edited.jpg","wb") as out:
    out.write(base64.b64decode(b64_out))

Exemple Python : image→image en utilisant Base64 via un point de repos

import base64, json, requests

API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"

# read and base64-encode image

with open("input.jpg","rb") as f:
    b64 = base64.b64encode(f.read()).decode("utf-8")

payload = {
  "model": "gemini-2-5-flash-image-preview",
  "input": [
    {"mime_type": "image/jpeg", "bytes_base64": b64},
    {"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
  ],
  "response_modalities": 
}

resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save

out_b64 = data
with open("edited.png","wb") as out:
    out.write(base64.b64decode(out_b64))

Si vous souhaitez y accéder en utilisant le port de repos CometAPI :

curl 
--location 
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^ 
--header "Authorization: sk-" ^ 
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^ 
--header "Content-Type: application/json" ^ 
--header "Accept: */*" ^ 
--header "Host: api.CometAPI.com" ^ 
--header "Connection: keep-alive" ^ 
--data-raw "{ \"contents\":  } ], \"generationConfig\": { \"responseModalities\":  }}"

Pour l'intégration : lisez l'image et encodez-la en base64. Pour une utilisation répétée ou une taille supérieure à 20 Mo, téléchargez-la via l'API Fichier et référencez le descripteur de fichier dans generateContentIdéal pour les modifications et les flux de travail précis qui nécessitent des images d'entrée ainsi que des instructions de modification textuelles.

Quels sont les meilleurs conseils pour travailler avec Nano Banana ?

Ingénierie et contrôle rapides

  1. Soyez explicite: inclure le rapport hauteur/largeur souhaité, les références de style (noms d'artistes uniquement si autorisés), l'objectif de l'appareil photo, l'éclairage et la composition. Par exemple, « Photoréaliste, 3:2, faible profondeur de champ, heure dorée, objectif Nikon 50 mm. »
  2. Utiliser l'édition successive: privilégiez les montages locaux plus petits en plusieurs passes aux grandes séquences en une seule prise, préservant ainsi la cohérence du sujet. La force de Nano Banana réside dans le montage itératif.

Hygiène de l'image

  • Prétraiter les entrées : normaliser l'espace colorimétrique, supprimer les EXIF ​​intégrés si la confidentialité est requise, mettre à l'échelle des résolutions raisonnables pour économiser des jetons.
  • Sorties de post-traitement : exécution de la détection des visages, nettoyage des artefacts mineurs via des filtres légers (Pillow / sharp) avant de les renvoyer aux utilisateurs.

Politiques de sécurité, de conformité et de contenu

  • Implémentez un contrôle automatisé de sécurité du contenu (modèles de modération de vision ou contrôles de liste noire) avant de stocker/diffuser des images.
  • Si vous téléchargez des images de personnes, respectez les lois applicables en matière de confidentialité (RGPD/CCPA) et obtenez les consentements nécessaires.
  • Respectez les politiques d'utilisation des modèles et les règles de droits d'auteur lorsque vous demandez des personnages protégés par des droits d'auteur ou des œuvres d'art existantes.

Notes de clôture

Nano Banana (Gemini 2.5 Flash Image) représente une étape pragmatique et haute fidélité pour la génération et l'édition d'images multimodales : elle est conçue pour assurer la cohérence entre les modifications et un raisonnement multimodal plus riche. Nano Banana (Gemini 2.5 Flash Image) est une étape importante dans la génération/édition d'images, offrant une grande cohérence pour les modifications en plusieurs étapes et plusieurs surfaces d'intégration (passerelles compatibles OpenAI comme CometAPI et Google generateContent API). Pour accélérer l'adoption, des passerelles comme CometAPI vous permettent de réutiliser du code de type OpenAI. Vérifiez toujours la cohérence des réponses, respectez la politique de contenu et les fonctionnalités de provenance (SynthID) et surveillez les coûts pendant l'itération.

Pour commencer

CometAPI est une plateforme d'API unifiée qui regroupe plus de 500 modèles d'IA provenant de fournisseurs leaders, tels que la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, Midjourney, Suno, etc., au sein d'une interface unique et conviviale pour les développeurs. En offrant une authentification, un formatage des requêtes et une gestion des réponses cohérents, CometAPI simplifie considérablement l'intégration des fonctionnalités d'IA dans vos applications. Que vous développiez des chatbots, des générateurs d'images, des compositeurs de musique ou des pipelines d'analyse pilotés par les données, CometAPI vous permet d'itérer plus rapidement, de maîtriser les coûts et de rester indépendant des fournisseurs, tout en exploitant les dernières avancées de l'écosystème de l'IA.

Les développeurs peuvent accéder Image Flash Gemini 2.5(Liste des API Nano Banana Comet gemini-2.5-flash-image-preview/gemini-2.5-flash-image (entrées de style dans leur catalogue.) via CometAPI, les dernières versions des modèles répertoriées sont celles à la date de publication de l'article. Pour commencer, explorez les fonctionnalités du modèle dans la section cour de récréation et consultez le Guide de l'API Pour des instructions détaillées, veuillez vous connecter à CometAPI et obtenir la clé API avant d'y accéder. API Comet proposer un prix bien inférieur au prix officiel pour vous aider à vous intégrer.

SHARE THIS BLOG

500+ Modèles en Une API

Jusqu'à 20% de réduction