Nano Banana is de community-bijnaam (en interne afkorting) voor Google's Gemini 2.5 Flash-afbeelding — een hoogwaardig, multimodaal model voor het genereren en bewerken van afbeeldingen met lage latentie. Deze uitgebreide handleiding (met code, patronen, implementatiestappen en CometAPI-voorbeelden) toont drie praktische aanroepmethoden die u in productie kunt gebruiken: (1) een OpenAI-compatibele chatinterface (tekst → afbeelding), (2) de officiële Google-interface. generateContent tekst→afbeeldinginterface en (3) de officiële Google-interface generateContent Image→Image-interface met Base64-invoer/-uitvoer. Onderweg krijgt u stapsgewijs advies over distributie en implementatie, omgevingsinstellingen, hoe u API-bewerkingen vanuit CometAPI kunt uitvoeren, prijs- en watermerknotities en de beste tips voor betrouwbare, kostenefficiënte resultaten.
Wat is Nano Banana (Gemini 2.5 Flash Image)?
Nano Banana is de informele naam voor Gemini 2.5 Flash Image, Googles nieuwste beeldmodel in de Gemini-familie. Het is ontworpen voor zowel fotorealistische beeldgeneratie als nauwkeurige beeldbewerking (lokale bewerkingen, fusie van meerdere beelden, consistent karakterbehoud tussen bewerkingen) en is beschikbaar via Googles Gemini API, Google AI Studio en Vertex AI. Het model wordt geleverd met een onzichtbaar SynthID-watermerk voor de herkomst.
Waarom dit belangrijk is voor ontwikkelaars: Nano Banana biedt u een enkel, hoogwaardig multimodaal model dat het volgende aankan:
- Tekst → Afbeelding (nieuwe afbeeldingen maken vanuit tekstprompts)
- Afbeelding → Afbeelding (een aangeleverde foto bewerken/transformeren)
- Multi-image blending (meerdere afbeeldingen combineren tot één compositie)
Dit alles is toegankelijk via de officiële website van Google.generateContenteindpunten (Vertex AI / Gemini API) of via OpenAI-compatibele eindpunten die worden aangeboden door API-gateways van derden, zoals CometAPI en OpenRouter. Dit betekent dat u Gemini 2.5 Flash Image kunt integreren in bestaande OpenAI-compatibele codebases of rechtstreeks de officiële SDK's van Google kunt aanroepen.
Waarin het uitblinkt
- Gerichte, lokale bewerkingen (een shirtkleur veranderen, objecten verwijderen, poses aanpassen).
- Zorg dat het onderwerp en de personages consistent blijven bij herbewerkingen.
- Het samenvoegen/mengen van meerdere afbeeldingen tot een samenhangend geheel.
- Lage latentie en kostenefficiënte inferentie vergeleken met zwaardere onderzoeksmodellen (Google positioneert "Flash"-modellen als opties met een hoge doorvoer).
Hoe moet ik mijn ontwikkelomgeving instellen om Nano Banana via API aan te roepen?
Hieronder vindt u een checklist met stapsgewijze instructies die u als uitgangspunt kunt gebruiken voor elk van de drie aanroepmethoden die later worden beschreven.
Vereisten (accounts, sleutels, quota)
- Google-account + Cloud-project — Als u van plan bent Gemini rechtstreeks via Google (Gemini API / Vertex AI) aan te roepen, maak dan een Google Cloud-project aan en activeer de Vertex AI / Gemini API's. U hebt facturering en de juiste rollen nodig (bijv.
Vertex AI AdminorService Accountmet inferentierechten). - Gemini API-toegang — Sommige Gemini-afbeeldingsmodellen zijn beschikbaar als preview/beperkt. Mogelijk moet u toegang aanvragen of het model gebruiken via Google AI Studio of Vertex AI, afhankelijk van uw account.
- CometAPI (optionele gateway) — Als u de voorkeur geeft aan één leverancieronafhankelijke API die verschillende modellen (waaronder Gemini) kan proxyen, meld u dan aan bij CometAPI om een API-sleutel te verkrijgen en hun modellijst te bekijken (ze bieden Gemini 2.5 Flash-varianten en een OpenAI-compatibel eindpunt). CometAPI kan de ontwikkeling vereenvoudigen en u in staat stellen om van provider te wisselen zonder uw app-code te wijzigen.
Lokale tooling
- Taal-runtimes: Node.js 18+, Python 3.10+ aanbevolen.
- HTTP-client:
fetch/axiosvoor JS;requests/httpxvoor Python (of officiële SDK's). - Beeldhulpen:
Pillow(Python) ofsharp(Node) voor formaatwijziging, formaatconversie en Base64-codering/-decodering. - Security: sla sleutels op in omgevingsvariabelen of een geheimenkluis (HashiCorp Vault, AWS Secrets Manager, Google Secret Manager). Commit nooit API-sleutels.
Installeer de Google/compatibele SDK (optioneel)
Google biedt SDK's en openai Compatibiliteitsshims voor bibliotheken — u kunt de OpenAI-clientbibliotheken gebruiken tegen Gemini door een paar regels te wijzigen (basis-URL + API-sleutel), maar de native Gemini/Google-client wordt aanbevolen voor volledige multimodale functionaliteit. Als u CometAPI of een OpenAI-compatibele gateway gebruikt, kan het gebruik van de OpenAI-client de ontwikkeling versnellen. Voorbeelden:
Officiële Google-route (Python):
python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai # official Google GenAI SDK
pip install Pillow requests jq # for local image handling in examples
CometAPI / OpenAI-compatibele client (Python):
pip install openai requests
Hoe kies ik tussen de drie aanroepmethoden voor Nano Banana?
De keuze van een aanroepmethode hangt af van uw architectuur, latentie-/kostenvereisten en of u wilt vertrouwen op het officiële eindpunt van Google of een OpenAI-compatibele gateway van derden. De drie meest voorkomende patronen zijn:
1) OpenAI-compatibele chatinterface (tekst-naar-afbeelding)
Gebruik dit wanneer u al OpenAI-stijl code of SDK's hebt en modellen met minimale wijzigingen wilt wisselen. Veel gateways (CometAPI, OpenRouter) stellen Gemini-modellen beschikbaar onder een OpenAI-compatibel REST-oppervlak, zodat uw bestaande chat or completions oproepen werken met slechts een andere base_url en modelnaam. Dit is vaak de snelste weg naar productie als u Google Cloud-authenticatie niet wilt beheren.
2) Gemini officieel generateContent — tekst-naar-afbeelding
Gebruik de officiële Google-website generateContent via de genai (Google) client of Vertex AI als u de officiële, volledig ondersteunde SDK en toegang tot de nieuwste functies (fijnmazige generatieparameters, streaming, bestands-API voor grote assets) wilt, plus Google Cloud-facturering/-monitoring. Dit wordt aanbevolen wanneer u productieondersteuning en enterprise-grade controles nodig hebt.
3) Gemini officieel generateContent — afbeelding-naar-afbeelding (Base64-invoer/uitvoer)
Gebruik dit wanneer u binaire afbeeldingen inline (Base64) moet indienen of beeldbewerking/beeld-naar-beeld-pipelines wilt. Google's generateContent Ondersteunt inline (base64) afbeeldingen en een File API voor grotere of herbruikbare assets. Reacties op gegenereerde/bewerkte afbeeldingen worden meestal geretourneerd als Base64-strings die u decodeert en opslaat. Dit biedt de meest expliciete multimodale controle.
Hoe kan ik Nano Banana aanroepen via een OpenAI-compatibele chatinterface (tekst-naar-afbeelding)?
Een OpenAI-compatibel chat-eindpunt accepteert een reeks van {role, content} Berichten; je beschrijft welke afbeelding je in een gebruikersbericht wilt en de gateway (CometAPI of een OpenAI-compatibele shim) vertaalt dit naar een aanroep van het onderliggende Gemini-model. Dit is handig als je app al chatflows gebruikt of als je tekstgeneratie en afbeeldinggeneratie in één uitwisseling wilt combineren.
Stappen
1.Meld u aan voor CometAPI en ontvang een API-sleutel: Registreer je bij CometAPI, maak een project aan en kopieer je API-sleutel. CometAPI stelt meerdere modellen bloot achter één enkele base_url. ()
-
Installeer een OpenAI-compatibele client:Python:
pip install openaiof gebruik de nieuwereopenai/OpenAISDK-wrapper die door veel gateways wordt gebruikt. -
Wijs de SDK toe aan CometAPI en roep het chatvoltooiingseindpunt aan:
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMET_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2-5-flash-image-preview",
"stream": true,
"messages": [{"role": "user",
"content": "Generate a cute kitten sitting on a cloud, in a cartoon style"}]
}'
Opmerkingen:
-
stream moet waar zijn; het antwoord wordt geretourneerd als een stream;
-
De responsstructuur wordt verpakt door CometAPI voor OpenAI-compatibiliteit.
-
Het antwoord bevat een Base64-image; decodeer en sla deze indien nodig op de client op:
Hoe kan ik Nano Banana bellen met behulp van de officiële Gemini-app? generateContent tekst-naar-afbeelding-interface?
Google biedt een Gemini Developer API (de Gemini API) en stelt ook Gemini-modellen bloot via Vertex-AIVoor programmatische toegang tot Gemini 2.5 Flash Image (Nano Banana) op een ondersteunde manier, de officiële generateContent methode is het canonieke startpunt voor tekst-only of multimodale generatie. Gebruik Google's GenAI SDK (Python: google-genai) of roep het REST-eindpunt rechtstreeks aan. Dit geeft directe toegang tot de parameters en modaliteiten van het model en is de aanbevolen manier om geavanceerde functies (nauwkeurige bewerking, multi-image fusion) te gebruiken bij het aanroepen van Google-eindpunten.
- Gebruik Google's GenAI SDK (Python:
google-genai)
Distributie-/oproepstappen (overzicht):
- Krijg een API-sleutel vanuit Google AI Studio of stel een Vertex AI-serviceaccount in (afhankelijk van het platform).
- Installeer SDK (
pip install --upgrade google-genai) en authenticeren (API-sleutel of standaardreferenties van Google Application). - Kies het model:
gemini-2.5-flash-imageof de preview-slug die in de documentatie wordt weergegeven (de exacte slug is afhankelijk van de GA-/preview-status). - Bel
client.models.generate_content(...)met een platte tekstprompt (tekst-naar-afbeelding). - Decoderen geretourneerde afbeeldingen (indien Base64 geretourneerd) en opslaan/bewaren.
Python (officiële client) voorbeeld — tekst→afbeelding:
from google import genai
from base64 import b64decode, b64encode
client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
"content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
"mime_type": "text/plain"
}
# request generateContent for image output
result = client.generate_content(
model="gemini-2-5-flash-image-preview",
prompt=prompt,
response_modalities=,
image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)
(Let op: controleer de officiële client-API voor de exacte parameternamen. De bovenstaande voorbeelden volgen de patronen in de Google-documentatie.)
2. telefoontje Nano Banaan via het REST-eindpunt
EST-eindpunt (voorbeeld van tekst-naar-afbeelding): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.
Authenticatieopties: header opgeven x-goog-api-key: $CometAPI_API_KEY(Maak een sleutel aan in CometAPI.)
Hiermee wordt een tekstprompt geplaatst en de geretourneerde base64-afbeelding opgeslagen:
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{ "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
]
}]
}' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png
Opmerkingen: Het binaire beeldbestand wordt geretourneerd als base64 in
candidates.content.parts.inline_data.dataHet bovenstaande voorbeeld gebruiktjqom de inline-data te selecteren en te decoderen. De officiële documentatie toont dezelfde stroom.
Hoe kan ik Nano Banana bellen met behulp van de officiële Gemini-app? generateContent image-to-image interface (Base64 in/uit)?
Wanneer moet je image-to-image gebruiken (base64 in/out)?
Gebruik afbeelding-naar-afbeelding wanneer u het volgende nodig hebt:
- Bewerk een bestaande foto (inpainting, stijloverdracht, objectvervanging).
- Combineer meerdere bronafbeeldingen tot één compositie.
- De identiteit van het onderwerp behouden tijdens bewerkingen (een van de sterke punten van Nano Banana).
Gemini generateContent Ondersteunt inline-afbeeldingsgegevens via Base64 (of als bestands-URI's) en retourneert gegenereerde of bewerkte afbeeldingen als Base64-strings. De documentatie geeft expliciete voorbeelden voor het leveren van inline_data with mime_type en data.
Distributie-/oproepstappen (beeld-naar-beeld)
- Voorbereiden invoerafbeelding(en): lees bestandsbytes, codeer met Base64 of geef onbewerkte bytes door via de SDK-helper.
- Bouwen a
contentsarray waarbij een deel de inline-afbeelding is (metmimeTypeendata) en de daaropvolgende delen bevatten instructies voor het bewerken van de tekst. - POST naar
generateContent(officiële SDK of REST). - Ontvangen Antwoord: de API retourneert gegenereerde/bewerkte afbeeldingen gecodeerd als Base64-strings. Decodeer en sla ze lokaal op.
Voorbeeld — Python (afbeelding-naar-afbeelding met behulp van inline bytes via de GenAI SDK)
# pip install google-genai
from google import genai
from google.genai import types
import base64
client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")
# Read local image
with open("input_photo.jpg", "rb") as f:
img_bytes = f.read()
# Using SDK helper to attach bytes as a part
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[
types.Part.from_bytes(
data=img_bytes,
mime_type="image/jpeg"
),
"Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
],
)
# The returned image will typically be in response.candidates[].content.parts with base64-encoded data
# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data # example path
with open("edited.jpg","wb") as out:
out.write(base64.b64decode(b64_out))
Python-voorbeeld: afbeelding→afbeelding met Base64 via rustpunt
import base64, json, requests
API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"
# read and base64-encode image
with open("input.jpg","rb") as f:
b64 = base64.b64encode(f.read()).decode("utf-8")
payload = {
"model": "gemini-2-5-flash-image-preview",
"input": [
{"mime_type": "image/jpeg", "bytes_base64": b64},
{"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
],
"response_modalities":
}
resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save
out_b64 = data
with open("edited.png","wb") as out:
out.write(base64.b64decode(out_b64))
Als u er toegang toe wilt via de CometAPI rest-poort:
curl
--location
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^
--header "Authorization: sk-" ^
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^
--header "Content-Type: application/json" ^
--header "Accept: */*" ^
--header "Host: api.CometAPI.com" ^
--header "Connection: keep-alive" ^
--data-raw "{ \"contents\": } ], \"generationConfig\": { \"responseModalities\": }}"
Voor inline: lees de afbeelding en codeer deze in base64. Voor herhaald gebruik of meer dan 20 MB, upload via de File API en verwijs naar de bestandshandle in
generateContentIdeaal voor nauwkeurige bewerkingen en workflows waarbij afbeeldingen als invoer nodig zijn, plus instructies voor tekstuele bewerking.
Wat zijn de beste tips voor het werken met Nano Banana?
Snelle engineering en controle
- Wees expliciet: inclusief gewenste beeldverhouding, stijlreferenties (alleen artiestennamen indien toegestaan), cameralens, belichting en compositie. Bijv. “Fotorealistisch, 3:2, geringe scherptediepte, gouden uur, Nikon 50mm-lens.”
- Gebruik opeenvolgende bewerkingen: geef de voorkeur aan kleinere, lokale bewerkingen in meerdere passes boven grote, eenmalige prompts — dit behoudt de consistentie van het onderwerp. De kracht van Nano Banana is iteratieve bewerking.
Beeldhygiëne
- Verwerk invoer vooraf: normaliseer de kleurruimte, verwijder ingesloten EXIF als privacy vereist is, schaal naar redelijke resoluties om tokens te besparen.
- Nabewerkingsresultaten: gezichtsdetectie uitvoeren, kleine artefacten opruimen via lichtgewichtfilters (Pillow/Sharp) voordat ze naar gebruikers worden teruggestuurd.
Veiligheids-, nalevings- en inhoudsbeleid
- Implementeer een geautomatiseerde controle op de veiligheid van de inhoud (Vision-moderatiemodellen of zwarte lijstcontroles) voordat u afbeeldingen opslaat/presenteert.
- Als u afbeeldingen van mensen uploadt, dient u zich te houden aan de geldende privacywetgeving (AVG/CCPA) en de benodigde toestemmingen te verkrijgen.
- Houd u aan het modelgebruikbeleid en de auteursrechtregels wanneer u vraagt om auteursrechtelijk beschermde personages of bestaande illustraties.
Afsluitende notities
Nano Banana (Gemini 2.5 Flash Image) vertegenwoordigt een pragmatische, zeer betrouwbare stap voor multimodale beeldgeneratie en -bewerking: het is ontworpen voor consistentie bij bewerkingen en rijkere multimodale redeneringen. Nano Banana (Gemini 2.5 Flash Image) is een belangrijke stap in beeldgeneratie/-bewerking, die een hoge consistentie biedt voor bewerkingen met meerdere stappen en meerdere integratieoppervlakken (OpenAI-compatibele gateways zoals CometAPI en Google's generateContent API's). Voor een snelle acceptatie kunt u met gateways zoals CometAPI code in OpenAI-stijl hergebruiken. Controleer altijd de reacties, respecteer het inhoudsbeleid en de herkomstkenmerken (SynthID) en houd de kosten in de gaten tijdens de iteratie.
Beginnen
CometAPI is een uniform API-platform dat meer dan 500 AI-modellen van toonaangevende aanbieders – zoals de GPT-serie van OpenAI, Gemini van Google, Claude, Midjourney en Suno van Anthropic – samenvoegt in één, gebruiksvriendelijke interface voor ontwikkelaars. Door consistente authenticatie, aanvraagopmaak en responsverwerking te bieden, vereenvoudigt CometAPI de integratie van AI-mogelijkheden in uw applicaties aanzienlijk. Of u nu chatbots, beeldgenerators, muziekcomponisten of datagestuurde analysepipelines bouwt, met CometAPI kunt u sneller itereren, kosten beheersen en leveranciersonafhankelijk blijven – en tegelijkertijd profiteren van de nieuwste doorbraken in het AI-ecosysteem.
Ontwikkelaars hebben toegang tot Gemini 2.5 Flash-afbeelding(Nano Banana CometAPI-lijst gemini-2.5-flash-image-preview/gemini-2.5-flash-image stijlvermeldingen in hun catalogus.) via CometAPI, de nieuwste vermelde modelversies zijn van de publicatiedatum van het artikel. Om te beginnen, verken de mogelijkheden van het model in de Speeltuin en raadpleeg de API-gids voor gedetailleerde instructies. Zorg ervoor dat u bent ingelogd op CometAPI en de API-sleutel hebt verkregen voordat u toegang krijgt. KomeetAPI bieden een prijs die veel lager is dan de officiële prijs om u te helpen integreren.
