Nano Banana Pro — officieel Gemini 3 Pro Image — is Google/DeepMind’s nieuwe model op studioniveau voor het genereren en bewerken van afbeeldingen, dat geavanceerde multimodale redenering, tekstrendering met hoge getrouwheid, compositie met meerdere afbeeldingen en creatieve controls op studioniveau combineert.
Wat is Nano Banana Pro en waarom is het relevant?
Nano Banana Pro is Google’s nieuwste model voor beeldgeneratie en -bewerking — de “Gemini 3 Pro Image”-release — ontworpen om contextbewuste afbeeldingen en on-image tekst met studiokwaliteit tot 4K te produceren. Het is de opvolger van de eerdere Nano Banana-modellen (Gemini 2.5 Flash Image / “Nano Banana”) met verbeterde redenering, gronding via Search (feiten uit de echte wereld), sterkere tekstrendering en krachtigere lokale bewerkingscontrols. Het model is beschikbaar in de Gemini-app voor interactieve gebruikers en via de standaard Gemini API voor toegang tot Nano Banana Pro, waarbij je het specifieke model-ID selecteert (gemini-3-pro-image-preview of zijn stabiele opvolger) voor programmeerbare toegang.
Waarom dit belangrijk is: Nano Banana Pro is niet alleen gebouwd om mooie beelden te maken, maar om informatie te visualiseren — infographics, data-gedreven snapshots (weer, sport), tekst-rijke posters, productmock-ups en fusies van meerdere afbeeldingen (tot 14 inputafbeeldingen en behoud van karakterconsistentie voor maximaal 5 personen). Voor ontwerpers, productteams en developers opent die combinatie van nauwkeurigheid, on-image tekst en programmeerbare toegang productie-workflows die voorheen lastig te automatiseren waren.
Welke functies zijn beschikbaar via de API?
Typische API-mogelijkheden voor developers zijn onder andere:
- Tekst → Afbeelding-generatie (single-step of multi-step “thinking”-compositieflows).
- Afbeeldingsbewerking (lokale maskers, inpainting, stijl-aanpassingen).
- Fusie van meerdere afbeeldingen (referentieafbeeldingen combineren).
- Geavanceerde aanvraagcontrols: resolutie, beeldverhouding, nabewerkingsstappen en “composition thought”-traces voor debug/inspectability in preview-modi.
Kerninnovaties en functies van Nano Banana Pro
Slimmere inhoudelijke redenering
Maakt gebruik van Gemini 3 Pro’s redeneringsstack om complexe, meerstaps visuele instructies te interpreteren (bijv. “maak een 5-staps infographic van deze dataset en voeg een tweetalige caption toe”). De API biedt een “Thinking”-mechanisme dat tussentijdse compositietests kan produceren om het eindresultaat te verfijnen.
Waarom dit belangrijk is: In plaats van een enkele pass die prompt → pixel mappt, voert het model een interne “thinking”-procedure uit die compositie verfijnt en externe tools kan aanroepen (bijv. Google Search) voor feitelijke gronding (bijv. accurate diagramlabels of lokaal correcte bewegwijzering). Dit levert afbeeldingen op die niet alleen mooier zijn maar ook semantisch correcter voor taken zoals infographics, diagrammen of productmock-ups.
Hoe het werkt: Nano Banana Pro’s “Thinking” is een gecontroleerde interne redenerings-/compositiepass waarin het model intermediaire visuals en redeneringstraces genereert voordat het de finale afbeelding produceert. De API geeft aan dat het model maximaal twee tussenframes kan maken en dat de finale afbeelding de laatste fase in die keten is. In productie helpt dit bij compositie, plaatsing van tekst en lay-outbeslissingen.
Nauwkeuriger tekstrendering
Significant verbeterde, leesbare, gelokaliseerde tekst in afbeeldingen (menu’s, posters, diagrammen). Nano Banana Pro bereikt nieuwe hoogtes in tekstrendering in afbeeldingen:
- Tekst in afbeeldingen is duidelijk, leesbaar en correct gespeld;
- Ondersteunt meertalige generatie (waaronder Chinees, Japans, Koreaans, Arabisch, enz.);
- Staat gebruikers toe lange alinea’s of meerregelige beschrijvende tekst rechtstreeks in afbeeldingen te schrijven;
- Automatische vertaling en lokalisatie zijn beschikbaar.
Waarom dit belangrijk is: Traditioneel hebben beeldmodellen moeite met leesbare, goed uitgelijnde tekst. Nano Banana Pro is expliciet geoptimaliseerd voor betrouwbare tekstrendering en lokalisatie (bijv. vertalen en lay-out behouden), wat echte creatieve use-cases ontsluit zoals posters, verpakkingen of meertalige advertenties.
Hoe het werkt: Verbeteringen in tekstrendering komen voort uit de onderliggende multimodale architectuur en training op datasets met nadruk op tekst-in-afbeeldingvoorbeelden, gecombineerd met gerichte evaluatiesets (menselijke evaluaties en regressiesets). Het model leert glyphvormen, lettertypen en lay-outrestricties uit te lijnen om leesbare, gelokaliseerde tekst in afbeeldingen te produceren — hoewel zeer kleine tekst en extreem dichte alinea’s nog steeds foutgevoelig kunnen zijn.
Betere visuele consistentie en getrouwheid
Studio-controls (belichting, focus, camerapunt, color grading) en compositie met meerdere afbeeldingen (tot 14 referentieafbeeldingen, met speciale ruimte voor meerdere menselijke subjecten) helpen om karakterconsistentie (dezelfde persoon/karakter behouden over bewerkingen) en merkidentiteit te bewaren over gegenereerde assets. Het model ondersteunt native 1K/2K/4K-uitvoer.
Waarom dit belangrijk is: Marketing- en entertainment-workflows vereisen consistente personages over shots en bewerkingen. Het model kan gelijkenis behouden voor maximaal vijf personen en tot 14 referentieafbeeldingen in één compositie mengen, terwijl het Schets → 3D-render produceert. Dit is nuttig voor reclamecreaties, verpakkingen of storytelling met meerdere shots.
Hoe het werkt: Modelinputs accepteren meerdere afbeeldingen met expliciete roltoewijzingen (bijv. “Afbeelding A: pose”, “Afbeelding B: gezichtsreferentie”, “Afbeelding C: achtergrondtextuur”). De architectuur conditioneert de generatie op die afbeeldingen om identiteit/pose/stijl te behouden terwijl transformaties worden toegepast (belichting, camera).
Prestatiebenchmarks van Nano Banana Pro
Nano Banana Pro (Gemini 3 Pro Image) “excels on Text→Image AI benchmarks” en demonstreert verbeterde redenering en contextuele gronding vergeleken met eerdere Nano Banana-modellen. Het legt de nadruk op hogere getrouwheid en verbeterde tekstrendering ten opzichte van eerdere releases.

Praktische prestatierichtlijnen
Verwacht hogere latentie en kosten voor 2K/4K-rendering met hoge getrouwheid dan voor 1K of de “Flash”-modellen die zijn geoptimaliseerd voor snelheid. Als throughput/latentie kritiek is, gebruik dan de flash-variant (bijv. Gemini 2.5 Flash / Nano Banana) voor hoog volume; gebruik Nano Banana Pro / gemini-3-pro-image voor kwaliteit en complexe redeneertaken.
Hoe kunnen ontwikkelaars Nano Banana Pro gebruiken?
Welke endpoints en modellen te kiezen
Model-ID (preview / pro): gemini-3-pro-image-preview (preview) — gebruik dit wanneer je de Nano Banana Pro-capabilities wilt. Voor sneller, goedkoper werk blijft gemini-2.5-flash-image (Nano Banana) beschikbaar.
Te gebruiken platforms
- Gemini API (generativelanguage endpoint): Je kunt een CometAPI-sleutel gebruiken om xx te benaderen. CometAPI biedt dezelfde API tegen een gunstigere prijs dan de officiële website. Rechtstreekse HTTP-/SDK-aanroepen naar
generateContentvoor afbeeldingsgeneratie (zie voorbeelden hieronder). - Google AI Studio: Webinterface voor snelle experimenten en het remixen van demo-apps.
- Vertex AI (enterprise): Geprovisioneerde throughput, keuzemogelijkheden in billing (pay-as-you-go / enterprise-tiers) en veiligheidsfilters voor grootschalige productie. Gebruik Vertex bij integratie in grote pipelines of batch-renderingjobs.
De gratis tier heeft een beperkte gebruikslimiet; overschrijding van de limiet schakelt terug naar Nano Banana. De Plus/Pro/Ultra-tiers bieden hogere limieten en uitvoer zonder watermerk, maar Ultra kan worden gebruikt in Flow-videotools en Antigravity IDE in 4K-modus.
Hoe genereer ik een afbeelding met Nano Banana Pro (stapsgewijs)?
1) Snelle interactieve werkwijze om de Gemini-app te gebruiken
- Open Gemini → Tools → Create images.
- Selecteer Thinking (Nano Banana Pro) als het model.
- Voer een prompt in: leg onderwerp, actie, sfeer, belichting, camera, beeldverhouding en eventuele tekst op de afbeelding uit. Voorbeeld:
“Maak een 4K-poster van een robotica-workshop: een divers team rond een tafel, blauwdruk-overlay, vetgedrukte kop ‘Robots in Action’ in een schreefloos lettertype, warme tungsten-belichting, kleine scherptediepte, cinematisch 16:9.” - (Optioneel) Upload tot 14 afbeeldingen om te fuseren of als referenties te gebruiken. Gebruik het selectie-/maskerhulpmiddel om gebieden lokaal te bewerken.
- Genereer, iteratief verfijnen met natuurlijke taal (bijv. “maak de kop blauw en uitgelijnd rechtsboven; verhoog het contrast op de blauwdruk”), en exporteer.
2) HTTP gebruiken om naar de Gemini-afbeeldingsendpoint te sturen
Je moet inloggen bij CometAPI om de sleutel te verkrijgen.
# save your API key to $CometAPI_API_KEY securely before running
curl -s -X POST \
"https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
-H "x-goog-api-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"role": "user",
"parts": [{
"text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
}]
}],
"generationConfig": {
"imageConfig": {
"resolution": "4096x4096",
"aspectRatio": "1:1"
}
}
}' \
| jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
| base64 --decode > nano_banana_pro_4k.png
Dit voorbeeld schrijft de base64-afbeeldingspayload naar een PNG-bestand. De parameter generationConfig.imageConfig.resolution vraagt om 4K-uitvoer (beschikbaar voor het 3 Pro Image-model).
3) Directe SDK-aanroepen naar generateContent voor afbeeldingsgeneratie
Vereist het installeren van de Google SDK en het verkrijgen van Google-authenticatie. Python-voorbeeld (tekst + referentieafbeeldingen + grounding):
# pip install google-genai pillow
from google import genai
from PIL import Image
import base64
client = genai.Client() # reads credentials from env / config per SDK docs
# Read a reference image and set inline_data
with open("ref1.png", "rb") as f:
ref1_b64 = base64.b64encode(f.read()).decode("utf-8")
prompt_parts = [
{"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
{"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=,
generation_config={
"imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
# tools can be provided to ground facts, e.g. "google_search"
"tools":
}
)
for part in response.candidates.content.parts:
if part.inline_data:
image = part.as_image()
image.save("product_ad.png")
Dit voorbeeld laat zien hoe je een inline referentieafbeelding uploadt en een 4K-compositie aanvraagt terwijl google_search als tool wordt ingeschakeld. De Python SDK handelt de low-level REST-details af.
Fusie van meerdere afbeeldingen en karakterconsistentie
Om een compositie te produceren die dezelfde persoon over scènes behoudt, geef meerdere inline_data-onderdelen door (geselecteerd uit je fotoset), en specificeer in de creatieve instructie dat het model “identiteit moet behouden in de outputs.”
Kort praktisch voorbeeld — een echte prompt en verwacht verloop
Prompt:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."
Verwachte pipeline: app → prompttemplate + CSV-data → placeholders in prompt vervangen → API-call met image_size=2048x1152 → base64 PNG ontvangen → asset + herkomstmetadata opslaan → indien nodig exact lettertype via compositor overlayen.
Hoe ontwerp ik een productie-pipeline en ga ik om met veiligheid/herkomst?
Aanbevolen productie-architectuur
- Prompt + draft-pass (snel model): Gebruik
gemini-2.5-flash-image(Nano Banana) om goedkoop veel variaties met lage resolutie te produceren. - Selectie & verfijning: kies de beste kandidaten, verfijn prompts, pas inpainting/mask-bewerkingen toe voor precisie.
- Finale render met hoge getrouwheid: roep
gemini-3-pro-image-preview(Nano Banana Pro) aan voor finale 2K/4K-renders en nabewerking (upsampling, color grade). - Herkomst & metadata: sla prompt, modelversie, timestamps en SynthID-info op in je asset-metadatastore — het model voegt een SynthID-watermerk toe en outputs zijn herleidbaar voor compliance en content-audits.
Veiligheid, rechten en moderatie
- Auteursrechten & rechtenvrijgave: upload of genereer geen content die rechten schendt. Gebruik expliciete gebruikersbevestigingen voor door gebruikers aangeleverde afbeeldingen of prompts die herkenbare gelijkenissen kunnen creëren. Google’s Prohibited Use Policy en de veiligheidsfilters van het model moeten worden gerespecteerd.
- Filtering & geautomatiseerde checks: laat gegenereerde afbeeldingen door een interne contentmoderatie-pipeline (NSFW, haatsymbolen, politieke/bindende contentdetectie) gaan vóór downstream-consumptie of publieke weergave.
Hoe voer ik afbeeldingsbewerking (inpainting), compositie met meerdere afbeeldingen en tekstweergave uit?
Nano Banana Pro ondersteunt multimodale bewerkingsworkflows: geef één of meer invoerafbeeldingen en een tekstinstructie die bewerkingen beschrijft (verwijder een object, verander de lucht, voeg tekst toe). De API accepteert afbeelding + tekst in dezelfde aanvraag; het model kan afwisselend tekst en afbeeldingen als respons produceren. Voorbeeldpatronen omvatten gemaskeerde bewerkingen en blends van meerdere afbeeldingen (stijltransfer / compositie). Zie de documentatie voor contents-arrays die tekstblobs en binaire afbeeldingen combineren.
Voorbeeld: Bewerken (Python pseudo-flow)
from google import genai
from PIL import Image
client = genai.Client()
prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"
# contents can include Image objects or binary data per SDK; see doc for exact call
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=, # order matters: image + instruction
)
# Save result as before
Deze conversationale bewerking stelt je in staat resultaten iteratief aan te passen totdat je een productieklare asset hebt bereikt.
Node.js-voorbeeld — afbeelding bewerken met masker en meerdere referenties
// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');
const auth = new GoogleAuth({ scopes: });
async function runEdit() {
const client = await auth.getClient();
const token = await client.getAccessToken();
const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
const MODEL = "gemini-3-pro-image";
// Attach binary image content or URLs depending on API.
const payload = {
model: MODEL,
prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
inputs: {
referenceImages: [
{ uri: "gs://my-bucket/photo_subject.jpg" },
{ uri: "gs://my-bucket/target_studio.jpg" }
],
mask: { uri: "gs://my-bucket/mask.png" },
imageConfig: { resolution: "2048x2048", format: "png" }
},
options: { preserveIdentity: true }
};
const res = await fetch(API_URL, {
method: 'POST',
headers: {
'Authorization': `Bearer ${token.token}`,
'Content-Type': 'application/json'
},
body: JSON.stringify(payload)
});
const out = await res.json();
console.log(JSON.stringify(out, null, 2));
}
runEdit();
(API’s accepteren soms Cloud Storage-URI’s of base64-afbeeldingspayloads; raadpleeg de Gemini API-docs voor exacte invoerformaten.)
Voor informatie over het genereren en bewerken van afbeeldingen met CometAPI, raadpleeg de Handleiding voor het aanroepen van gemini-3-pro-image.
Conclusie
Nano Banana Pro (Gemini 3 Pro Image) is een sprong naar productieklare beeldgeneratie: een tool voor het visualiseren van data, het uitvoeren van gelokaliseerde bewerkingen en het aandrijven van developer-workflows. Gebruik de Gemini-app voor snelle prototyping, de API voor productie-integratie, en volg de bovenstaande aanbevelingen om kosten te beheersen, veiligheid te waarborgen en merkkwaliteit te behouden. Test altijd echte gebruikersworkflows en sla herkomstmetadata op om transparantie- en auditvereisten te halen.
Gebruik Nano Banana Pro wanneer je assets op studioniveau nodig hebt, nauwkeurige controle over compositie, verbeterde tekstrendering in afbeeldingen en de mogelijkheid om meerdere referenties tot één coherent resultaat te fuseren.
Developers kunnen toegang krijgen tot de Gemini 3 Pro Image (Nano Banana Pro) API via CometAPI. Begin met het verkennen van de modelmogelijkheden van CometAPI in de Playground en raadpleeg de API-handleiding voor gedetailleerde instructies. Zorg ervoor dat je bent ingelogd bij CometAPI en een API-sleutel hebt verkregen voordat je toegang vraagt. CometAPI biedt een prijs die veel lager is dan de officiële prijs om je integratie te ondersteunen.
Klaar om te beginnen? → Meld je vandaag aan bij CometAPI!
Als je meer tips, gidsen en nieuws over AI wilt weten, volg ons op VK, X en Discord!
