Hoe gebruik ik de Nano Banana Pro (Gemini 3 Pro Image) API?

CometAPI
AnnaDec 10, 2025
Hoe gebruik ik de Nano Banana Pro (Gemini 3 Pro Image) API?

Nano Banana Pro — officieel Gemini 3 Pro-afbeelding — is het nieuwe studiomodel van Google/DeepMind voor het genereren en bewerken van afbeeldingen, dat geavanceerde multimodale redenering, zeer nauwkeurige tekstweergave, compositie van meerdere afbeeldingen en creatieve controle op studioniveau combineert.

Wat is Nano Banana Pro en waarom is het interessant?

Nano Banana Pro is Googles nieuwste model voor beeldgeneratie en -bewerking – de "Gemini 3 Pro Image"-release – ontworpen om hoogwaardige, contextbewuste afbeeldingen en tekst op de afbeelding te produceren met studiokwaliteit tot 4K. Het is de opvolger van de eerdere Nano Banana-modellen (Gemini 2.5 Flash Image / "Nano Banana") met verbeterde redenering, zoekfundering (feiten uit de echte wereld), sterkere tekstweergave en krachtigere lokale bewerkingsmogelijkheden. Het model is beschikbaar in de Gemini-app voor interactieve gebruikers en biedt toegang tot Nano Banana Pro via de standaard Gemini API, maar u selecteert de specifieke model-ID (gemini-3-pro-image-preview of de stabiele opvolger). voor programmatische toegang.

Waarom dit belangrijk is: Nano Banana Pro is niet alleen gebouwd om mooie afbeeldingen te maken, maar ook om informatie visualiseren — infographics, datagestuurde snapshots (weer, sport), posters met veel tekst, productmockups en multi-image fusions (tot 14 invoerafbeeldingen en behoud van tekenconsistentie voor maximaal 5 personen). Voor ontwerpers, productteams en ontwikkelaars opent die combinatie van nauwkeurigheid, tekst op de afbeelding en programmatische toegang productieworkflows die voorheen moeilijk te automatiseren waren.

Welke functies worden via de API beschikbaar gesteld?

Typische API-mogelijkheden voor ontwikkelaars zijn onder andere:

  • Tekst → Afbeelding genereren (enkele-staps of meerstaps “denk”-compositiestromen).
  • Foto bewerken (lokale maskers, inschilderingen, stijlaanpassingen).
  • Multi-image fusie (combineer referentiebeelden).
  • Geavanceerde verzoekcontroles: resolutie, beeldverhouding, nabewerkingsstappen en 'compositiegedachte'-sporen voor debug-/inspecteerbaarheid in voorbeeldmodi.

Kerninnovaties en functies van Nano Banana Pro

Slimmer inhoudelijk redeneren

Gebruikt de redeneerstapel van Gemini 3 Pro om complexe, meerstaps visuele instructies te interpreteren (bijvoorbeeld: "maak een infographic in 5 stappen van deze dataset en voeg een tweetalig bijschrift toe"). De API biedt een "denk"-mechanisme dat tussentijdse compositietests kan genereren om de uiteindelijke output te verfijnen.

Waarom het uitmaakt: In plaats van een enkele doorgang die prompt → pixel in kaart brengt, voert het model een intern "denkproces" uit dat de compositie verfijnt en externe tools (zoals Google Zoeken) kan aanroepen voor feitelijke onderbouwing (zoals nauwkeurige diagramlabels of landspecifieke bewegwijzering). Dit levert afbeeldingen op die niet alleen mooier zijn, maar ook semantisch correcter voor taken zoals infographics, diagrammen of productmockups.

Hoe te bereiken: "Thinking" van Nano Banana Pro is een gecontroleerde interne redeneer-/compositiestap waarbij het model tussenliggende beelden en redeneersporen genereert voordat de uiteindelijke afbeelding wordt geproduceerd. De API geeft aan dat het model maximaal twee tussenliggende frames kan maken en dat de uiteindelijke afbeelding de laatste fase van die keten is. In de productie helpt dit bij het maken van composities, het plaatsen van tekst en het maken van lay-outs.

Nauwkeurigere tekstweergave

Aanzienlijk verbeterde, leesbare, gelokaliseerde tekst in afbeeldingen (menu's, posters, diagrammen). Nano Banana Pro bereikt nieuwe hoogten in het weergeven van tekst in afbeeldingen:

  • De tekst in de afbeeldingen is duidelijk, leesbaar en correct gespeld;
  • Ondersteunt meertalige generatie (waaronder Chinees, Japans, Koreaans, Arabisch, enz.);
  • Hiermee kunnen gebruikers lange alinea's of beschrijvende tekst van meerdere regels rechtstreeks in afbeeldingen schrijven;
  • Automatische vertaling en lokalisatie zijn beschikbaar.

Waarom het uitmaakt: Traditioneel hebben beeldmodellen moeite met het weergeven van leesbare, goed uitgelijnde tekst. Nano Banana Pro is expliciet geoptimaliseerd voor betrouwbare tekstweergave en -lokalisatie (bijvoorbeeld vertalen en de lay-out behouden), wat echte creatieve toepassingen mogelijk maakt, zoals posters, verpakkingen of meertalige advertenties.

Hoe te bereiken: Verbeteringen in de tekstweergave zijn te danken aan de onderliggende multimodale architectuur en training met datasets, met de nadruk op tekst-in-afbeeldingvoorbeelden, gecombineerd met gerichte evaluatiesets (menselijke evaluaties en regressiesets). Het model leert glyph-vormen, lettertypen en lay-outbeperkingen uit te lijnen om leesbare, gelokaliseerde tekst in afbeeldingen te produceren – hoewel kleine tekst en extreem dichte alinea's nog steeds foutgevoelig kunnen zijn.

Sterkere visuele consistentie en getrouwheid

Studiobediening (belichting, focus, camerahoek, kleurcorrectie) en compositie van meerdere beelden (tot 14 referentiebeelden, met speciale mogelijkheden voor meerdere menselijke proefpersonen) helpen de karakterconsistentie (behoud dezelfde persoon/personage tijdens bewerkingen) en de merkidentiteit van alle gegenereerde assets te behouden. Het model ondersteunt native 1K/2K/4K-uitvoer.

Waarom het uitmaakt: Marketing- en entertainmentworkflows vereisen consistente personages in alle shots en bewerkingen. Het model kan gelijkenis behouden tot vijf mensen en vermengen zich tot 14 Referentie-afbeeldingen in één compositie gebruiken tijdens het maken van Schets → 3D Render. Dit is handig voor reclamecreaties, verpakkingen of storytelling met meerdere shots.

Hoe te bereiken: Modelinvoer accepteert meerdere afbeeldingen met expliciete roltoewijzingen (bijvoorbeeld 'Afbeelding A: pose', 'Afbeelding B: gezichtsreferentie', 'Afbeelding C: achtergrondtextuur'). De architectuur conditioneert de generatie van deze afbeeldingen om identiteit/pose/stijl te behouden tijdens het toepassen van transformaties (belichting, camera).

Prestatiebenchmarks van Nano Banana Pro

Nano Banana Pro (Gemini 3 Pro Image) "blinkt uit in de Text→Image AI-benchmarks" en toont verbeterde redenering en contextuele onderbouwing in vergelijking met eerdere Nano Banana-modellen. Het benadrukt een hogere getrouwheid en verbeterde tekstweergave ten opzichte van eerdere releases.

Hoe gebruik ik de Nano Banana Pro (Gemini 3 Pro Image) API?

Praktische prestatiebegeleiding

Verwacht hogere latentie en kosten voor 2K/4K high-fidelity renders dan voor 1K of de "Flash"-modellen die geoptimaliseerd zijn voor snelheid. Als doorvoer/latentie cruciaal zijn, gebruik dan de flash-variant (bijv. Gemini 2.5 Flash / Nano Banana) voor grote volumes; gebruik Nano Banana Pro / Gemini-3-Pro-Image voor hoogwaardige en complexe redeneertaken.

Hoe krijgen ontwikkelaars toegang tot Nano Banana Pro?

Welke eindpunten en modellen moeten worden gekozen?

Modelidentificatie (preview/pro): gemini-3-pro-image-preview (preview) — gebruik dit wanneer u de mogelijkheden van de Nano Banana Pro wilt gebruiken. Voor sneller en goedkoper werk, gemini-2.5-flash-image (Nano Banana) blijft beschikbaar.

Te gebruiken oppervlakken

  • Gemini API (generativelanguage-eindpunt): U kunt een CometAPI-sleutel gebruiken om toegang te krijgen tot xx. CometAPI biedt dezelfde API tegen een gunstigere prijs dan de officiële website. Directe HTTP/SDK-aanroepen naar generateContent voor het genereren van afbeeldingen (zie voorbeelden hieronder).
  • Google AI Studio: Weboppervlak voor snelle experimenten en het remixen van demo-apps.
  • Vertex AI (onderneming): Geprovisioneerde doorvoer, factureringsopties (pay-as-you-go/enterprise-niveaus) en veiligheidsfilters voor grootschalige productie. Gebruik Vertex bij integratie in grote pipelines of batch-renderingtaken.

De gratis versie heeft een beperkte gebruikslimiet; bij overschrijding van de limiet wordt teruggegaan naar Nano Banana. De Plus/Pro/Ultra-versies bieden hogere limieten en watermerkvrije uitvoer, maar Ultra kan worden gebruikt in Flow-videotools en Antigravity IDE in 4K-modus.

Hoe genereer ik een afbeelding met Nano Banana Pro (stap voor stap)?

1) Snel interactief recept voor gebruik met de Gemini-app

  1. Open Gemini → Extra → Maak afbeeldingen.
  2. kies Denken (Nano Banana Pro) als het model.
  3. Voer een prompt in: leg het onderwerp, de actie, de stemming, de belichting, de camera, de beeldverhouding en eventuele tekst die op de afbeelding moet verschijnen uit. Bijvoorbeeld:
    “Maak een 4K-poster van een robotica-workshop: een divers team rond een tafel, een blauwdruk als overlay, een vette kop 'Robots in actie' in schreefloze stijl, warm kunstlicht, geringe scherptediepte, filmisch 16:9.”
  4. (Optioneel) Upload maximaal 14 afbeeldingen om samen te voegen of als referentie te gebruiken. Gebruik de selectie-/maskertool om gebieden lokaal te bewerken.
  5. Genereer, herhaal met natuurlijke taal (bijvoorbeeld: “maak de koptekst blauw en lijn hem bovenaan in het midden uit; vergroot het contrast op de blauwdruk”) en exporteer hem vervolgens

2) Gebruik HTTP om naar het Gemini-afbeeldingseindpunt te verzenden

U moet inloggen op CometAPI om de sleutel te verkrijgen.

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

Dit voorbeeld schrijft de base64-image-payload naar een PNG-bestand. generationConfig.imageConfig.resolution parameterverzoeken 4K-uitvoer (beschikbaar voor het 3 Pro Image-model)

3) Directe SDK-aanroepen naar generateContent voor het genereren van afbeeldingen

Vereist installatie van de Google SDK en Google-authenticatie. Python-voorbeeld (tekst + referentieafbeeldingen + aarding):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

Dit voorbeeld laat zien hoe u een inline-referentieafbeelding uploadt en een 4K-compositie aanvraagt ​​terwijl u google_search als hulpmiddel. De Python SDK verwerkt REST-details op laag niveau.

Multi-image fusie en karakterconsistentie

Om een ​​compositie te maken waarin dezelfde persoon in alle scènes behouden blijft, moet u meervoudig inline_data onderdelen (geselecteerd uit uw fotoset) en geef de creatieve instructie dat het model 'de identiteit over de uitkomsten heen moet behouden'.

Kort praktisch voorbeeld – een echte prompt en verwachte flow

prompt:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

Verwachte pijplijn: app → prompt sjabloon + CSV-gegevens → vervang tijdelijke aanduidingen in prompt → API-aanroep met image_size=2048x1152 → ontvang base64 PNG → sla bestand + herkomstmetadata op → voeg indien nodig eventueel het exacte lettertype toe via de compositor.

Hoe moet ik een productielijn ontwerpen en hoe moet ik omgaan met veiligheid/herkomst?

Aanbevolen productiearchitectuur

  1. Prompt + concept-pas (snel model): Gebruik gemini-2.5-flash-image (Nano Banana) om goedkoop veel variaties met kleine resolutie te produceren.
  2. Selectie en verfijning: Kies de beste kandidaten, verfijn prompts en pas inpainting-/maskerbewerkingen toe voor meer precisie.
  3. Hoogwaardige uiteindelijke weergave: Bellen gemini-3-pro-image-preview (Nano Banana Pro) voor definitieve 2K/4K-renders en nabewerking (upsampling, kleurcorrectie).
  4. Herkomst en metadata: Sla prompt, modelversie, tijdstempels en SynthID-info op in uw asset-metadataopslag. Het model koppelt een SynthID-watermerk en de uitvoer kan worden herleid voor naleving en inhoudscontrole.

Veiligheid, rechten en moderatie

  • Auteursrechten en rechten: Upload of genereer geen content die inbreuk maakt op rechten. Gebruik expliciete gebruikersbevestigingen voor door de gebruiker aangeleverde afbeeldingen of prompts die herkenbare gelijkenissen kunnen creëren. Het beleid van Google inzake verboden gebruik en de filters voor modelveiligheid moeten worden gerespecteerd.
  • Filteren en geautomatiseerde controles: gegenereerde afbeeldingen door een interne pijplijn voor contentmoderatie laten lopen (NSFW, haatsymbolen, detectie van politieke/bindende content) voordat ze worden geconsumeerd of openbaar worden gemaakt.

Hoe kan ik beeldbewerking (inpainting), compositie van meerdere afbeeldingen en tekstrendering uitvoeren?

Nano Banana Pro ondersteunt multimodale bewerkingsworkflows: geef een of meer invoerafbeeldingen en een tekstuele instructie met een beschrijving van de bewerkingen (een object verwijderen, de lucht wijzigen, tekst toevoegen). De API accepteert afbeelding + tekst in dezelfde aanvraag; het model kan tekst en afbeeldingen als reacties genereren. Voorbeeldpatronen zijn onder andere gemaskeerde bewerkingen en het mengen van meerdere afbeeldingen (stijloverdracht/compositie). Zie de documentatie voor contents arrays die tekstblobs en binaire afbeeldingen combineren.

Voorbeeld: Bewerken (Python pseudo-flow)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

Met deze conversationele bewerking kunt u de resultaten iteratief aanpassen totdat u een productieklaar bestand hebt.

Node.js-voorbeeld: afbeelding bewerken met masker en meerdere referenties

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(API's accepteren soms Cloud Storage-URI's of base64-image-payloads; raadpleeg de Gemini API-documentatie voor de exacte invoerformaten.)

Voor informatie over het genereren en bewerken van afbeeldingen met behulp van de CometAPI, raadpleeg Handleiding voor het aanroepen van Gemini-3-Pro-image .

Conclusie

Nano Banana Pro (Gemini 3 Pro Image) is een productieve sprong voorwaarts in het genereren van afbeeldingen: een tool voor het visualiseren van data, het uitvoeren van gelokaliseerde bewerkingen en het aansturen van ontwikkelworkflows. Gebruik de Gemini-app voor snelle prototyping, de API voor productie-integratie en volg de bovenstaande aanbevelingen om kosten te beheersen, veiligheid te garanderen en de merkkwaliteit te behouden. Test altijd echte gebruikersworkflows en sla herkomstmetadata op om te voldoen aan transparantie- en auditvereisten.

Gebruik Nano Banana Pro wanneer je het nodig hebt studiokwaliteit activa, nauwkeurige controle over de compositie, verbeterde tekstweergave in afbeeldingen en de mogelijkheid om meerdere verwijzingen samen te voegen tot één samenhangend resultaat.

Ontwikkelaars hebben toegang tot Gemini 3 Pro Image (Nano Banana Pro) API via CometAPI. Om te beginnen, verken de modelmogelijkheden vanKomeetAPI in de Speeltuin en raadpleeg de API-handleiding voor gedetailleerde instructies. Voordat u toegang krijgt, moet u ervoor zorgen dat u bent ingelogd op CometAPI en de API-sleutel hebt verkregen. cometAPI bieden een prijs die veel lager is dan de officiële prijs om u te helpen integreren.

Klaar om te gaan?→ Meld u vandaag nog aan voor CometAPI !

Als u meer tips, handleidingen en nieuws over AI wilt weten, volg ons dan op VKX  en  Discord!

SHARE THIS BLOG

500+ modellen in één API

Tot 20% korting