Basisfuncties
- Tekst → Afbeelding: volledige, promptgestuurde generatie met sterke naleving van de prompt.
- Afbeelding → Afbeelding (bewerkingen): verfijnde, gerichte bewerkingen met behouden onderwerp-/personageconsistentie over meerdere bewerkingen.
- Maximale uitvoerresolutie: tot 4K (voorbeelden en ondersteunde exacte pixelafmetingen hangen af van de beeldverhouding; de API biedt 1K/2K/4K-presets)
- Iteratieve planning & zelfcorrectie: een interne “multi-stage”-pijplijn die veelvoorkomende visuele fouten detecteert en corrigeert (perspectief, tekst, fijne geometrie).
- Geavanceerde tekstrendering in afbeeldingen: duidelijke, leesbare meertalige tekst (van korte bijschriften tot lange alinea’s) geschikt voor posters, mock-ups en infographics.
- 5 personages en trouw voor maximaal 14 objecten/referentieafbeeldingen in één workflow.
- Watermerken / herkomst: alle gegenereerde afbeeldingen bevatten een SynthID-watermerk; model voegt C2PA-metagegevens in voor herkomst in sommige productintegraties.
Gemini 3 Pro Image-versies & naamgeving
gemini-3-pro-image-previewgemini-3-pro-image
Technische details
Architectuur
- Afstamming / ruggengraat: Nano Banana Pro is gebouwd op Google’s evoluerende Gemini-afbeeldingsstack — specifiek de nieuwe Gemini 3 Pro Image / GEMPIX 2-architectuur (een multimodaal beeld+tekst-framework met hogere capaciteit). Dat is een evolutie van Gemini 2.5 Flash Image (de oorspronkelijke “nano-banana”) naar een van nature multimodaal afbeeldingsmodel met uitgebreide visuele-taalredeneercapaciteiten.
- Modelgedrag: native multimodaliteit (afbeelding + tekst + wereldkennis), expliciete pijplijnen voor multi-afbeeldingsfusie, en een interne stapsgewijze planner die uitvoer verfijnt over meerdere doorlopen in plaats van één statisch voorbeeld te produceren. Vroege rapporten wijzen op sterker geometrisch/optisch redeneren (glas, breking) vergeleken met eerdere versies.
- Denken / interne verfijning: het model gebruikt intern een zichtbaar “denk”-proces om de compositie te verfijnen (de API documenteert dit gedrag en merkt op dat die interne stappen niet als definitieve afbeeldingstokens worden aangerekend).
- Grounding & tools: ondersteunt Search grounding (kan webfeiten verwerken in de generatie van diagrammen/infographics). Ondersteunt ook systeeminstructies voor meer deterministische controle.
Belangrijke API-parameters:
thinking_level(low / high) om latentie af te wegen tegen diepte van redeneren;media_resolution(low/medium/high) om de OCR-/detaillezing-tokens voor afbeeldingen te bepalen;generationConfig.imageConfigom beeldverhouding/resolutie in afbeeldingsuitvoer te bepalen.
Afbeeldingslimieten:
- Ondersteunde invoermodaliteiten: tekst en afbeeldingen (het model accepteert geen audio of video als invoer voor beeldgeneratie).
- Maximaal aantal afbeeldingen per prompt: 14 (voor de Gemini 3 Pro Image preview).
- Maximale afbeeldingsgrootte (upload): 7 MB per invoerafbeelding.
- Ondersteunde beeldverhoudingen: 1:1, 3:2, 16:9, 9:16, 21:9, enz.
Uitvoerafbeeldingen / tokens: hoge limieten, met 4K/4096px ondersteund.
Benchmark-prestaties
Korte samenvatting: publieke/vroege benchmarks zijn tot nu toe vooral kwalitatief / community-gestuurd, maar melden consequent aanzienlijke verbeteringen in resolutie, artefactreductie en fysieke getrouwheid ten opzichte van de oorspronkelijke nano-banana (Gemini 2.5 Flash Image). Specifieke, benoemde “challenges” tonen duidelijke visuele winst, maar er zijn nog geen (publieke) gestandaardiseerde numerieke benchmarktabellen van Google die v1 → v2 vergelijken over standaard maatstaven voor beeldgeneratie.
- Kwalitatieve communitytests: schonere randen, scherpere microdetails, natuurgetrouwere kleuren en betere naleving van prompts (minder gehallucineerde rekwisieten, consistenter personages). Populaire informele tests omvatten de zogeheten “Wine Glass Test” en “Glass Burger Challenge”, waarbij GEMPIX2 (Nano Banana Pro) transparantie en breking aanzienlijk beter afhandelt dan eerdere builds.
- Tekstverwerking: Nano Banana Pro vertoont zichtbaar verbeterde typografie en tekstplaatsing in afbeeldingen (een hardnekkige zwakte voor veel beeldmodellen). Communityvergelijkingen duiden op minder verminkte weergegeven glyphs.
- Doorvoer / UX: hogere iteratiesnelheid en een UX die meertrapse verfijning op de backend uitvoert, zodat gebruikers betrouwbaardere resultaten bij de eerste doorloop zien (minder handmatige hergeneraties).
Beperkingen & risico’s
- Contentfilters & detectie: platforms die het model integreren (bijv. Whisk/third-party-apps) kunnen strikte detectie van beroemdheden of gelijkenis inschakelen en bepaalde uitvoer blokkeren, wat impact heeft op creatieve workflows die steunen op realistische gelijkenissen van beroemdheden.
- Hallucinatie / randgevallen in redeneren: hoewel verbeterd, kan het model nog steeds fysiek onrealistische artefacten produceren, vooral bij dichte symbolische tekst in afbeeldingen of zeer technische diagrammen — al lijkt NB2 deze fouten te verminderen ten opzichte van eerdere versies.
- Veiligheid & misbruik: generatieve beeldmodellen kunnen worden gebruikt om problematische of schadelijke inhoud te creëren. Google past beperkingen, contentfilters en het SynthID-watermerk toe om herkomst te ondersteunen; desondanks is misbruik voorgekomen (een spraakmakende controverse rond een door Nano Banana gegenereerde afbeelding in een politiek gevoelige context).
Hoe Nano Banana Pro zich verhoudt tot andere modellen
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — sterke mobiele integratie, multi-afbeeldingsfusie, iteratieve zelfcorrectie, 2K native/4K-upscaling, nauw geïntegreerd in Google-apps (Search, Photos, Workspace/Gemini). Het beste voor workflows die betrouwbare bewerkingen, continuïteit en integratie met Google-services nodig hebben.
- Midjourney — blinkt uit in gestileerde artistieke output en communitygedreven prompt-engineering; richt zich doorgaans niet op foto-accurate multi-afbeeldingsfusie of diepe multimodale bewerkingspijplijnen.
- Stable Diffusion / open weights — volledig open, sterk aanpasbaar en lokaal te hosten; het ecosysteem van checkpoints en fine-tuning is een beslissend voordeel voor onderzoek en offline gebruik. Minder “one-click”-mobiele integratie en minder consistente coherentie bij multi-afbeeldingsbewerking out-of-the-box dan Nano Banana Pro.
- Seedream 4.0 (ByteDance) — recent expliciet gepositioneerd als een Nano Banana-concurrent, met nadruk op ultrasnelle rendering, 2K-uitvoer en ondersteuning voor veel referentieafbeeldingen (tot zes). Gepositioneerd als een pro/creator-alternatief.
(Deze vergelijkingen zijn op hoofdlijnen; kies een winnaar door de tool te matchen met je workflow: openheid/aanpasbaarheid → Stable Diffusion; gestileerde kunst → Midjourney; geïntegreerde, consistente mobiele editing met agressieve iteratie → Nano Banana Pro/ Gemini 3 Pro Image-familie.)
Praktische use-cases
- Mobiele fotobewerking & creatieve filters (integraties met Google Photos — restyling, achtergrondfusie, hercompositie van portretten).
- Marketing- & advertentie-assets — snelle conceptgeneratie, consistente merkkarakters over meerdere frames/hoeken.
- Concept art & storyboarding — multi-afbeeldingsfusie helpt om personagecontinuïteit over panelen te behouden.
- E-commerce / productmock-ups — genereer consistente productshots in verschillende contexten/lichtomstandigheden.
- Snelle prototyping voor AR/VR-assets — hoogwaardige 2K/4K-uitvoer die kan worden opgeschaald voor immersieve toepassingen.
- Hoe krijg je toegang tot de gemini-3-pro-image (Nano Banana Pro) API
Vereiste stappen
- Log in op [cometapi.com]. Als je nog geen gebruiker bent, registreer je dan eerst
- Verkrijg de toegangssleutel (API key) voor de interface. Klik op “Add Token” bij de API-token in het persoonlijke centrum, haal de tokensleutel: sk-xxxxx op en dien deze in.
- Verkrijg de URL van deze site: https://api.cometapi.com/
Gebruiksmethode
- Selecteer de “
gemini-3-pro-image”-endpoint om het API-verzoek te versturen en stel de request body in. De requestmethode en request body zijn te vinden in de API-documentatie op onze website. Onze website biedt ook Apifox-tests voor je gemak. - Vervang <YOUR_API_KEY> door je daadwerkelijke CometAPI-sleutel uit je account.
- Plaats je vraag of verzoek in het content-veld — dit is waarop het model zal reageren.
- . Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.
CometAPI biedt een volledig compatibele REST API — voor naadloze migratie. Belangrijke details :
- Basis-URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Modelnamen:
gemini-3-pro-image - Authenticatie:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.