Basisfuncties
- Tekst → Afbeelding: volledige promptgestuurde generatie met sterke naleving van prompts.
- Afbeelding → Afbeelding (bewerkingen): precieze, gerichte bewerkingen met behoud van onderwerp-/personageconsistentie over meerdere bewerkingen.
- Maximale uitvoerresolutie: tot 4K (voorbeelden en exact ondersteunde pixelafmetingen zijn afhankelijk van de beeldverhouding; de API biedt 1K/2K/4K-presets)
- Iteratieve planning & zelfcorrectie: een interne “multistage”-pijplijn die veelvoorkomende visuele fouten detecteert en corrigeert (perspectief, tekst, fijne geometrie).
- Geavanceerde tekstweergave in de afbeelding: duidelijke, leesbare meertalige tekst (van korte bijschriften tot lange alinea’s), geschikt voor posters, mockups en infographics.
- 5 personages en getrouwheid voor maximaal 14 objecten/referentieafbeeldingen in één workflow.
- Watermerken / herkomst: alle gegenereerde afbeeldingen bevatten een SynthID-watermerk; het model voegt C2PA-metagegevens voor herkomst toe in sommige productintegraties.
Gemini 3 Pro Image-versies en naamgeving
gemini-3-pro-image-previewgemini-3-pro-image
Technische details
Architectuur
- Afstamming / backbone: Nano Banana Pro is gebouwd op Google’s evoluerende Gemini-beeldstack — specifiek de nieuwe Gemini 3 Pro Image / GEMPIX 2-architectuur (een multimodaal beeld+tekst-framework met hogere capaciteit). Dat is een evolutie van Gemini 2.5 Flash Image (de oorspronkelijke “nano-banana”) naar een natief multimodaal imagemodel met uitgebreide visie-taalredeneercapaciteiten.
- Modelgedrag: native multimodaliteit (afbeelding + tekst + wereldkennis), expliciete pijplijnen voor het combineren van meerdere afbeeldingen, en een interne gefaseerde planner die outputs over meerdere passes verfijnt in plaats van één statisch sample te produceren. Vroege rapporten wijzen op sterker geometrisch/optisch redeneren (glas, breking) vergeleken met eerdere versies.
- Denkproces / interne verfijning: Het model gebruikt intern een zichtbaar “thinking”-proces om de compositie te verfijnen (de API documenteert dit gedrag en merkt op dat die interne stappen niet als definitieve beeldtokens worden aangerekend).
- Grounding & tools: Ondersteunt Search grounding (kan webfeiten verwerken in diagram-/infographicgeneratie). Het ondersteunt ook systeeminstructies voor meer deterministische controle.
Belangrijkste API-parameters:
thinking_level(low / high) om latentie af te wegen tegen redeneerdiepte;media_resolution(low/medium/high) om OCR-/detailleestokens op afbeeldingen te sturen;generationConfig.imageConfigom beeldverhouding/resolutie in beelduitvoer te sturen.
Beperkingen voor afbeeldingen:
- Ondersteunde invoermodaliteiten: tekst en afbeeldingen (het model accepteert geen audio of video als invoer voor beeldgeneratie).
- Max. afbeeldingen per prompt: 14 (voor de Gemini 3 Pro Image preview).
- Max. afbeeldingsgrootte (upload): 7 MB per invoerafbeelding.
- Ondersteunde beeldverhoudingen: 1:1, 3:2, 16:9, 9:16, 21:9, enz.
Uitvoerafbeeldingen / tokens: hoge limieten, met 4K/4096px ondersteund.
Benchmarkprestaties
Korte samenvatting: publieke/vroege benchmarks zijn vooralsnog grotendeels kwalitatief/community-gedreven, maar melden consistent substantiële verbeteringen in resolutie, artefactreductie en fysieke getrouwheid ten opzichte van de oorspronkelijke nano-banana (Gemini 2.5 Flash Image). Specifieke benoemde “challenges” tonen duidelijke visuele winst, maar er zijn nog geen (publieke) gestandaardiseerde numerieke benchmarktabellen van Google die v1 → v2 vergelijken op standaard beeldgeneratiemetrics.
- Kwalitatieve communitytests: schonere randen, scherpere microdetails, getrouwere kleuren en betere naleving van prompts (minder hallucinerende rekwisieten, consistentere personages). Populaire informele tests omvatten de zogeheten “Wine Glass Test” en “Glass Burger Challenge”, waar GEMPIX2 (Nano Banana Pro) transparantie en breking merkbaar beter afhandelt dan eerdere builds.
- Tekstverwerking: Nano Banana Pro toont zichtbaar verbeterde typografie en tekstplaatsing binnen afbeeldingen (een hardnekkige zwakte van veel imagemodellen). Communityvergelijkingen geven aan dat er minder verminkte gerenderde glyfen zijn.
- Doorvoer / UX: hogere iteratiesnelheid en een UX die multistage-verfijning op de backend uitvoert zodat gebruikers betrouwbaardere eerste resultaten zien (vermindert het aantal handmatige hergeneraties).
Beperkingen & risico’s
- Inhoudsfilters & detectie: Platforms die het model integreren (bijv. Whisk/derdepartij-apps) kunnen strikte celebrity- of gelijkenisherkenning inschakelen en bepaalde outputs blokkeren, wat van invloed is op creatieve workflows die afhankelijk zijn van realistische celebrity-gelijkenissen.
- Hallucinatie / redeneer-randgevallen: hoewel verbeterd, kan het model nog steeds fysiek onrealistische artefacten produceren, vooral met dichte symbolische tekst in afbeeldingen of zeer technische diagrammen — hoewel NB2 deze fouten lijkt te verminderen vergeleken met eerdere versies.
- Veiligheid & misbruik: generatieve imagemodellen kunnen worden gebruikt om problematische of schadelijke content te maken. Google past beperkingen en contentfilters toe en het SynthID-watermerk helpt bij herkomst; desondanks is misbruik voorgekomen (een spraakmakende controverse rond een door Nano Banana gegenereerde afbeelding in een politiek gevoelige context).
Hoe Nano Banana Pro zich verhoudt tot andere modellen
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — sterke mobiele integratie, samenvoegen van meerdere afbeeldingen, iteratieve zelfcorrectie, 2K native/4K upscaling, strak geïntegreerd in Google-apps (Search, Photos, Workspace/Gemini). Het best voor workflows die betrouwbare bewerkingen, continuïteit en integratie met Google-services nodig hebben.
- Midjourney — excelleert in gestileerde artistieke outputs en community-gedreven promptengineering; richt zich doorgaans minder op foto-accurate multi-imagefusie of diepe multimodale bewerkingspijplijnen.
- Stable Diffusion / open gewichten — volledig open, zeer aanpasbaar en lokaal hostbaar; het ecosysteem van checkpoints en fine-tuning is een beslissend voordeel voor onderzoek en offline gebruik. Minder “one-click” mobiele integratie en minder consistente multi-imagebewerkingscoherentie out-of-the-box dan Nano Banana Pro.
- Seedream 4.0 (ByteDance) — recent expliciet gepositioneerd als een Nano Banana-concurrent, met nadruk op razendsnelle rendering, 2K-output en ondersteuning voor veel referentieafbeeldingen (tot zes). Gepositioneerd als een pro/creator-alternatief.
(Dit zijn vergelijkingen op hoog niveau; kies een winnaar door de tool te matchen met uw workflow: openheid/aanpasbaarheid → Stable Diffusion; gestileerde kunst → Midjourney; geïntegreerde, consistente mobiele bewerking met agressieve iteratie → Nano Banana Pro/Gemini 3 Pro Image-familie.)
Use-cases in de praktijk
- Mobiele fotobewerking & creatieve filters (Google Photos-integraties — restyling, achtergrondcompositie, portretrecompositie).
- Marketing- & advertentie-assets — snelle conceptgeneratie, consistente merkpersonages vanuit meerdere frames/hoeken.
- Concept art & storyboarding — het samenvoegen van meerdere afbeeldingen helpt de personagecontinuïteit over panelen heen te behouden.
- E-commerce / productmockups — genereer consistente productshots in verschillende contexten/lichtomstandigheden.
- Snelle prototyping voor AR/VR-assets — hoge kwaliteit 2K/4K-outputs die kunnen worden opgeschaald voor immersieve toepassingen.
- Hoe toegang te krijgen tot gemini-3-pro-image(Nano Banana Pro) API
Vereiste stappen
- Log in op cometapi.com. Als u nog geen gebruiker bent, registreer u dan eerst.
- Verkrijg de toegangssleutel (API-key) van de interface. Klik op “Add Token” bij de API-token in het persoonlijke centrum, verkrijg de tokensleutel: sk-xxxxx en dien deze in.
- Verkrijg de URL van deze site:
https://api.cometapi.com/
Gebruikswijze
- Selecteer het “
gemini-3-pro-image”-endpoint om de API-aanvraag te versturen en stel de request body in. De requestmethode en request body zijn te vinden in de API-documentatie op onze website. Onze website biedt ook een Apifox-test voor uw gemak. - Vervang <YOUR_API_KEY> door uw daadwerkelijke CometAPI-sleutel uit uw account.
- Voeg uw vraag of verzoek in het content-veld in — dit is waar het model op reageert.
- Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.
CometAPI biedt een volledig compatibele REST-API — voor naadloze migratie. Belangrijke details :
- Basis-URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Modelnamen:
gemini-3-pro-image - Authenticatie:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.