Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Invoer:$1.5616/M
Uitvoer:$9.3696/M
Nano Banana Pro is een AI-model voor algemene ondersteuning in tekstgerichte workflows. Het is geschikt voor prompting in instructiestijl om content met een controleerbare structuur te genereren, transformeren en analyseren. Typische toepassingen zijn chatassistenten, samenvattingen van documenten, kennisgerichte vraagbeantwoording en workflow-automatisering. Openbare technische details zijn beperkt; de integratie sluit aan bij gangbare AI-assistentpatronen, zoals gestructureerde uitvoer, retrieval-verrijkte prompts en het aanroepen van tools of functies.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API
Versies

Basisfuncties

  • Tekst → Afbeelding: volledige, promptgestuurde generatie met sterke naleving van de prompt.
  • Afbeelding → Afbeelding (bewerkingen): verfijnde, gerichte bewerkingen met behouden onderwerp-/personageconsistentie over meerdere bewerkingen.
  • Maximale uitvoerresolutie: tot 4K (voorbeelden en ondersteunde exacte pixelafmetingen hangen af van de beeldverhouding; de API biedt 1K/2K/4K-presets)
  • Iteratieve planning & zelfcorrectie: een interne “multi-stage”-pijplijn die veelvoorkomende visuele fouten detecteert en corrigeert (perspectief, tekst, fijne geometrie).
  • Geavanceerde tekstrendering in afbeeldingen: duidelijke, leesbare meertalige tekst (van korte bijschriften tot lange alinea’s) geschikt voor posters, mock-ups en infographics.
  • 5 personages en trouw voor maximaal 14 objecten/referentieafbeeldingen in één workflow.
  • Watermerken / herkomst: alle gegenereerde afbeeldingen bevatten een SynthID-watermerk; model voegt C2PA-metagegevens in voor herkomst in sommige productintegraties.

Gemini 3 Pro Image-versies & naamgeving

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Technische details

Architectuur

  • Afstamming / ruggengraat: Nano Banana Pro is gebouwd op Google’s evoluerende Gemini-afbeeldingsstack — specifiek de nieuwe Gemini 3 Pro Image / GEMPIX 2-architectuur (een multimodaal beeld+tekst-framework met hogere capaciteit). Dat is een evolutie van Gemini 2.5 Flash Image (de oorspronkelijke “nano-banana”) naar een van nature multimodaal afbeeldingsmodel met uitgebreide visuele-taalredeneercapaciteiten.
  • Modelgedrag: native multimodaliteit (afbeelding + tekst + wereldkennis), expliciete pijplijnen voor multi-afbeeldingsfusie, en een interne stapsgewijze planner die uitvoer verfijnt over meerdere doorlopen in plaats van één statisch voorbeeld te produceren. Vroege rapporten wijzen op sterker geometrisch/optisch redeneren (glas, breking) vergeleken met eerdere versies.
  • Denken / interne verfijning: het model gebruikt intern een zichtbaar “denk”-proces om de compositie te verfijnen (de API documenteert dit gedrag en merkt op dat die interne stappen niet als definitieve afbeeldingstokens worden aangerekend).
  • Grounding & tools: ondersteunt Search grounding (kan webfeiten verwerken in de generatie van diagrammen/infographics). Ondersteunt ook systeeminstructies voor meer deterministische controle.

Belangrijke API-parameters:

  • thinking_level (low / high) om latentie af te wegen tegen diepte van redeneren;
  • media_resolution (low/medium/high) om de OCR-/detaillezing-tokens voor afbeeldingen te bepalen;
  • generationConfig.imageConfig om beeldverhouding/resolutie in afbeeldingsuitvoer te bepalen.

Afbeeldingslimieten:

  • Ondersteunde invoermodaliteiten: tekst en afbeeldingen (het model accepteert geen audio of video als invoer voor beeldgeneratie).
  • Maximaal aantal afbeeldingen per prompt: 14 (voor de Gemini 3 Pro Image preview).
  • Maximale afbeeldingsgrootte (upload): 7 MB per invoerafbeelding.
  • Ondersteunde beeldverhoudingen: 1:1, 3:2, 16:9, 9:16, 21:9, enz.

Uitvoerafbeeldingen / tokens: hoge limieten, met 4K/4096px ondersteund.

Benchmark-prestaties

Korte samenvatting: publieke/vroege benchmarks zijn tot nu toe vooral kwalitatief / community-gestuurd, maar melden consequent aanzienlijke verbeteringen in resolutie, artefactreductie en fysieke getrouwheid ten opzichte van de oorspronkelijke nano-banana (Gemini 2.5 Flash Image). Specifieke, benoemde “challenges” tonen duidelijke visuele winst, maar er zijn nog geen (publieke) gestandaardiseerde numerieke benchmarktabellen van Google die v1 → v2 vergelijken over standaard maatstaven voor beeldgeneratie.

  • Kwalitatieve communitytests: schonere randen, scherpere microdetails, natuurgetrouwere kleuren en betere naleving van prompts (minder gehallucineerde rekwisieten, consistenter personages). Populaire informele tests omvatten de zogeheten “Wine Glass Test” en “Glass Burger Challenge”, waarbij GEMPIX2 (Nano Banana Pro) transparantie en breking aanzienlijk beter afhandelt dan eerdere builds.
  • Tekstverwerking: Nano Banana Pro vertoont zichtbaar verbeterde typografie en tekstplaatsing in afbeeldingen (een hardnekkige zwakte voor veel beeldmodellen). Communityvergelijkingen duiden op minder verminkte weergegeven glyphs.
  • Doorvoer / UX: hogere iteratiesnelheid en een UX die meertrapse verfijning op de backend uitvoert, zodat gebruikers betrouwbaardere resultaten bij de eerste doorloop zien (minder handmatige hergeneraties).

Beperkingen & risico’s

  • Contentfilters & detectie: platforms die het model integreren (bijv. Whisk/third-party-apps) kunnen strikte detectie van beroemdheden of gelijkenis inschakelen en bepaalde uitvoer blokkeren, wat impact heeft op creatieve workflows die steunen op realistische gelijkenissen van beroemdheden.
  • Hallucinatie / randgevallen in redeneren: hoewel verbeterd, kan het model nog steeds fysiek onrealistische artefacten produceren, vooral bij dichte symbolische tekst in afbeeldingen of zeer technische diagrammen — al lijkt NB2 deze fouten te verminderen ten opzichte van eerdere versies.
  • Veiligheid & misbruik: generatieve beeldmodellen kunnen worden gebruikt om problematische of schadelijke inhoud te creëren. Google past beperkingen, contentfilters en het SynthID-watermerk toe om herkomst te ondersteunen; desondanks is misbruik voorgekomen (een spraakmakende controverse rond een door Nano Banana gegenereerde afbeelding in een politiek gevoelige context).

Hoe Nano Banana Pro zich verhoudt tot andere modellen

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — sterke mobiele integratie, multi-afbeeldingsfusie, iteratieve zelfcorrectie, 2K native/4K-upscaling, nauw geïntegreerd in Google-apps (Search, Photos, Workspace/Gemini). Het beste voor workflows die betrouwbare bewerkingen, continuïteit en integratie met Google-services nodig hebben.
  • Midjourney — blinkt uit in gestileerde artistieke output en communitygedreven prompt-engineering; richt zich doorgaans niet op foto-accurate multi-afbeeldingsfusie of diepe multimodale bewerkingspijplijnen.
  • Stable Diffusion / open weights — volledig open, sterk aanpasbaar en lokaal te hosten; het ecosysteem van checkpoints en fine-tuning is een beslissend voordeel voor onderzoek en offline gebruik. Minder “one-click”-mobiele integratie en minder consistente coherentie bij multi-afbeeldingsbewerking out-of-the-box dan Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — recent expliciet gepositioneerd als een Nano Banana-concurrent, met nadruk op ultrasnelle rendering, 2K-uitvoer en ondersteuning voor veel referentieafbeeldingen (tot zes). Gepositioneerd als een pro/creator-alternatief.

(Deze vergelijkingen zijn op hoofdlijnen; kies een winnaar door de tool te matchen met je workflow: openheid/aanpasbaarheid → Stable Diffusion; gestileerde kunst → Midjourney; geïntegreerde, consistente mobiele editing met agressieve iteratie → Nano Banana Pro/ Gemini 3 Pro Image-familie.)

Praktische use-cases

  • Mobiele fotobewerking & creatieve filters (integraties met Google Photos — restyling, achtergrondfusie, hercompositie van portretten).
  • Marketing- & advertentie-assets — snelle conceptgeneratie, consistente merkkarakters over meerdere frames/hoeken.
  • Concept art & storyboarding — multi-afbeeldingsfusie helpt om personagecontinuïteit over panelen te behouden.
  • E-commerce / productmock-ups — genereer consistente productshots in verschillende contexten/lichtomstandigheden.
  • Snelle prototyping voor AR/VR-assets — hoogwaardige 2K/4K-uitvoer die kan worden opgeschaald voor immersieve toepassingen.
  • Hoe krijg je toegang tot de gemini-3-pro-image (Nano Banana Pro) API

Vereiste stappen

  • Log in op [cometapi.com]. Als je nog geen gebruiker bent, registreer je dan eerst
  • Verkrijg de toegangssleutel (API key) voor de interface. Klik op “Add Token” bij de API-token in het persoonlijke centrum, haal de tokensleutel: sk-xxxxx op en dien deze in.
  • Verkrijg de URL van deze site: https://api.cometapi.com/

Gebruiksmethode

  1. Selecteer de “gemini-3-pro-image”-endpoint om het API-verzoek te versturen en stel de request body in. De requestmethode en request body zijn te vinden in de API-documentatie op onze website. Onze website biedt ook Apifox-tests voor je gemak.
  2. Vervang <YOUR_API_KEY> door je daadwerkelijke CometAPI-sleutel uit je account.
  3. Plaats je vraag of verzoek in het content-veld — dit is waarop het model zal reageren.
  4. . Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.

CometAPI biedt een volledig compatibele REST API — voor naadloze migratie. Belangrijke details :

  • Basis-URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Modelnamen: gemini-3-pro-image
  • Authenticatie: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

Veelgestelde vragen

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

Functies voor Nano Banana Pro

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Nano Banana Pro, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Nano Banana Pro这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Nano Banana Pro, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Nano Banana Pro, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Nano Banana Pro, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Nano Banana Pro

Ontdek concurrerende prijzen voor Nano Banana Pro, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Nano Banana Pro uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Voorbeeldcode en API voor Nano Banana Pro

Krijg toegang tot uitgebreide voorbeeldcode en API-bronnen voor Nano Banana Pro om uw integratieproces te stroomlijnen. Onze gedetailleerde documentatie biedt stapsgewijze begeleiding en helpt u het volledige potentieel van Nano Banana Pro in uw projecten te benutten.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Versies van Nano Banana Pro

De reden waarom Nano Banana Pro meerdere snapshots heeft, kan mogelijke factoren omvatten zoals variaties in de uitvoer na updates die oudere snapshots vereisen voor consistentie, het bieden van een overgangsperiode voor ontwikkelaars om zich aan te passen en te migreren, en verschillende snapshots die overeenkomen met wereldwijde of regionale eindpunten om de gebruikerservaring te optimaliseren. Voor gedetailleerde verschillen tussen versies, raadpleeg de officiële documentatie.
Model-idBeschrijvingBeschikbaarheidAanvraag
nano-banana-pro-allDe gebruikte technologie is onofficieel en het genereren is instabiel, enz., Chat formaat✅Chat formaat
gemini-3-pro-imageAanbevolen, verwijst naar het nieuwste model✅Gemini genereert een afbeelding
gemini-3-pro-image-previewOfficiële preview✅Gemini genereert een afbeelding

Meer modellen