Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Inndata:$1.5616/M
Utdata:$9.3696/M
Nano Banana Pro er en KI-modell for generell bistand i tekstsentrerte arbeidsflyter. Den egner seg for instruksjonsbasert prompting for å generere, transformere og analysere innhold med kontrollerbar struktur. Typiske bruksområder inkluderer chatassistenter, dokumentoppsummering, kunnskaps-QA og automatisering av arbeidsflyter. Offentlige tekniske detaljer er begrensede; integrasjonen samsvarer med vanlige mønstre for KI-assistenter, som strukturerte utdata, gjenfinning-forsterkede prompter og verktøy- eller funksjonskall.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API
Versjoner

Grunnleggende funksjoner

  • Text → Image: fullstendig prompt-drevet generering med sterk etterlevelse av prompten.
  • Image → Image (redigeringer): fine, målrettede endringer med bevart motiv-/karakterkonsistens på tvers av flere redigeringer.
  • Maksimal utgangsoppløsning: opptil 4K (eksempler og støttede nøyaktige pikselstørrelser avhenger av sideforhold; API-et eksponerer 1K/2K/4K-forhåndsinnstillinger)
  • Iterativ planlegging og selvkorrigering: en intern «flertrinns» pipeline som oppdager og retter vanlige visuelle feil (perspektiv, tekst, fin geometri).
  • Avansert tekstgjengivelse i bildet: klar, leselig flerspråklig tekst (fra korte bildetekster til lange avsnitt) egnet for plakater, mockups og infografikk.
  • 5 karakterer og troskap for opptil 14 objekter/referansebilder i én arbeidsflyt.
  • Vannmerking / proveniens: alle genererte bilder inkluderer et SynthID-vannmerke; modellen legger inn C2PA-metadata for proveniens i noen produktintegrasjoner.

Gemini 3 Pro Image-versjoner og navngivning

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Tekniske detaljer

Arkitektur

  • Avstamning / backbone: Nano Banana Pro er bygget på Googles utviklende Gemini-bildestakk — spesifikt den nye Gemini 3 Pro Image / GEMPIX 2-arkitekturen (et multimodalt bilde+tekst-rammeverk med høyere kapasitet). Dette er en videreutvikling fra Gemini 2.5 Flash Image (den opprinnelige «nano-banana») til en nativt multimodal bildemodell med utvidede visjon-språk-resonneringsevner.
  • Modellatferd: innebygd multimodalitet (bilde + tekst + kunnskap om verden), eksplisitte pipelines for multi-bildesammensmelting og en intern planlegger i stadier som forfiner utdata over flere pass i stedet for å produsere én statisk prøve. Tidlige rapporter indikerer sterkere geometrisk/optisk resonnering (glass, refraksjon) sammenlignet med tidligere versjoner.
  • Tenkning / intern raffinering: Modellen bruker en synlig «tenke»-prosess internt for å forfine komposisjon (API-et dokumenterer denne oppførselen og påpeker at disse interne stegene ikke belastes som endelige bildetokener).
  • Forankring og verktøy: Støtter Search-grounding (kan inkorporere web-fakta i diagram-/infografikkgenerering). Den støtter også systeminstruksjoner for mer deterministisk kontroll.

Nøkkelparametere for API:

  • thinking_level (low / high) for å balansere latens mot resonneringsdybde;
  • media_resolution (low/medium/high) for å styre tokens for bilde-OCR/detallesing;
  • generationConfig.imageConfig for å styre sideforhold/oppløsning i bildegeneratorens utdata.

Begrensninger for bilder:

  • Støttede inndatamodaliteter: Tekst og bilder (modellen aksepterer ikke lyd eller video som bildegenereringsinput).
  • Maks bilder per prompt: 14 (for Gemini 3 Pro Image preview).
  • Maks bildefilstørrelse (opplasting): 7 MB per inndatabilde.
  • Støttede sideforhold: 1:1, 3:2, 16:9, 9:16, 21:9, etc.

Utgangsbilder / tokens: høye grenser, med 4K/4096px støttet.

Benchmark-ytelse

Kort oppsummering: offentlige/tidlige benchmarker er så langt hovedsakelig kvalitative / fellesskapsdrevne, men rapporterer jevnt over betydelige forbedringer i oppløsning, reduksjon av artefakter og fysisk troverdighet sammenlignet med den opprinnelige nano-banana (Gemini 2.5 Flash Image). Spesifikke navngitte «challenges» har vist klare visuelle gevinster, men det finnes ennå ikke (offentlige) standardiserte numeriske benchmark-tabeller fra Google som sammenligner v1 → v2 på tvers av standard bildegenereringsmetrikker.

  • Kvalitative fellestester: Renere kanter, skarpere mikrodetaljer, mer korrekte farger og mer trofast etterlevelse av prompt (færre hallusinerte rekvisitter, mer konsistente karakterer). Populære uformelle tester inkluderer den såkalte «Wine Glass Test» og «Glass Burger Challenge», der GEMPIX2 (Nano Banana Pro) håndterer transparens og refraksjon merkbart bedre enn tidligere bygg.
  • Teksthåndtering: Nano Banana Pro viser synlig forbedret typografi og tekstplassering inni bilder (en vedvarende svakhet for mange bildemodeller). Sammenligninger i fellesskapet indikerer færre forvanskede gjengitte glyfer.
  • Gjennomstrømning / UX: raskere iterasjonshastighet og en UX som utfører flertrinns forfining på baksiden slik at brukere ser mer pålitelige førstegangsresultater (reduserer manuelle re-rulls).

Begrensninger og risiko

  • Innholdsfiltre og deteksjon: Plattformene som integrerer modellen (f.eks. Whisk/tredjepartsapper) kan aktivere streng kjendis- eller likhetsdeteksjon og blokkere bestemte utdata, noe som påvirker kreative arbeidsflyter som er avhengige av realistiske kjendislikheter.
  • Hallusinasjon / grensetilfeller i resonnering: selv om forbedret, kan modellen fortsatt produsere fysisk urealistiske artefakter, spesielt med tett symbolsk tekst inne i bilder eller svært tekniske diagrammer — selv om NB2 ser ut til å redusere disse feilene sammenlignet med tidligere versjoner.
  • Sikkerhet og misbruk: generative bildemodeller kan brukes til å skape problematisk eller skadelig innhold. Google anvender begrensninger, innholdsfiltre og SynthID-vannmerket for å hjelpe med proveniens; likevel har misbruk forekommet (høyt profilerte kontroverser knyttet til et Nano Banana-generert bilde i en politisk sensitiv setting).

Hvordan Nano Banana Pro står seg mot andre modeller

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — sterk mobilintegrasjon, multi-bildesammensmelting, iterativ selvkorrigering, 2K native/4K oppskalering, tett integrert i Google-apper (Search, Photos, Workspace/Gemini). Best for arbeidsflyter som trenger pålitelige redigeringer, kontinuitet og integrasjon med Google-tjenester.
  • Midjourney — utmerker seg i stiliserte kunstneriske utdata og fellesskapsdrevet prompt-ingeniørkunst; ikke vanligvis rettet mot foto-nøyaktig multi-bildesammensmelting eller dype multimodale redigeringspipeliner.
  • Stable Diffusion / åpne vekter — helt åpen, høyst tilpassbar og kan kjøres lokalt; økosystemet av checkpoints og finjustering er en avgjørende fordel for forskning og offline-bruk. Mindre «én-klikk» mobilintegrasjon og mindre konsistent multi-bilderedigeringskoherens rett ut av boksen enn Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — nylig posisjonert eksplisitt som en Nano Banana-konkurrent, med vekt på ultrarask rendering, 2K-utdata og støtte for mange referansebilder (opptil seks). Posisjonert som et pro-/skaper-alternativ.

(Disse sammenligningene er på høyt nivå; velg en vinner ved å matche verktøyet til din arbeidsflyt: åpenhet/tilpasningsmuligheter → Stable Diffusion; stilisert kunst → Midjourney; integrert, konsistent mobilredigering med aggressiv iterasjon → Nano Banana Pro/Gemini 3 Pro image-familien.)

Virkelige bruksområder

  • Mobil bilderedigering og kreative filtre (Google Photos-integrasjoner — restyling, bakgrunnsfusjon, portrettrekomposisjon).
  • Markedsføring og annonsemateriell — rask konseptgenerering, konsistente merkevarekarakterer på tvers av flere rammer/vinkler.
  • Konseptkunst og storyboard — multi-bildesammensmelting hjelper med å bevare karakterkontinuitet på tvers av paneler.
  • E-handel / produktmockups — generer konsistente produktbilder i ulike kontekster/lysforhold.
  • Rask prototyping for AR/VR-ressurser — høy kvalitet 2K/4K-utdata som kan oppskaleres for immersive bruk.

**Slik får du tilgang til gemini-3-pro-image(Nano Banana Pro) API

Nødvendige trinn

  • Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først
  • Hent tilgangslegitimasjonen API-nøkkel for grensesnittet. Klikk «Add Token» ved API token i det personlige senteret, hent token-nøkkelen: sk-xxxxx og send inn.
  • Hent nettadressen til dette nettstedet: https://api.cometapi.com/

Bruksmåte

  1. Velg «gemini-3-pro-image»-endepunktet for å sende API-forespørselen og sett forespørselskroppen. Forespørselsmetode og -kropp hentes fra vår nettsides API-dokumentasjon. Vår nettside tilbyr også Apifox-test for din bekvemmelighet.
  2. Bytt ut <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din.
  3. Sett inn spørsmålet eller forespørselen din i feltet content — det er dette modellen svarer på.
  4. Behandle API-responsen for å hente det genererte svaret.

CometAPI tilbyr en fullt kompatibel REST API—for sømløs migrering. Viktige detaljer :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

FAQ

Kan Gemini 3 Pro Image generere bilder i 4K-oppløsning?

Ja, Nano Banana Pro (Gemini 3 Pro Image) støtter naturlig utdata på opptil 4K-oppløsning med sideforhold som inkluderer 1:1, 3:2, 16:9, 9:16 og 21:9. Den støtter også forhåndsinnstillingene 1K og 2K via parameteren imageConfig.

Hvordan håndterer Nano Banana Pro tekstgjengivelse inne i bilder?

Nano Banana Pro har avansert tekstgjengivelse i bilder med klar, lesbar støtte for flerspråklig tekst – fra korte bildetekster til lange avsnitt. Dette gjør den ideell for plakater, infografikk, UI-mockuper og markedsføringsmateriell.

Kan jeg redigere bilder samtalebasert med Gemini 3 Pro Image?

Ja, Nano Banana Pro støtter flerrunders samtalebasert redigering. Bare be om endringer som 'Gjør bakgrunnen til en solnedgang', så opprettholder modellen den visuelle konteksten gjennom Thought Signatures mellom rundene.

Hva gjør Nano Banana Pro annerledes enn FLUX 2 Pro eller Midjourney?

Nano Banana Pro utmerker seg med iterativ selvkorrigering, konsekvent bevaring av figurer på tvers av flere redigeringer og tett integrasjon med Googles økosystem. Den håndterer opptil 14 referansebilder for komplekse arbeidsflyter for sammenslåing av flere bilder.

Bruker Nano Banana Pro Google Search for faktabasert bildegenerering?

Ja, Nano Banana Pro kan bruke Search-grounding til å verifisere fakta før bilder genereres. For eksempel kan den hente gjeldende værdata for å lage en nøyaktig værinfografikk for Tokyo.

Hvor mange referansebilder kan Nano Banana Pro behandle i én forespørsel?

Nano Banana Pro støtter opptil 14 inndatabilder per prompt med maksimalt 7 MB per bilde. Den opprettholder motiv- og figurkonsistens på tvers av opptil 5 figurer i komplekse scenarioer for sammenslåing av flere bilder.

Funksjoner for Nano Banana Pro

Utforsk nøkkelfunksjonene til Nano Banana Pro, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for Nano Banana Pro

Utforsk konkurransedyktige priser for Nano Banana Pro, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Nano Banana Pro kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Eksempelkode og API for Nano Banana Pro

Få tilgang til omfattende eksempelkode og API-ressurser for Nano Banana Pro for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til Nano Banana Pro i prosjektene dine.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Versjoner av Nano Banana Pro

Grunnen til at Nano Banana Pro har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
Modell-IDbeskrivelseTilgjengelighetForespørsel
nano-banana-pro-allDen brukte teknologien er uoffisiell og genereringen er ustabil osv., Chat format✅Chat format
gemini-3-pro-imageAnbefalt, peker til den nyeste modellen✅Gemini genererer bilder
gemini-3-pro-image-previewOffisiell forhåndsvisning✅Gemini genererer bilder

Flere modeller