Slik bruker du Nano Banana 2 API

CometAPI
AnnaFeb 27, 2026
Slik bruker du Nano Banana 2 API

Nano Banana 2 — kortnavnet som fellesskapet bruker for Googles nyeste bildegenereringsmodell i Gemini-familien — har raskt endret forventningene til rask bildegenerering og -redigering med høy kvalitet. Lansert i slutten av februar 2026, er denne “Flash Image”-varianten (Gemini 3.1 Flash Image / Nano Banana 2) rettet mot utviklere og produktteam som trenger proffnivå-utdata med høy gjennomstrømning og lav latens. I denne artikkelen kombinerer jeg siste rapportering og dokumentasjon for å forklare hva Nano Banana 2 er, hvordan den presterer i benchmarks, hvordan man får tilgang og kaller den (inkludert via tredjeparts gateways som CometAPI), samt praktiske prompt- og bruksmønstre du kan ta i bruk i produksjon.

CometAPI tilbyr et enkelt HTTP-lignende grensesnitt som eksponerer mange modeller (inkludert bildemodeller) under konsistente endepunkter. Dette kan forenkle bytte mellom leverandører eller kombinering av utdata fra flere modeller. Nano Banana 2 (Gemini 3.1 Image) er live i CometAPI.

Hva er Nano Banana 2?

Nano Banana 2 (internt på linje med Gemini 3.1 Flash Image) er en fokusert, høy-effektiv bildegenereringsmodell fra Google som prioriterer hastighet, lavere kostnad per bilde og sterkere etterlevelse av instruksjoner for kreative og redaksjonelle bildetasker. Den er designet for å stå ved siden av modeller med høyere kvalitet i “Pro”-familien: Nano Banana 2 for høy gjennomstrømning og Nano Banana Pro (Gemini 3 Pro Image) for premium, aktivanivå-utdata.

Den er laget for å levere:

  • Rask inferens (med svært lav latens slik at bildegenerering og redigering føles nærmest øyeblikkelig).
  • Høy visuell kvalitet som nærmer seg “Pro”-familien, men til lavere beregning/kost.
  • Bedre etterlevelse av instruksjoner (mer presis gjengivelse av ønskede motiver, tekst i bilde og scener med flere karakterer).
  • Bred støtte for oppløsning og sideforhold, fra raske små forhåndsvisninger til native 2K/4K-pipelines for endelige aktiva.

Hva gjør Nano Banana 2 annerledes enn den opprinnelige Nano Banana/Pro?

  • Arkitektur / motor: Bygget på Geminis Flash-inferensstack (Gemini 3.1 Flash Image), så den bytter ut noen maks-kvalitetsinnstillinger mot dramatisk hastighets- og kostnadsforbedring.
  • Bruksområder: Ideell for storskala automatisering (markedsføringsaktiva, miniatyrbilder, UI-er), nesten sanntidsredigering og arbeidsflyter der latens og kostnad betyr mye, men du fortsatt trenger Pro-nivå motivtroskap.

Benchmark-ytelse for Nano Banana 2

Slik bruker du Nano Banana 2 API

Konsistent på tvers av kategorier

Gemini 3.1 Flash Image viser målbar forbedring i hver eneste rapporterte kategori sammenlignet med Gemini 2.5 Flash.

Største gevinster

  • Visuell kvalitet
  • Komposisjonell redigering med flere innganger
  • Generell robusthet i redigering

Konkurranseposisjonering

  • Leder intern GenAI-Bench på total preferanse.
  • Overgår GPT-Image 1.5 på totale og visuelle metrikker.
  • Smale inkrementelle forbedringer tyder på arkitektonisk raffinering fremfor et radikalt skifte.

Hvordan får jeg tilgang til Nano Banana 2?

Hvor den er tilgjengelig

Nano Banana 2 er tilgjengelig gjennom Googles Gemini-verktøy (Gemini-appen), Gemini API (dokumentert under Googles AI-utviklerdokumentasjon), og rulles ut via sky- og bedriftsprodukter som Vertex AI for forhåndsvisning/bedriftsintegrasjoner. CometAPI har også annonsert støtte og wrappers for å gjøre integrasjon enkel.

Hvordan bruke Nano Banana 2 API (cometapi): hvilke alternativer finnes?

CometAPIs veiledning bruker en Gemini-stil generateContent-form og returnerer bilder som Base64 i candidates[0].content.parts[].inline_data.data. Du må dekode den Base64-en for å lagre en fil på klientsiden.,You only need to replace  https: //generativelanguage.googleapis.com  with https://api.cometapi.com . The returned image is usually provided as Base64-encoded inline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.

CometAPI tilbyr en samlet REST-wrapper og eksplisitte endepunkter for Gemini-modeller — ideelt om du ønsker én legitimasjon og å kunne bytte leverandør uten å endre applikasjonskoden. For Nano Banana 2 inneholder CometAPI-siden et direkte curl-utdrag for deres gemini-3.1-flash-image-preview:generateContent-endepunkt. Nedenfor er et ryddet curl-eksempel basert på CometAPI-dokumentasjon.

Forutsetninger for å bruke Nano Banana 2 via CometAPI

CometAPI-konto og API-nøkkel: Opprett en konto på CometAPI og generer din API-tilgangsnøkkel (sk-…). Denne nøkkelen brukes til autentisering av alle API-forespørsler til CometAPIs endepunkter.

Programmeringsspråk og kjøremiljøer:

  • Node.js 18+ (for JavaScript/TypeScript)
  • Python 3.10+
  • (Eller ethvert språk som kan gjøre HTTP-forespørsler)

HTTP-verktøy eller SDK-er:

  • For JavaScript: fetch, axios eller OpenAI-kompatibel klient
  • For Python: requests, httpx eller OpenAI-klienten
  • Disse verktøyene hjelper deg å sende API-kall og håndtere svar.

Rask oversikt over forespørselmønsteret

  • Grunn-URL: https://api.cometapi.com (CometAPI-base).
  • Modellnavn: gemini-3.1-flash-image-preview (Nano Banana 2 / gemini 3.1 Flash Image) eller gemini-2.5-flash-image avhengig av tilgjengelighet.
  • Autentisering: Authorization: sk-xxxx-header — CometAPI bruker typisk en sk--stil nøkkel.
  • Respons: bilder returneres som Base64 under response.candidates[0].content.parts[].inline_data.data. Dekod og skriv til disk.

Eksempelarbeidsflyt (på høyt nivå)

  1. Hent en API-nøkkel fra CometAPI.
  2. Velg modellidentifikator (f.eks. gemini-3.1-flash-image eller lignende, avhengig av tilgjengelighet).
  3. Send en POST-forespørsel til modellens genereringsendepunkt med prompten din.
  4. Håndter returert bildedata i appen din (dekod base64, tjen som PNG, osv.).
  5. For bilderedigering, inkluder eksisterende bildedata og redigeringsinstruksjoner i forespørselen.

Bruke den offisielle Gemini API-en (tekst → bilde)

Nedenfor er et kort Node.js-eksempel som viser hvordan du kaller Gemini generateContent-endepunktet for gemini-3.1-flash-image-preview (dette speiler offisielle utdrag i dokumentasjonen). Bytt ut YOUR_API_KEY med din legitimasjon og legg til feilhåndtering for produksjon.

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI tilbyr SDK-er og OpenAI-kompatible klient-wrappere, slik at noen team kan bytte leverandør med minimale kodeendringer, og lar deg be om Base64-kodede bildeutdata eller hostede URL-er avhengig av konfigurasjonen din. Sjekk alltid den offisielle generateContent-skjemaet for nøyaktige felt i payloaden.

Bilde→bilde (redigeringsflyt)

For å redigere et eksisterende bilde:

  1. Konverter kildebildet ditt til Base64 (uten prefikset data:image/...;base64,).
  2. POST med en payload som inkluderer inline_data.data som inneholder denne Base64-strengen og en redigeringsprompt (f.eks. “endre bakgrunn til skumringshimmel, fjern vannmerke”).
  3. Responsen vil inkludere ny Base64-utdata som du dekoder og lagrer.
curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typiske parametere å justere

  • model: velg gemini-3.1-flash-image-preview (Nano Banana 2) eller gemini-3-pro-image-preview (Pro).
  • imageConfig.aspect_ratio og imageConfig.image_size (512, 1K, 2K, 4K) — påvirker kost og latens.
  • responseModalities: ["Image"] eller ["Text","Image"] for multimodale flyter.

Hvordan bør jeg utforme prompter for Nano Banana 2?

Promptutforming for bildemodeller blander komposisjon, stil, kamerabelysning og begrensninger. Nano Banana 2 er tunet for å følge instruksjoner pålitelig, så balanser kortfattethet med tydelighet.

Promptstruktur (anbefalt)

  1. Hovedmotiv: hvem/hva er i bildet.
  2. Handling eller tilstand: hva motivet gjør.
  3. Miljø og stemning: setting, lys, atmosfære.
  4. Tekniske føringer: kameratype/objektiv, sideforhold, oppløsning, komposisjon.
  5. Stil og referanser: kunststil, kunstnerreferanser (vær oppmerksom på opphavsrett), epoke.
  6. Begrensninger: antall personer/objekter, unngå visse farger, inkluder leselig tekst.

Eksempelprompt:

“Et fotorealistisk bilde av en liten gul banan formet som en vintage-rakett, liggende på et blankpolert mahognybord i et solfylt studio. 50 mm-objektiv, liten dybdeskarphet, varm golden hour-belysning, høy detaljgrad, ingen synlige logoer, 2048×1152.”

Tips for redigeringsprompter (inpainting/erstatning)

  • Oppgi masken tydelig og spesifiser hvilke områder som skal endres.
  • Bruk “bevar”-formulering for områder som skal beholdes (f.eks. “bevar ansiktstrekkene til motivet, erstatt kun bakgrunnen”).
  • For tekst i bilder, oppgi nøyaktig tekst og spesifiser font/stil (f.eks. “leselig sans-serif, sentrert”). Nano Banana 2 legger vekt på bedre tekstrendering, men vær eksplisitt.

Sjekkliste for feilsøking av prompter

  • Hvis utdataene ikke treffer: prøv å forenkle — reduser kreative stilanvisninger først, og legg deretter til detaljer igjen.
  • Hvis teksten er uleselig: spesifiser font, størrelse og kontrast i prompten og øk oppløsningen.
  • Hvis komposisjonen er feil: bruk kamera­vinkel- og objektivspesifikasjoner.

Hvilke vanlige fallgruver finnes, og hvordan unngår jeg dem?

Fallgruve: Overavhengighet av one-shot-prompter

Forvent ikke at én enkelt prompt skal håndtere beskjæring, layout og flertrinnsredigering. Del arbeidet i: generer grunnlag → rediger/erstatt → sluttpolering. Bruk seed og masker for presisjon.

Fallgruve: Å ignorere proveniens- og opphavsrettskontroller

Ikke rull ut i skala uten SynthID/C2PA eller annen proveniens. Mange virksomheter krever sporbarhet for AI-generert innhold.

Fallgruve: Uforutsette kostnader

Følg med på bruk på modell- og endepunktsnivå, og sett harde bruksgrenser via leverandøren eller en proxy. Flash-nivåer er billigere, men kan fortsatt koste mye hvis du genererer tusenvis av 4K-bilder utilsiktet.

Anbefalte beste praksiser med Nano Banana 2?

Å sette bildegenerering i produksjon krever oppmerksomhet på kostnader, latens, kvalitetskontroll, proveniens og sikkerhet. Nedenfor er praktiske anbefalinger destillert fra felt­rapporter, Google-dokumenter og community-tester.

Promptutforming og deterministiske utdata

  • Mal prompter: for repeterbare utdata (f.eks. produktbilder), bruk strukturerte prompter med faste segmenter (motiv, kamera, lys, tekstur, etterbehandling). Dette reduserer drift mellom kall.
  • Bruk referansebilder og maskinstruksjoner for redigeringer i stedet for å prøve komplekse lokale endringer kun via tekst — det reduserer semantiske feil og artefakter.

Kostnads- og ytelsesjustering

  • Velg Flash/“Nano Banana 2”-modus for stort volum: Trenger du mange raske iterasjoner, bruk Flash-nivå-modeller og mindre størrelser (2K vs 4K) for å redusere kost og latens.
  • Batch forespørsler der det er mulig: noen leverandører støtter multi-prompt-batching — det reduserer total latens per generert aktivum i høy­gjennomstrømnings­pipeliner. (Sjekk dokumentasjonen til leverandøren.)

Sikkerhet, proveniens og juridisk

  • Aktiver SynthID- og C2PA-metadata på genererte aktiva for å støtte nedstrøms revisjon og etterlevelse (særlig ved bruk i annonsering/PR). Google og partnere fremhever SynthID som proveniensmekanisme.
  • Manuell gjennomgang for sensitivt innhold: automatiserte policylag er sterke, men ikke perfekte — bruk manuelle sjekker for publikumsvendt innhold eller materiale som involverer offentlig personer.

Kvalitetssikring

  • Automatiser QA-kontroller: kjør en rask etterklassifisering av genererte bilder for uventede artefakter (feil tekst, lav ansiktstroskap, utilsiktet logoskaping). Hold et scoringssystem og fail-safe fallback til Pro-nivå-rendere hvis auto-sjekk feiler.
  • Lagre prompter og seeds: for reviderbarhet og reproduserbarhet, lagre nøyaktig prompt, tidsstempel, modellversjon og eventuelle seeds eller deterministiske parametere.

Latensfølsom UX

  • Progressiv UX: returner et lavoppløselig/hurtig utkast først, og erstatt med en høyoppløselig/Pro-render når den er klar. Dette holder appen responsiv (mange leverandører tilbyr en “draft” eller Flash-variant).

Avsluttende merknader og neste steg

Nano Banana 2 er bygget for å endre økonomien i bildeførste produksjonsarbeidsflyter: lavere latens og lavere kostnad per kall åpner bruksområder som on-demand annonse­aktiva, rask A/B-testing av kreative varianter og sanntids, samarbeidsbaserte designverktøy. Modellen er allerede integrert på tvers av Googles konsument- og skyflater; for utviklere som vil gå live raskt, tilbyr CometAPI et praktisk markedsplass-wrapper som støtter Gemini-bildeendepunkter pluss andre modeller — et praktisk grep når du vil eksperimentere med flere motorer uten å endre appkoden.
Utviklere kan få tilgang til Nano Banana 2 via CometAPI nå. For å komme i gang, utforsk modellens muligheter i Playground og se API-veiledningen for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og hentet API-nøkkelen. CometAPI tilbyr en pris langt under den offisielle prisen for å hjelpe deg å integrere.

Klar til å starte?→ Registrer deg for Nano Banana 2 i dag !

Hvis du vil ha flere tips, guider og nyheter om KI, følg oss på VK, X og Discord!

Tilgang til toppmodeller til lav kostnad

Les mer