Nano Banana 2 — kortnavnet som fellesskapet bruker for Googles nyeste bildegenereringsmodell i Gemini-familien — har raskt endret forventningene til rask bildegenerering og -redigering med høy kvalitet. Lansert i slutten av februar 2026, er denne “Flash Image”-varianten (Gemini 3.1 Flash Image / Nano Banana 2) rettet mot utviklere og produktteam som trenger proffnivå-utdata med høy gjennomstrømning og lav latens. I denne artikkelen kombinerer jeg siste rapportering og dokumentasjon for å forklare hva Nano Banana 2 er, hvordan den presterer i benchmarks, hvordan man får tilgang og kaller den (inkludert via tredjeparts gateways som CometAPI), samt praktiske prompt- og bruksmønstre du kan ta i bruk i produksjon.
CometAPI tilbyr et enkelt HTTP-lignende grensesnitt som eksponerer mange modeller (inkludert bildemodeller) under konsistente endepunkter. Dette kan forenkle bytte mellom leverandører eller kombinering av utdata fra flere modeller. Nano Banana 2 (Gemini 3.1 Image) er live i CometAPI.
Hva er Nano Banana 2?
Nano Banana 2 (internt på linje med Gemini 3.1 Flash Image) er en fokusert, høy-effektiv bildegenereringsmodell fra Google som prioriterer hastighet, lavere kostnad per bilde og sterkere etterlevelse av instruksjoner for kreative og redaksjonelle bildetasker. Den er designet for å stå ved siden av modeller med høyere kvalitet i “Pro”-familien: Nano Banana 2 for høy gjennomstrømning og Nano Banana Pro (Gemini 3 Pro Image) for premium, aktivanivå-utdata.
Den er laget for å levere:
- Rask inferens (med svært lav latens slik at bildegenerering og redigering føles nærmest øyeblikkelig).
- Høy visuell kvalitet som nærmer seg “Pro”-familien, men til lavere beregning/kost.
- Bedre etterlevelse av instruksjoner (mer presis gjengivelse av ønskede motiver, tekst i bilde og scener med flere karakterer).
- Bred støtte for oppløsning og sideforhold, fra raske små forhåndsvisninger til native 2K/4K-pipelines for endelige aktiva.
Hva gjør Nano Banana 2 annerledes enn den opprinnelige Nano Banana/Pro?
- Arkitektur / motor: Bygget på Geminis Flash-inferensstack (Gemini 3.1 Flash Image), så den bytter ut noen maks-kvalitetsinnstillinger mot dramatisk hastighets- og kostnadsforbedring.
- Bruksområder: Ideell for storskala automatisering (markedsføringsaktiva, miniatyrbilder, UI-er), nesten sanntidsredigering og arbeidsflyter der latens og kostnad betyr mye, men du fortsatt trenger Pro-nivå motivtroskap.
Benchmark-ytelse for Nano Banana 2

Konsistent på tvers av kategorier
Gemini 3.1 Flash Image viser målbar forbedring i hver eneste rapporterte kategori sammenlignet med Gemini 2.5 Flash.
Største gevinster
- Visuell kvalitet
- Komposisjonell redigering med flere innganger
- Generell robusthet i redigering
Konkurranseposisjonering
- Leder intern GenAI-Bench på total preferanse.
- Overgår GPT-Image 1.5 på totale og visuelle metrikker.
- Smale inkrementelle forbedringer tyder på arkitektonisk raffinering fremfor et radikalt skifte.
Hvordan får jeg tilgang til Nano Banana 2?
Hvor den er tilgjengelig
Nano Banana 2 er tilgjengelig gjennom Googles Gemini-verktøy (Gemini-appen), Gemini API (dokumentert under Googles AI-utviklerdokumentasjon), og rulles ut via sky- og bedriftsprodukter som Vertex AI for forhåndsvisning/bedriftsintegrasjoner. CometAPI har også annonsert støtte og wrappers for å gjøre integrasjon enkel.
Hvordan bruke Nano Banana 2 API (cometapi): hvilke alternativer finnes?
CometAPIs veiledning bruker en Gemini-stil
generateContent-form og returnerer bilder som Base64 icandidates[0].content.parts[].inline_data.data. Du må dekode den Base64-en for å lagre en fil på klientsiden.,You only need to replacehttps: //generativelanguage.googleapis.comwithhttps://api.cometapi.com. The returned image is usually provided as Base64-encodedinline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.
CometAPI tilbyr en samlet REST-wrapper og eksplisitte endepunkter for Gemini-modeller — ideelt om du ønsker én legitimasjon og å kunne bytte leverandør uten å endre applikasjonskoden. For Nano Banana 2 inneholder CometAPI-siden et direkte curl-utdrag for deres gemini-3.1-flash-image-preview:generateContent-endepunkt. Nedenfor er et ryddet curl-eksempel basert på CometAPI-dokumentasjon.
Forutsetninger for å bruke Nano Banana 2 via CometAPI
CometAPI-konto og API-nøkkel: Opprett en konto på CometAPI og generer din API-tilgangsnøkkel (sk-…). Denne nøkkelen brukes til autentisering av alle API-forespørsler til CometAPIs endepunkter.
Programmeringsspråk og kjøremiljøer:
- Node.js 18+ (for JavaScript/TypeScript)
- Python 3.10+
- (Eller ethvert språk som kan gjøre HTTP-forespørsler)
HTTP-verktøy eller SDK-er:
- For JavaScript:
fetch,axioseller OpenAI-kompatibel klient - For Python:
requests,httpxeller OpenAI-klienten - Disse verktøyene hjelper deg å sende API-kall og håndtere svar.
Rask oversikt over forespørselmønsteret
- Grunn-URL:
https://api.cometapi.com(CometAPI-base). - Modellnavn:
gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image) ellergemini-2.5-flash-imageavhengig av tilgjengelighet. - Autentisering:
Authorization: sk-xxxx-header — CometAPI bruker typisk ensk--stil nøkkel. - Respons: bilder returneres som Base64 under
response.candidates[0].content.parts[].inline_data.data. Dekod og skriv til disk.
Eksempelarbeidsflyt (på høyt nivå)
- Hent en API-nøkkel fra CometAPI.
- Velg modellidentifikator (f.eks.
gemini-3.1-flash-imageeller lignende, avhengig av tilgjengelighet). - Send en POST-forespørsel til modellens genereringsendepunkt med prompten din.
- Håndter returert bildedata i appen din (dekod base64, tjen som PNG, osv.).
- For bilderedigering, inkluder eksisterende bildedata og redigeringsinstruksjoner i forespørselen.
Bruke den offisielle Gemini API-en (tekst → bilde)
Nedenfor er et kort Node.js-eksempel som viser hvordan du kaller Gemini generateContent-endepunktet for gemini-3.1-flash-image-preview (dette speiler offisielle utdrag i dokumentasjonen). Bytt ut YOUR_API_KEY med din legitimasjon og legg til feilhåndtering for produksjon.
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
mkdir -p ./output
curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
-H "Authorization: $COMETAPI_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
}
]
}
],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "9:16"
}
}
}' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
if 'text' in part:
print(part['text'])
elif 'inlineData' in part:
img = base64.b64decode(part['inlineData']['data'])
with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
f.write(img)
print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"
CometAPI tilbyr SDK-er og OpenAI-kompatible klient-wrappere, slik at noen team kan bytte leverandør med minimale kodeendringer, og lar deg be om Base64-kodede bildeutdata eller hostede URL-er avhengig av konfigurasjonen din. Sjekk alltid den offisielle generateContent-skjemaet for nøyaktige felt i payloaden.
Bilde→bilde (redigeringsflyt)
For å redigere et eksisterende bilde:
- Konverter kildebildet ditt til Base64 (uten prefikset
data:image/...;base64,). - POST med en payload som inkluderer
inline_data.datasom inneholder denne Base64-strengen og en redigeringsprompt (f.eks. “endre bakgrunn til skumringshimmel, fjern vannmerke”). - Responsen vil inkludere ny Base64-utdata som du dekoder og lagrer.
curl
--location
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \
--header 'Authorization: ' \
--header 'Content-Type: application/json' \
--data-raw '{ "contents":
[ { "role": "user", "parts":
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } }
] }
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE"
] } }'
Typiske parametere å justere
model: velggemini-3.1-flash-image-preview(Nano Banana 2) ellergemini-3-pro-image-preview(Pro).imageConfig.aspect_ratioogimageConfig.image_size(512,1K,2K,4K) — påvirker kost og latens.responseModalities:["Image"]eller["Text","Image"]for multimodale flyter.
Hvordan bør jeg utforme prompter for Nano Banana 2?
Promptutforming for bildemodeller blander komposisjon, stil, kamerabelysning og begrensninger. Nano Banana 2 er tunet for å følge instruksjoner pålitelig, så balanser kortfattethet med tydelighet.
Promptstruktur (anbefalt)
- Hovedmotiv: hvem/hva er i bildet.
- Handling eller tilstand: hva motivet gjør.
- Miljø og stemning: setting, lys, atmosfære.
- Tekniske føringer: kameratype/objektiv, sideforhold, oppløsning, komposisjon.
- Stil og referanser: kunststil, kunstnerreferanser (vær oppmerksom på opphavsrett), epoke.
- Begrensninger: antall personer/objekter, unngå visse farger, inkluder leselig tekst.
Eksempelprompt:
“Et fotorealistisk bilde av en liten gul banan formet som en vintage-rakett, liggende på et blankpolert mahognybord i et solfylt studio. 50 mm-objektiv, liten dybdeskarphet, varm golden hour-belysning, høy detaljgrad, ingen synlige logoer, 2048×1152.”
Tips for redigeringsprompter (inpainting/erstatning)
- Oppgi masken tydelig og spesifiser hvilke områder som skal endres.
- Bruk “bevar”-formulering for områder som skal beholdes (f.eks. “bevar ansiktstrekkene til motivet, erstatt kun bakgrunnen”).
- For tekst i bilder, oppgi nøyaktig tekst og spesifiser font/stil (f.eks. “leselig sans-serif, sentrert”). Nano Banana 2 legger vekt på bedre tekstrendering, men vær eksplisitt.
Sjekkliste for feilsøking av prompter
- Hvis utdataene ikke treffer: prøv å forenkle — reduser kreative stilanvisninger først, og legg deretter til detaljer igjen.
- Hvis teksten er uleselig: spesifiser font, størrelse og kontrast i prompten og øk oppløsningen.
- Hvis komposisjonen er feil: bruk kameravinkel- og objektivspesifikasjoner.
Hvilke vanlige fallgruver finnes, og hvordan unngår jeg dem?
Fallgruve: Overavhengighet av one-shot-prompter
Forvent ikke at én enkelt prompt skal håndtere beskjæring, layout og flertrinnsredigering. Del arbeidet i: generer grunnlag → rediger/erstatt → sluttpolering. Bruk seed og masker for presisjon.
Fallgruve: Å ignorere proveniens- og opphavsrettskontroller
Ikke rull ut i skala uten SynthID/C2PA eller annen proveniens. Mange virksomheter krever sporbarhet for AI-generert innhold.
Fallgruve: Uforutsette kostnader
Følg med på bruk på modell- og endepunktsnivå, og sett harde bruksgrenser via leverandøren eller en proxy. Flash-nivåer er billigere, men kan fortsatt koste mye hvis du genererer tusenvis av 4K-bilder utilsiktet.
Anbefalte beste praksiser med Nano Banana 2?
Å sette bildegenerering i produksjon krever oppmerksomhet på kostnader, latens, kvalitetskontroll, proveniens og sikkerhet. Nedenfor er praktiske anbefalinger destillert fra feltrapporter, Google-dokumenter og community-tester.
Promptutforming og deterministiske utdata
- Mal prompter: for repeterbare utdata (f.eks. produktbilder), bruk strukturerte prompter med faste segmenter (motiv, kamera, lys, tekstur, etterbehandling). Dette reduserer drift mellom kall.
- Bruk referansebilder og maskinstruksjoner for redigeringer i stedet for å prøve komplekse lokale endringer kun via tekst — det reduserer semantiske feil og artefakter.
Kostnads- og ytelsesjustering
- Velg Flash/“Nano Banana 2”-modus for stort volum: Trenger du mange raske iterasjoner, bruk Flash-nivå-modeller og mindre størrelser (2K vs 4K) for å redusere kost og latens.
- Batch forespørsler der det er mulig: noen leverandører støtter multi-prompt-batching — det reduserer total latens per generert aktivum i høygjennomstrømningspipeliner. (Sjekk dokumentasjonen til leverandøren.)
Sikkerhet, proveniens og juridisk
- Aktiver SynthID- og C2PA-metadata på genererte aktiva for å støtte nedstrøms revisjon og etterlevelse (særlig ved bruk i annonsering/PR). Google og partnere fremhever SynthID som proveniensmekanisme.
- Manuell gjennomgang for sensitivt innhold: automatiserte policylag er sterke, men ikke perfekte — bruk manuelle sjekker for publikumsvendt innhold eller materiale som involverer offentlig personer.
Kvalitetssikring
- Automatiser QA-kontroller: kjør en rask etterklassifisering av genererte bilder for uventede artefakter (feil tekst, lav ansiktstroskap, utilsiktet logoskaping). Hold et scoringssystem og fail-safe fallback til Pro-nivå-rendere hvis auto-sjekk feiler.
- Lagre prompter og seeds: for reviderbarhet og reproduserbarhet, lagre nøyaktig prompt, tidsstempel, modellversjon og eventuelle seeds eller deterministiske parametere.
Latensfølsom UX
- Progressiv UX: returner et lavoppløselig/hurtig utkast først, og erstatt med en høyoppløselig/Pro-render når den er klar. Dette holder appen responsiv (mange leverandører tilbyr en “draft” eller Flash-variant).
Avsluttende merknader og neste steg
Nano Banana 2 er bygget for å endre økonomien i bildeførste produksjonsarbeidsflyter: lavere latens og lavere kostnad per kall åpner bruksområder som on-demand annonseaktiva, rask A/B-testing av kreative varianter og sanntids, samarbeidsbaserte designverktøy. Modellen er allerede integrert på tvers av Googles konsument- og skyflater; for utviklere som vil gå live raskt, tilbyr CometAPI et praktisk markedsplass-wrapper som støtter Gemini-bildeendepunkter pluss andre modeller — et praktisk grep når du vil eksperimentere med flere motorer uten å endre appkoden.
Utviklere kan få tilgang til Nano Banana 2 via CometAPI nå. For å komme i gang, utforsk modellens muligheter i Playground og se API-veiledningen for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og hentet API-nøkkelen. CometAPI tilbyr en pris langt under den offisielle prisen for å hjelpe deg å integrere.
Klar til å starte?→ Registrer deg for Nano Banana 2 i dag !
Hvis du vil ha flere tips, guider og nyheter om KI, følg oss på VK, X og Discord!
