Googles nylige utgivelse av Gemini 2.5 Flash Image – med kallenavnet «Nano-Banan» har raskt blitt det foretrukne valget for konversasjonsbasert bilderedigering: den holder likheter konsistente på tvers av redigeringer, fusjonerer flere bilder på en ren måte og støtter svært naturlige, promptbaserte lokale redigeringer. Nedenfor vil jeg gå gjennom hva Nano Banana er, hvordan du bruker det både via Googles Gemini og via tredjepartstilgang (f.eks. CometAPI), gi konkrete eksempler på prompter og kode du kan legge inn i et prosjekt, og del utviklertips for redigering i flere omganger, oppskalering og avanserte prompter. Jeg skriver dette som en utvikler som bruker bildemodeller daglig – betrakt dette som en praktisk, litt meningsfull håndbok.
Hva er nano-banan?
Hva betyr egentlig «Gemini 2.5 Flash Image / Nano-Banan»?
Nano-banan er kallenavnet/kodenavnet i lokalsamfunnet for Gemini 2.5 Flash-bilde, Google DeepMinds nyeste modell for bildegenerering og -redigering. Den er designet for spørsmål først redigering (du gir det instruksjoner på naturlig språk) med spesielt fokus på karakterkonsistens (slik at samme person/kjæledyr/objekt ser ut på tvers av redigeringer), flerbildefusjon (blanding av objekter på tvers av kildebilder) og interaktiv bruk med lav latens i apper som Gemini og Google AI Studio. Modellen er tilgjengelig gjennom Googles Gemini API, AI Studio, og blir allerede vist i CometAPI.
Som utvikler bør du ikke først og fremst tenke på Nano-Banana som en ren «fra bunnen av»-bildegenerator, men som en svært kapabel assistent for fotoredigering og komposisjonDen forstår innholdet i bildet ditt, husker motivet på tvers av redigeringer og reagerer på instruksjoner i naturlig språk på en måte som passer inn i en rask iterativ designløkke. Det gjør den spesielt nyttig for produktmodeller, konsistente karakterbilder, raske konseptiterasjoner og sosial kreativ lek.
Sammendrag for utviklere
- Modell navn: forhåndsvisning av gemini-2.5-blitsbilde / gemini-2.5-blitsbilde.
- Konsistens og kontinuitet: Nano-Banana holder fast på karakterdetaljer på tvers av redigeringer mer pålitelig enn mange konkurrenter, noe som gjør det å foretrekke for sekvensielle redigeringer og historiefortelling.
- Hastighet: Brukere rapporterer rask generering – ofte under 10 sekunder for mange redigeringer – noe som er nyttig for iterative arbeidsflyter.
- Redigering – først i design: Mens mange modeller er optimalisert for ren tekstdrevet generering, legger Nano-Bananas UX og API-er vekt på redigering (engangsredigeringer, flerbildefusjon, stiloverføring).
Hvordan kan jeg redigere med Nano-Banana på CometAPI?
CometAPI er en API-markedsplass/omslagspakke som samler mange modeller (inkludert Gemini 2.5 Flash Image API (Nano Banana)) bak et enkelt, OpenAI-kompatibelt endepunkt. Hvis du vil lage prototyper raskt eller unngå å klargjøre Google Cloud/Vertex-kontoer for en første test, er CometAPI en praktisk bro – du får en API-nøkkel, velger gemini-2.5-flash-image (eller gemini-2.5-flash-image-preview ), og send deretter forespørsler omtrent som en bilderedigering i Chat-stil. CometAPI tilbyr også eksempler og veilede å prøve modellen.
Hvorfor bruke Comet API?
- Én API-nøkkel for å styre dem alle – forenkler testing av flere leverandører.
- Bytt leverandører i produksjon hvis priser eller tjenestenivåavtaler endres.
- Nyttig for team som ønsker kontroll på tjenestenivå (hastighetsbegrensning, sentralisert logging).
Hvordan kalle Nano-Banana (CometAPI) – praktisk eksempel
Nedenfor er et enkelt eksempel. Erstatt YOUR_COMET_KEY og filstier med dine egne.
CURL — grunnleggende redigering (bilde + prompt → redigert bilde)
Eksempel:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Beskrivelse:**Først konverterer du kildebildefilen til en Base64-streng og plasserer den i inline_data.dataFor det andre, ikke bruk prefikser som data:image/jpeg;base64, Utgangen er også plassert i candidates.content.parts og inkluderer:
- En valgfri tekstdel (beskrivelse eller ledetekst).
- Bildedelen som
inline_data(hvordataer Base64 for utdatabildet).
Hvis du bare vil prøve bilderedigering på Nano-Banana, tilbyr CometAPI gratis kreditter til nye brukere. Du kan prøve Nano-Banana på lekeplassen eller bruke Gemini 2.5 Flash Image API. Hvis du ønsker ubegrenset bruk, kan du imidlertid betale 20 % avslag på Gemini-prisen.
Nano-Banana har flere kjernefordeler: konsistent likhet, målrettede lokale redigeringer via naturlig språk og fusjon av flere bilder.
Deretter vil jeg vise fordelene med nanobanan gjennom flere bruksområder, og du vil se magien.
Eksempel 1: Kombiner flere bilder til én kollasj
Last opp et bilde:

Eksempel på beskrivelse av inndata: En modell poserer og lener seg mot en rosa BMW. Hun har på seg følgende gjenstander, scenen er mot en lysegrå bakgrunn. Den grønne romvesenet er en nøkkelring, og den er festet til den rosa vesken. Modellen har også en rosa papegøye på skulderen. Ved siden av henne sitter en mops med rosa halsbånd og gullfargede hodetelefoner.
Returnerte Base64 konvertert tilbake til et bilde:

Kode:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Merknader: Konverter kildebildefilen til en Base64-streng og sett den inn i inline_data.data (ikke inkluder prefikser som data:image/jpeg;base64,).
Analyse av brukstilfeller: Ved å bruke flerbildefusjon kan designere være mer kreative. For eksempel kan boligdesignere kombinere bilder for å lage en grov gjengivelse av effekten. Forbrukere kan kombinere helkroppsbilder med tingene de ønsker å kjøpe for å hjelpe dem med å bestemme seg for om de skal kjøpe. Dette kan også brukes som referanse for animasjon og tegneserieproduksjon.
Eksempel 2: Rediger bilder for å bevare likheten
Nedenfor vil jeg gi flere runder med redigering for å teste nano-banan.
Først, last opp et bilde:

For det andre, Spør: Legg til en valp på plenen
Utgang:

Endelig, Spør: Bruk det vedlagte referansebildet av karakteren. Bevar hunden. Plasser karakteren i en regnfull neonby-gatescene om natten. Hold ansiktstrekkene identiske med referansen.

Analyse av brukstilfeller: Det kan sees at en ganske høy konsistens opprettholdes i flere runder med bildemodifisering.
Eksempel 3: Stiloverføring og modifisering av ansiktsdetaljer
Last opp et bilde:

Spør: Gjør ansiktet litt skarpere, legg til 6 % filmkorn, beskjær til 16:9. Ikke endre ansiktstrekkene. Legg til et forsiktig lys i kanten på høyre side.
produksjon:

Andre bruksområder for nanobananer
1) Bedriftsbilder og profesjonelle portretter
Bruk: Lag ensartede profilbilder av merkevaren raskt (markedsføring, LinkedIn, bedriftsbiografier). Nano-Banana beholder ansiktsgjengivelsen selv om antrekk, bakgrunn eller belysning endres.
Prompt — antrekk + belysning (redigering)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Spørsmål — bakgrunnsbytte + retusjering
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) E-handel og produktvisualisering
Bruk: plasser produkter i livsstilsscener, generer konsistente produktbilder fra forskjellige vinkler, eller vis fargevarianter.
Prompt — produkt-i-scenen (flerbildefusjon)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Spørsmål — fargevarianter (rediger)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Sosialt innhold og influencer-markedsføring
Bruk: raske stilistiske redigeringer, antrekksbytter, sesongbaserte overlegg eller beskjæringer i flere formater for sosiale plattformer.
Spørsmål – sesongmessig redigering for feed og historie
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt – stilisert promovariant
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Konsistens i karakterer/merkevareressurser (maskoter, tilbakevendende karakterer)
Bruk: Hold logoer, maskoter eller karakterer visuelt identiske på tvers av scener, kampanjer eller episoder.
Spørsmål – håndheving av tegnark
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Reparasjon og fargelegging av historiske bilder
Bruk: restaurer eller fargelegg arkivbilder samtidig som komposisjon og fine ansiktsdetaljer bevares.
Spørsmål – fargelegg + reparer
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Hvilke avanserte promptteknikker øker påliteligheten?
Bruk referanseankere og mikrobegrensninger
Referanseankere er korte, verifiserbare informasjonsbiter du legger til for å redusere tvetydighet: eksakte klesnavn («marineblå blazer, enkeltspent, hakkslag»), lysreferanser («Rembrandt-belysning») eller kameratermer («50 mm portrettobjektiv, f/2.8»). Mikrobegrensninger forteller modellen hva den ikke må endre (f.eks. «ikke endre tatoveringene på høyre underarm»). Disse reduserer modellens frihet på en produktiv måte og forbedrer vanligvis resultatets gjengivelse.
Iterasjonsløkke: spørre, evaluere, forbedre
- Første pass: bruk en presis, men konsis oppgave.
- Vurder resultatene: Legg merke til hva modellen gjorde feil (f.eks. endret ansiktsform, mistet et tilbehør).
- Målrettet korrigering: Send en kort oppfølgingsmelding som refererer til forrige resultat («Behold alt fra forrige utdata, men behold den originale øreringen i venstre øre og gjør øyenbrynene tykkere»). Nano-Bananas styrker innen samtaleredigering lar deg komme deg raskt.
Redigeringskjede for komplekse transformasjoner
For store redigeringer, del opp arbeidet i en kjede med mindre redigeringer i stedet for én massiv instruksjon. Eksempelkjede: (1) bakgrunnsbytte → (2) antrekksoppdatering → (3) fargegradering → (4) endelig retusjering. Dette holder hver prompt fokusert og reduserer uventede krysseffekter.
Hvordan bør jeg strukturere promptene for Nano-Banan? (Promptanatomi)
Gode bildeoppfordringer har en konsistent struktur. Bruk følgende rask anatomi for å få presise, repeterbare resultater:
Rask anatomi (anbefalt rekkefølge)
- Handling / Mål – hva vil du at modellen skal do? (f.eks. «Rediger denne selfien for å lage et profesjonelt portrettbilde» eller «Generer et produktlivsstilbilde som kombinerer disse to bildene»).
- Subject (s) — hvem eller hva er på bildet? Vær spesifikk om identitet, alder, antall personer, gjenstander osv.
- attributter — visuelle kjennetegn: klær, ansiktsuttrykk, øyenfarge, hår, rekvisitter.
- Miljø og belysning — plassering, tid på dagen, stemningsbelysning, brennvidde, linsetips («35 mm portrett»).
- Stil og finish — fotografisk stil (kinomatisk, studio, filmkorn, hyperreal) eller kunstnerisk stil (oljemaleri, vektor, tegneserie).
- Begrensninger / Sikkerhet — alt som skal unngås (ingen logoer, ingen nakenhet, ingen medisinsk tekst).
- Konsistenstoken (valgfritt) – kort frase som du bruker om igjen for å opprettholde tegngjenkjenning på tvers av flere ledetekster (f.eks. «Bruk tegnreferansen 'Luna-skjerf'»).
Tips for karakterkonsistens (praktiske trinn)
- **Bruk en «referansefrase»**Inkluder en kort, unik frase knyttet til emnet (f.eks. «tegntoken: 'Maya-blue-jacket'») i hver ledetekst. Modellen vil koble redigeringer til samme tegn mer pålitelig hvis du bruker denne frasen på nytt.
- Inkluder forankrede detaljer: spesifiser særegne, uforanderlige trekk (f.eks. «arr på venstre øyenbryn, grønt fødselsmerke på høyre kinn») slik at modellen har faste ankere å opprettholde.
- Oppretthold positur og innramming når det er muligHvis du ønsker ekte kontinuitet, hold kameravinkelen/positurbeskrivelsen lik på tvers av promptene.
- Start fra det samme originalbildet: For redigering av arbeidsflyter, bruk alltid samme kildebilde som ankeret. Når du må endre bilder, ta med originalbildet som ekstra input og forklar transformasjonen.
Hva er vanlige feilmoduser, og hvordan fikser jeg dem?
Feil: identitetsdrift (subjektet ser annerledes ut)
Årsaken: modellen overgeneraliserte en forespurt stil eller feiltolket en begrensning.
Fixes: legg til en eksplisitt «bevar»-klausul, legg ved originalbildet som referanse, eller utfør redigeringer i mindre trinn og valider mellomliggende resultater.
Feil: inkonsekvente rekvisitter eller hender
Årsaken: Hender og smått tilbehør er historisk sett vanskelige for mange bildemodeller.
Fixes: inkludere mikrobegrensninger («bevar klokken på høyre håndledd»), gi en detaljert nærbildereferanse for små gjenstander, eller kjøre et siste målrettet korrigeringstrinn med fokus kun på det problematiske elementet.
Feil: belysning eller skygger ser unaturlige ut
Årsaken: Store redigeringer (bakgrunnsbytte eller større omlysning) kan skape uoverensstemmelser.
Fixes: be modellen om å matche «retningsbestemt lys fra øverste venstre, myke skygger» eller oppgi ønsket lysreferansebilde.
Konklusjon
Nano-Banana (Gemini 2.5 Flash Image) er et bemerkelsesverdig skritt fremover innen bilderedigering og -generering på forbrukernivå: raskt, konsistent og integrert med Googles Gemini-økosystem og sikkerhetsverktøy. De beste resultatene kommer fra klare, oppgavefokuserte instruksjoner, eksplisitte bevaringsinstruksjoner når du trenger identitetskonsistens, og trinnvise arbeidsflyter som skiller raske forhåndsvisninger fra endelige gjengivelser. Etter hvert som modellen og økosystemet utvikler seg, bør hurtigutviklere fortsette å teste, logge resultater og bygge brukerrettede kontroller som gjør redigering transparent og reversibel.


