Som AI-skaper gleder jeg meg til å introdusere deg for Nano-banan – det lekne kallenavnet for Gemini 2.5 Flash-bilde – Googles nyeste modell for høykvalitets bildegenerering og bilderedigering. I denne grundige gjennomgangen skal jeg forklare hva det er, hvordan man bruker det (app og API), hvordan man bruker det effektivt, gi konkrete eksempler, inkludere kjøreklar kode og gå gjennom syv kreative, praktiske bruksområder du kan begynne å søke i dag.
Hva er Gemini 2.5 Flash Image (Nano Banana)?
Gemini 2.5 Flash Image er en ny modell for bildegenerering og bilderedigering i Gemini-familien. Den utvider Gemini 2.5 Flash-familien til å produsere og redigere bilder (ikke bare tekst), og kombinerer Geminis multimodale resonnement, verdenskunnskap og promptdrevne kontroller for å lage eller endre bilder fra tekst- og/eller bildeinndata. Teamet og utviklerdokumentasjonen kaller den eksplisitt «Gemini 2.5 Flash Image» og bemerker det interne kallenavnet. nano-banan.
Ved kunngjøringen var den publiserte prisen for Gemini 2.5 Flash Image-nivået 30 dollar per 1 million utdatatokener, med et eksempel på kostnad per bilde rapportert som 1290 utdatatokener ≈ $0.039 per bildeModellen tilbys i forhåndsvisning (utvikler-/forhåndsvisnings-ID-er som gemini-2.5-flash-image-preview) og er allerede tilgjengelig gjennom utvalgte partnere (CometAPI) og Googles egne utviklerplattformer.
Hva er de mest fremtredende funksjonene til Gemini 2.5 Flash Image?
Tegn- og stilkonsistens på tvers av redigeringer
En av de sentrale forbedringene er karakterkonsistensModellen er eksplisitt innstilt for å holde et motiv (en person, et kjæledyr eller et produkt) visuelt sammenhengende på tvers av flere redigeringer og ulike kontekster – en langvarig svakhet ved tidligere bildemodeller. Dette forbedrer arbeidsflyter som krever konsistente merkevareressurser, tilbakevendende karakterer i historiefortelling eller produktfotografering med flere bilder generert automatisk.
Promptbasert, lokalisert redigering
Du kan legge ved et bilde pluss en instruksjon i naturlig språk, som for eksempel «fjern flekken på skjorten», «bytt antrekk til en blå jakke» eller «gjør bakgrunnen uskarp og øk lysstyrken på motivet», og modellen utfører målrettede, lokale redigeringer uten behov for manuelle masker i mange tilfeller. Dette gjør den praktisk for iterativ, samtalebasert redigering.
Flerbildefusjon og stiloverføring
Gemini 2.5 Flash Image kan ta flere bilder og komponere dem inn i én enkelt scene eller overføre stil/tekstur fra ett bilde til et annet. Det muliggjør produktmodeller (plassering av et produkt i en scene), møbelstaging eller kombinerte bilder for markedsføring og e-handel.
Kunnskap om den innfødte verden
Fordi den er bygget på Gemini-familien, utnytter modellen verdenskunnskap – f.eks. forståelse av rekvisitter, miljøer eller kontekstuelt korrekte objektrelasjoner – noe som bidrar til realistisk scenekonstruksjon og semantisk sammenhengende redigeringer (ikke bare estetisk plausible resultater).
Lav latens og kostnadseffektivitet
Gemini sin «Flash»-familie sikter mot lav latens og kostnadseffektiv bruk sammenlignet med større resonnementnivåer. Utviklerens kunngjøring vektlegger hastighet og en gunstig pris/kvalitet-avveining for mange brukstilfeller i den virkelige verden.
Innebygd proveniens: SynthID-vannmerke
Alle bilder som er opprettet/redigert med modellen inkluderer en usynlig SynthID digitalt vannmerke slik at bildene senere kan bekreftes som AI-genererte eller AI-redigerte. Dette er en del av Googles produktnivåtiltak for misbruk og sporing av opprinnelse.
1) Hvordan kan jeg lage en konsistent karakter for en langvarig tegneserie- eller merkevarekampanje?
Hvorfor dette fungerer
Nano Banana ble eksplisitt trent til å opprettholde samme karakterutseende på tvers av redigeringer og nye kontekster – nyttig når du trenger at det samme ansiktet, antrekket eller maskoten skal vises på tvers av episoder, miniatyrbilder eller heltebilder. Utviklerne kaller dette «karakterkonsistens».
Hvordan spørre
- Start med en beskrivende blokk som fanger opp identitetstrekk (aldersgruppe, ansiktstrekk, særtrekk, antrekkselementer).
- Legg til en «konsistenstoken»-instruksjon som «Bruk samme tegn på tvers av alle utganger – ikke endre identifikasjonsmerker».
- For utdata med flere bilder, oppgi ett eller flere referansebilder som input for å låse likheten.
Slik ber du om konsekvente redigeringer
- Begynn med å beskrive de viktigste identitetsegenskapene du ønsker å beholde: alder, hårfarge, særtrekk (f.eks. «har en liten føflekk på venstre kinn») og klesstil.
- Bruk en todelt oppgave når du redigerer: beskriv først hva må forbli identiske, og beskriv deretter endring du vil ha. Eksempel: «Bevar: 28 år gammel østasiatisk kvinne, kort, svart bob, liten føflekk på venstre kinn. Endring: plasser henne i en diner på 1970-tallet iført rød skinnjakke, smilende og varm wolframbelysning.»
- Når du gjør flertrinnsredigeringer, inkluder et lite referansetoken som «(KEEP_ID: A)» i ledeteksten og bruk det på nytt for å signalisere det samme emnet på tvers av ledetekster.
Eksempel på spørreskjema
«Lag et fotorealistisk portrett av amin, en 28 år gammel grafisk forfatter med en kort asymmetrisk hårklipp, en halvmåneformet føflekk på venstre kinn, varme brune øyne og en grønn skinnjakke. Behold Aminas identifiserende trekk i de følgende 6 sceneoppgavene: «Amina på en morgenkaffebar», «Amina skisserer i parken», … . Bruk samme karakterlikhet for hver scene.
Kodebit (Python, generer flere bilder)
Dette eksemplet bruker Gemini API-klienten som vises i Googles dokumenter – send den beskrivende prompten og løkkescenevariantene dine.
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client()
base_description = (
"Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
"crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)
scenes = [
"Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
"Amina sketching in the park, windy afternoon, soft bokeh background.",
# add more scenes...
]
for i, scene in enumerate(scenes, start=1):
prompt = f"{base_description} Scene: {scene}"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
parts = response.candidates.content.parts
for part in parts:
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"amina_scene_{i}.png")
2) Hvordan kan Nano Banana akselerere produktfotografering og A/B-bilder for e-handel?
Hvorfor dette er kreativt og nyttig
Produktteam bruker enorme ressurser på flere bilder, lyssetting og variasjoner (farger, bakgrunner). Nano Banana's flerbildefusjon og presis og rask redigering lar deg generere konsistente produktvarianter og livsstilskompositter raskt – for katalogbilder, livsstilsscener og sosiale ressurser – noe som reduserer iterasjonstid og produksjonskostnader.
Slik ber du om produktvarianter
- Gi en kort produktspesifikasjon (mål, materialer, fargepalett) og fotostil (f.eks. «hvit bakgrunn i studio, 45° vinkel, myk skygge»).
- For varianter: «Lag fire varianter av dette Bluetooth-headsettet: svart, rosa, grått med oransje ørehetter og grått med blått glimt – alle med samme belysning, samme kameravinkel og i et hvitt rom.»
- Bruk flerbildefusjon for å plassere produktet i forskjellige scener: «Plasser denne ryggsekken på et piknikteppe i den gylne timen med liten dybdeskarphet.»
Eksempel på ledetekst (produkt)
«Bilde A (produktreferanse): førsteklasses skinnryggsekk. Lag tre katalogvarianter med hvit bakgrunn – skoggrønn, brun, kullfarget – tatt i en 45° vinkel, naturlig myk skygge, ISO-følelse på 100.»
Kodebit: rask Python-generering (katalogvariant)
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client(api_key="YOUR_API_KEY")
product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
# Save images from response parts (example)
for i, part in enumerate(response.candidates.content.parts):
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"backpack_variant_{i}.png")
Dette kodeutdraget gjenspeiler Googles dokumenterte bruksmønster og er et godt utgangspunkt for å automatisere oppretting av produktvarianter.
Utdatabilde:

3) Hvordan kan jeg lage pedagogiske illustrasjoner som kombinerer bilder og diagrammer?
Hvorfor dette fungerer
Nano Banana integrerer verdenskunnskap (Geminis multimodale resonnement) slik at den kan tolke håndtegnede diagrammer, kommentere bilder eller lage forklarende visuelle elementer fra en blanding av bilder og tekstlige instruksjoner – nyttig for e-læring, teknisk dokumentasjon og interaktive veiledere.
Hvordan spørre
- Gi bilder (f.eks. et bilde av et fysisk eksperiment) og en oppgave som «Annoter dette bildet med etiketter og piler som forklarer hovedkomponentene, og lag et andre bilde som viser systemet i tverrsnitt».
Eksempel på spørreskjema
Generer fire kunnskapselementer med bildeforklaring: MENNESKELIGE HJERNEs nevrale nettverk, CELLULÆR RESPARASJON (ATP-produksjon), DNA-DOBBELTHELIXS genetiske kode, KLOROLPASTAs plantefotosyntese
Utdatabilde:

4) Hvordan kan jeg gjøre ekte bilder om til markedsføringsvariasjoner som passer til merkevaren (antrekk, belysning, bakgrunn)?
Hvorfor dette fungerer
Modellen støtter målrettet transformasjon og lokale redigeringer uttrykt via naturlig språk: endre et antrekk, juster belysning, erstatt bakgrunnen eller fjern objekter – og det prøver å bevare motivets identitet og generelle realisme. Dette muliggjør raske markedsføringsvarianter (sesongbaserte antrekk, lokaliserte scener).
Hvordan spørre
- Legg ved det originale bildet som inndata.
- Spørre om målrettede redigeringer med eksplisitte instruksjoner, f.eks. «Bytt ut jakken med en rød ullpeacoat, endre bakgrunnen til bygate i skumringen, legg til varmt lys fra kanten.»
Eksempel på spørreskjema
«Bytt ut den blå dongerijakken med en skreddersydd rød ullpeacoat fra det opplastede bildet, sett bakgrunnen til en tidlig kveldsgate i byen med lys bokeh, og legg til myk lyskantbelysning for å skille motivet fra bakgrunnen.»
Hint
- Hvis du trenger iterativ kontroll, gjør flertrinnsredigeringer: be om en første redigering, og finjuster deretter («fjern hatten», «varm nå opp fargetemperaturen»).
5) Hvordan kan animasjonsskapere og previsualiseringsteam lage prototyper av scener og storyboards?
Hvorfor det er nyttig
Regissører og DP-er kan raskt lage prototyper av lysoppsett, garderober og kamerakomposisjoner. Nano Banana kan produsere storyboards med konsistente karakterer, noe som hjelper med planlegging og forhåndsvisning. ()
H3: Eksempel på oppgave
There is a tree house in the forest at night with colorful lights hanging on the trees
Utdatabilde:

6) Hvordan kan Nano Banana brukes til konseptkunst, spillressurser og konsistente spillfigurer?
Hvorfor spillstudioer og uavhengige utviklere burde bry seg
Å lage kunstressurser og iterere karakterutseende krever vanligvis at kunstnere omarbeider karakterene gjentatte ganger. Nano Bananas karakterkonsistens gjør det praktisk å generere en rekke poseringer, antrekk og lyssettinger som holder seg tro mot en enkelt karakteridentitet – en enorm tidsbesparelse i forproduksjon og rask prototyping.
Slik ber du om spillressurser
- Definer det «kanoniske» karakterarket i teksten: høyde, kroppstype, nøkkelfunksjoner, basisplagg i garderoben.
- Be om flere utdata: «Generer tre varianter av kamprustninger med samme ansiktstrekk, hver vist foran, i profil og i ¾-positur.»
- For miljøkunst, bruk flerbildefusjon: gi ett bilde av karakteren og ett av miljøet, og oppfordre til å fusjonere dem.
Eksempel på ledetekst (spillressurser)
«Lag tre pansrede varianter for «Kael, vindvokteren»: behold ansiktstrekkene (smal kjeve, arr over høyre øyenbryn). Rustning A: lær + blågrønt stoff; Rustning B: skjell + messing; Rustning C: skjult matt svart. Utdata: helkroppsfront, profil, ¾.»

Rustning C: Stealth Matte Black

Rustning B: Skala + Messing

Rustning A: Lær + Blågrønn stoff
7) Hvordan kan jeg automatisere arbeidsflyter for fotoretusjering med konversasjonsbasert flertrinnsredigering?
Hvorfor dette fungerer
Nano Banana støtter konversasjonsbasert flertrinns bilderedigering: du kan be om en redigering, inspisere resultatet og følge opp med flere instruksjoner på naturlig språk. Det er perfekt for å bygge en retusjeringsprosess med menneskelig innhold der en redigerer dytter modellen over flere omganger.
Hvordan implementere arbeidsflyten
- Last opp et første bilde og be om en grunnleggende retusjering (belysning, fjerning av flekker).
- I hver runde sender du det nylig redigerte bildet tilbake til modellen med neste instruksjon («reduser høylys, få frem skygger, beskjær til 4:5»).
- Logg hvert trinn slik at du kan gå tilbake eller bruke samme trinn på en gruppe.
Mini-arbeidsflytkodebit (Python)
# 1) Initial retouch
prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png
# 2) Follow-up tweak
prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png
Hvordan kan jeg gi Nano Banana et varsel for å få best mulig resultat?
Hvilke oppmuntrende prinsipper bør jeg følge?
Nano Banana reagerer best på beskrivende, narrative stilspørsmål som forklarer scenen, perspektivet, belysningen og stemningen – ikke bare en liste med nøkkelord. Den offisielle veiledningen anbefaler å oppgi kamera-, objektiv-, belysnings- og stilistiske signaler for fotorealisme, eller stil- og palettsignaler for illustrasjoner. Oppgi også eksplisitte begrensninger (sideforhold, bakgrunn, tekstkrav).
Hvordan strukturerer jeg en sterk prompt?
Her er korte, gjenbrukbare maler:
- Fotorealistisk mal:
A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: . - Stiloverførings-/komposisjonsmal:
Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style:.
Raske tekniske tips (hurtigliste)
- Bruk én klar fortellende setning i stedet for mange usammenhengende tagger.
- Legg til kameradetaljer for fotorealisme (f.eks. «85 mm, liten dybdeskarphet»).
- For å få konsistente tegn på tvers av redigeringer, referer til det forrige bildet og attributtet du ønsker å bevare (f.eks. «behold motivets fregner og blå skjerf, endre frisyre til…»).
- Last opp kildebildet når du redigerer og beskriv nøyaktig hvilke regioner eller elementer som skal endres.
- Bruk iterative redigeringer med flere omganger for å forbedre små visuelle detaljer (Nano Banana støtter konversasjonsforbedring).
Endelig notat
Nano Banana (Gemini 2.5 Flash Image) er et kreativt sprang: det lar skapere beholde karakter- og produktkontinuitet samtidig som det muliggjør dristige nye redigeringer, sammenslåing av flere bilder og rask iterasjon. Bruk det til å akselerere historiefortelling, redusere produksjonsfriksjon og prototype visuelle bilder i fart – men kombiner disse gevinstene med grundig gjennomgang og etiske rekkverk.
Komme i gang
CometAPI er en enhetlig API-plattform som samler over 500 AI-modeller fra ledende leverandører – som OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i ett enkelt, utviklervennlig grensesnitt. Ved å tilby konsistent autentisering, forespørselsformatering og svarhåndtering, forenkler CometAPI dramatisk integreringen av AI-funksjoner i applikasjonene dine. Enten du bygger chatboter, bildegeneratorer, musikkomponister eller datadrevne analysepipeliner, lar CometAPI deg iterere raskere, kontrollere kostnader og forbli leverandøruavhengig – alt samtidig som du utnytter de nyeste gjennombruddene på tvers av AI-økosystemet.
Utviklere har tilgang Gemini 2.5 Flash-bilde(Nano Banana Comet API-liste gemini-2.5-flash-image-preview/gemini-2.5-flash-image stiloppføringer i katalogen deres.) gjennom CometAPI, er de nyeste modellversjonene som er oppført per artikkelens publiseringsdato. For å begynne, utforsk modellens muligheter i lekeplass og konsulter API-veiledning for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og fått API-nøkkelen. CometAPI tilby en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med å integrere.
