Googles seneste udgivelse af Gemini 2.5 Flash Image — med øgenavnet “Nano-Banan” er hurtigt blevet det foretrukne valg til billedredigering i dialog: det holder ligheder ensartede på tværs af redigeringer, sammensætter flere billeder pænt og understøtter meget naturlige, promptbaserede lokale redigeringer. Nedenfor vil jeg gennemgå, hvad Nano Banana er, og hvordan man bruger det både via Googles Gemini og via tredjepartsadgang (f.eks. CometAPI), giv konkrete eksempler på prompter og kode, du kan integrere i et projekt, og del udviklertips til multi-turn redigering, opskalering og avancerede prompter. Jeg skriver dette som en udvikler, der bruger billedmodeller dagligt – betragt dette som en praktisk, let meningsfuld håndbog.
Hvad er nano-banan?
Hvad betyder "Gemini 2.5 Flash Image / Nano-Banan" egentlig?
Nano-banan er fællesskabets kaldenavn/kodenavn for Gemini 2.5 Flash-billede, Google DeepMinds nyeste model til billedgenerering og -redigering. Den er designet til prompt-først redigering (du giver det instruktioner i naturligt sprog) med særligt fokus på karakterkonsistens (den samme person/kæledyr/genstand skal stadig kigge på tværs af redigeringerne), flerbilledfusion (blanding af objekter på tværs af kildefotos) og interaktiv brug med lav latenstid i apps som Gemini og Google AI Studio. Modellen er tilgængelig via Googles Gemini API, AI Studio, og bliver allerede vist i CometAPI.
Som udvikler skal du ikke primært tænke på Nano-Banana som en ren "fra bunden" billedgenerator, men som en yderst kapabel assistent i billedredigering og kompositionDen forstår indholdet af dit billede, husker motivet på tværs af redigeringer og reagerer på instruktioner i naturligt sprog på en måde, der passer til et hurtigt iterativt designforløb. Det gør den særligt nyttig til produktmockups, ensartede karakterbilleder, hurtige konceptiterationer og social kreativ leg.
opsummering rettet mod udviklere
- Model navn: gemini-2.5-flash-billede-forhåndsvisning / gemini-2.5-flash-billede.
- Konsistens og kontinuitet: Nano-Banana holder fast i karakterdetaljer på tværs af redigeringer mere pålideligt end mange konkurrenter, hvilket gør det at foretrække til sekventielle redigeringer og historiefortælling.
- Hastighed: Brugere rapporterer hurtig generering – ofte under 10 sekunder for mange redigeringer – hvilket er nyttigt til iterative arbejdsgange.
- Redigering - først design: Mens mange modeller er optimeret til ren tekstdrevet generering, lægger Nano-Bananas UX og API'er vægt på redigering (one-shot-redigeringer, fusion af flere billeder, stiloverførsel).
Hvordan kan jeg redigere med Nano-Banana på CometAPI?
CometAPI er en API-markedsplads/wrapper, der aggregerer mange modeller (herunder Gemini 2.5 Flash Image API (Nano Banana)) bag et enkelt, OpenAI-kompatibelt slutpunkt. Hvis du vil lave prototyper hurtigt eller undgå at provisionere Google Cloud/Vertex-konti til en første test, er CometAPI en praktisk bro — du får en API-nøgle, vælger gemini-2.5-flash-image (eller gemini-2.5-flash-image-preview ), og send derefter anmodninger ligesom en billedredigering i chat-stil. CometAPI tilbyder også eksempler og vejlede at prøve modellen.
Hvorfor bruge Comet API?
- Én API-nøgle til at styre dem alle — forenkler testning af flere udbydere.
- Skift udbydere i produktion, hvis priser eller SLA'er ændres.
- Nyttig for teams, der ønsker kontrol på serviceniveau (hastighedsbegrænsning, centraliseret logføring).
Sådan kalder du Nano-Banana (CometAPI) — praktisk eksempel
Nedenfor er et enkelt eksempel. Erstat YOUR_COMET_KEY og filstier med dine egne.
CURL — grundlæggende redigering (billede + prompt → redigeret billede)
Eksempel:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Beskrivelse:**Først skal du konvertere din kildebilledfil til en Base64-streng og placere den i inline_data.dataFor det andet, inkluder ikke præfikser som data:image/jpeg;base64, Udgangen er også placeret i candidates.content.parts og inkluderer:
- En valgfri tekstdel (beskrivelse eller prompt).
- Billeddelen som
inline_data(hvordataer Base64 for outputbilledet).
Hvis du bare vil prøve billedredigering på Nano-Banana, tilbyder CometAPI gratis kreditter til nye brugere. Du kan prøve Nano-Banana på legepladsen eller bruge Gemini 2.5 Flash Image API. Hvis du ønsker ubegrænset brug, kan du dog betale 20% rabat på Gemini-prisen.
Nano-Banana har flere centrale fordele: ensartet lighed, målrettede lokale redigeringer via naturligt sprog og fusion af flere billeder.
Dernæst vil jeg vise fordelene ved Nano-Banan gennem adskillige anvendelsesscenarier, og du vil se dens magi.
Eksempel 1: Kombinér flere billeder til en enkelt collage
Upload et billede:

Eksempel på inputbeskrivelse: En model poserer og læner sig op ad en lyserød BMW. Hun har følgende på, scenen er mod en lysegrå baggrund. Den grønne alien er en nøglering, og den er fastgjort til den lyserøde håndtaske. Modellen har også en lyserød papegøje på skulderen. Der sidder en mops ved siden af hende med et lyserødt halsbånd og gyldne hovedtelefoner.
Returnerede Base64 konverteret tilbage til et billede:

Kode:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Bemærkninger: Konverter din kildebilledfil til en Base64-streng, og indsæt den i inline_data.data (inkluder ikke præfikser som f.eks. data:image/jpeg;base64,).
Analyse af brugsscenarier: Ved at bruge multi-image fusion kan designere være mere kreative. For eksempel kan boligdesignere kombinere billeder for at skabe en grov gengivelse af effekten. Forbrugere kan kombinere deres helkropsbilleder med de ting, de ønsker at købe, for at hjælpe dem med at beslutte, om de vil købe. Dette kan også bruges som reference til animation og tegneserieproduktion.
Eksempel 2: Rediger billeder for at bevare lighed
Nedenfor vil jeg give flere runder med redigering for at teste nano-banan.
Først skal du uploade et billede:

Sekund, Spørg: Tilføj en hvalp til græsplænen
Output:

Endelig Spørg: Brug det vedhæftede referencebillede af karakteren. Bevar hunden. Placer karakteren i en regnfuld neonbygade om natten. Hold ansigtstrækkene identiske med referencen.

Analyse af brugsscenarier: Det kan ses, at en forholdsvis høj konsistens opretholdes i flere runder med billedmodifikation.
Eksempel 3: Stiloverførsel og ændring af ansigtsdetaljer
Upload et billede:

Spørg: Gør ansigtet en smule skarpere, tilføj 6% filmkorn, beskær til 16:9. Ændr ikke ansigtstrækkene. Tilføj et blidt lys i kanten på højre side.
produktion:

Andre anvendelsesmuligheder for nano-bananer
1) Firmaportrætter og professionelle portrætter
Anvendelse: Skab hurtigt ensartede brandportrætter (marketing, LinkedIn, virksomhedsbiografier). Nano-Banana bevarer ansigtsgengivelsen, mens outfit, baggrund eller belysning ændres.
Prompt — outfit + belysning (redigering)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Prompt — baggrundsbytte + retouchering
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) E-handel og produktvisualisering
Anvendelse: Placer produkter i livsstilsscener, generer ensartede produktbilleder fra forskellige vinkler eller vis farvevarianter.
Prompt — produkt-i-scenen (fusion af flere billeder)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Spørgsmål — farvevarianter (rediger)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Socialt indhold og influencer marketing
Brug: hurtige stilistiske redigeringer, outfit-swaps, sæsonbestemte overlays eller beskæringer i flere formater til sociale platforme.
Prompt — sæsonbestemt redigering til feed og historie
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt — stiliseret promoveringsvariant
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Konsistens i karakterer/brand-elementer (maskotter, tilbagevendende karakterer)
Brug: Hold logoer, maskotter eller karakterer visuelt identiske på tværs af scener, kampagner eller episoder.
Prompt — håndhævelse af tegnark
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Reparation og farvning af historiske fotos
Anvendelse: Gendan eller farvelæg arkivbilleder, samtidig med at komposition og fine ansigtsdetaljer bevares.
Spørg — farvelæg + reparer
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Hvilke avancerede promptteknikker øger pålideligheden?
Brug referenceankre og mikrobegrænsninger
Referenceankre er korte, verificerbare informationer, du tilføjer for at reducere tvetydighed: nøjagtige beklædningsnavne ("marineblå blazer, enkeltradet, hakrevers"), lysreferencer ("Rembrandt-belysning") eller kameraudtryk ("50 mm portrætobjektiv, f/2.8"). Mikrobegrænsninger fortæller modellen, hvad den ikke må ændre (f.eks. "ændr ikke tatoveringerne på højre underarm"). Disse reducerer modellens frihed på en produktiv måde og forbedrer typisk resultatets nøjagtighed.
Iterationsløkke: spørge, evaluere, forfine
- Første gennemløb: brug en præcis, men kortfattet prompt.
- Vurder resultaterne: Bemærk, hvad modellen gjorde forkert (f.eks. ændrede ansigtsform, mistede et tilbehør).
- Målrettet korrektion: Send en kort opfølgningsprompt, der refererer til det forrige resultat ("Behold alt fra sidste output, men behold den originale ørering i venstre øre og gør øjenbrynene tykkere"). Nano-Bananas styrker inden for samtaleredigering giver dig mulighed for hurtigt at komme dig.
Redigeringskæde for komplekse transformationer
Ved større redigeringer bør du opdele arbejdet i en række af mindre redigeringer i stedet for én massiv instruktion. Eksempel på en rækkefølge: (1) baggrundsbytte → (2) outfitopdatering → (3) farvegraduering → (4) endelig retouchering. Dette holder hver prompt fokuseret og reducerer uventede krydseffekter.
Hvordan skal jeg strukturere prompts til Nano-Banan? (Promptanatomi)
Gode billedprompter har en ensartet struktur. Brug følgende hurtig anatomi for at få præcise, gentagelige resultater:
Hurtig anatomi (anbefalet rækkefølge)
- Handling / Mål — hvad vil du have modellen til do? (f.eks. "Rediger denne selfie for at lave et professionelt portrætbillede" eller "Generer et produktlivsstilsfoto, der kombinerer disse to billeder").
- Emne (r) — hvem eller hvad er der på billedet? Vær specifik omkring identitet, alder, antal personer, genstande osv.
- Attributter — visuelle karakteristika: tøj, ansigtsudtryk, øjenfarve, hår, rekvisitter.
- Miljø og belysning — placering, tidspunkt på dagen, stemningsbelysning, brændvidde, objektivtips (“35 mm portræt”).
- Stil og finish — fotografisk stil (filmisk, studie, filmkorn, hyperreal) eller kunstnerisk stil (oliemaleri, vektor, tegneserie).
- Begrænsninger / Sikkerhed — alt, hvad der skal undgås (ingen logoer, ingen nøgenhed, ingen medicinsk tekst).
- Konsistenstoken (valgfrit) — en kort sætning, som du genbruger for at opretholde tegngenkendelse på tværs af flere prompter (f.eks. "Brug tegnreferencen 'Luna-tørklæde'").
Tips til karakterkonsistens (praktiske trin)
- **Brug en "referencefrase"**Inkluder en kort, unik sætning knyttet til emnet (f.eks. "tegntoken: 'Maya-blue-jacket'") i hver prompt. Modellen vil mere pålideligt linke redigeringer til det samme tegn, hvis du genbruger denne sætning.
- Inkluder forankrede detaljer: angiv karakteristiske, uforanderlige træk (f.eks. "ar på venstre øjenbryn, grønt fødselsmærke på højre kind"), så modellen har faste ankre, der skal opretholdes.
- Bevar positur og indramning når det er muligtHvis du ønsker ægte kontinuitet, skal du holde kameravinkel/positurbeskrivelsen ens på tværs af prompterne.
- Start fra det samme originale billedeAngiv altid det samme kildebillede som ankeret til redigering af arbejdsgange. Når du skal ændre fotos, skal du inkludere det originale billede som ekstra input og forklare transformationen.
Hvad er almindelige fejltilstande, og hvordan retter jeg dem?
Fiasko: identitetsdrift (subjektet ser anderledes ud)
Årsag: Modellen overgeneraliserede en anmodet stil eller misfortolkede en begrænsning.
Rettelser: tilføj en eksplicit "bevar"-klausul, vedhæft det originale billede som reference, eller udfør redigeringer i mindre trin og valider mellemliggende output.
Fejl: inkonsekvente rekvisitter eller hænder
Årsag: Hænder og småt tilbehør er historisk set vanskelige for mange billedmodeller.
Rettelser: inkludere mikrobegrænsninger ("bevar uret på højre håndled"), give en detaljeret nærbillede af små genstande eller udføre et sidste målrettet korrektionstrin med fokus kun på det problematiske element.
Fejl: Belysning eller skygger ser unaturlige ud
Årsag: Store redigeringer (udskiftning af baggrund eller større ombelysning) kan skabe uoverensstemmelser.
Rettelser: Bed modellen om at matche "retningsbestemt lys fra øverste venstre, bløde skygger" eller angiv det ønskede lysreferencebillede.
Konklusion
Nano-Banana (Gemini 2.5 Flash Image) er et bemærkelsesværdigt skridt fremad inden for billedredigering og -generering i forbrugerklassen: hurtig, ensartet og integreret med Googles Gemini-økosystem og sikkerhedsværktøjer. De bedste resultater kommer fra klare, opgavefokuserede instruktioner, eksplicitte bevaringsinstruktioner, når du har brug for identitetskonsistens, og trinvise arbejdsgange, der adskiller hurtige forhåndsvisninger fra endelige gengivelser. Efterhånden som modellen og økosystemet udvikler sig, bør prompt-ingeniører fortsætte med at teste, logge resultater og bygge brugervenlige kontroller, der gør redigering transparent og reversibel.


