7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

CometAPI
AnnaAug 29, 2025
7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

Som AI-skaber er jeg begejstret for at kunne præsentere jer for Nano-banan — det legende øgenavn for Gemini 2.5 Flash-billede — Googles nyeste model til billedgenerering og billedredigering med høj kvalitet. I denne dybdegående gennemgang vil jeg forklare, hvad det er, hvordan man bruger det (app og API), hvordan man bruger det effektivt, give konkrete eksempler, inkludere køreklar kode og gennemgå processen. syv kreative, praktiske anvendelser du kan begynde at ansøge i dag.

Hvad er Gemini 2.5 Flash Image (Nano Banana)?

Gemini 2.5 Flash Image er en ny model til billedgenerering og billedredigering i Gemini-familien. Den udvider Gemini 2.5 Flash-familien til at producere og redigere billeder (ikke kun tekst) ved at kombinere Geminis multimodale ræsonnement, verdenskendskab og promptdrevne kontroller for at oprette eller ændre billeder fra tekst- og/eller billedinput. Teamet og udviklerdokumentationen kalder det eksplicit "Gemini 2.5 Flash Image" og bemærker det interne kaldenavn. nano-banan.

Ved annonceringen var den offentliggjorte pris for Gemini 2.5 Flash Image-niveauet 30 USD pr. 1 million output-tokens, med et eksempel på en pris pr. billede rapporteret som 1290 outputtokens ≈ $0.039 pr. billedeModellen tilbydes i forhåndsvisning (udvikler-/forhåndsvisnings-ID'er som f.eks. gemini-2.5-flash-image-preview) og er allerede tilgængelig via udvalgte partnere (CometAPI) og Googles egne udviklerplatforme.

Hvad er de fremtrædende funktioner ved Gemini 2.5 Flash Image?

Ensartethed i karakter og stil på tværs af redigeringer

En af de centrale forbedringer er karakterkonsistensModellen er eksplicit justeret til at holde et motiv (en person, et kæledyr eller et produkt) visuelt sammenhængende på tværs af flere redigeringer og forskellige kontekster – en langvarig svaghed ved tidligere billedmodeller. Dette forbedrer arbejdsgange, der kræver ensartede brandelementer, tilbagevendende karakterer i historiefortælling eller automatisk genereret produktfotografering med flere billeder.

Promptbaseret, lokaliseret redigering

Du kan tilføje et billede plus en instruktion i naturligt sprog, såsom "fjern pletten på skjorten", "skift til en blå jakke" eller "slør baggrunden og øg lysstyrken på motivet", og modellen udfører målrettede, lokale redigeringer uden behov for manuelle masker i mange tilfælde. Dette gør den praktisk til iterativ, samtalebaseret redigering.

Flerbilledfusion og stiloverførsel

Gemini 2.5 Flash Image kan tage flere billeder og komponere dem ind i en enkelt scene eller overføre stil/tekstur fra et billede til et andet. Det muliggør produktmockups (placering af et produkt i en scene), møbelstaging eller kombinerede billeder til marketing og e-handel.

Indfødt verdenskendskab

Fordi den er bygget på Gemini-familien, udnytter modellen verdenskendskab — f.eks. forståelse af rekvisitter, miljøer eller kontekstuelt korrekte objektrelationer — hvilket hjælper med realistisk scenekonstruktion og semantisk sammenhængende redigeringer (ikke kun æstetisk plausible output).

Lav latenstid og omkostningseffektivitet

Gemini's "Flash"-familie sigter mod lav latenstid og omkostningseffektiv brug sammenlignet med større ræsonnementniveauer. Udviklerens annoncering understreger hastighed og en gunstig pris/kvalitet-afvejning for mange virkelige anvendelsesscenarier.

Indbygget proveniens: SynthID vandmærke

Alle billeder, der er oprettet/redigeret med modellen, inkluderer en usynligt SynthID digitalt vandmærke så billederne senere kan verificeres som AI-genererede eller AI-redigerede. Dette er en del af Googles produktniveau-afbødning af misbrug og sporing af oprindelse.

1) Hvordan kan jeg skabe en ensartet karakter til en langvarig tegneserie- eller brandkampagne?

Hvorfor dette fungerer

Nano Banana blev eksplicit trænet til at bevare det samme karakterudseende på tværs af redigeringer og nye kontekster – nyttigt, når du har brug for, at det samme ansigt, outfit eller maskot vises på tværs af episoder, miniaturebilleder eller heltebilleder. Udviklerne kalder dette "karakterkonsistens".

Sådan spørger du

  • Start med en beskrivende blok, der indfanger identitetstræk (aldersgruppe, ansigtstræk, karakteristiske kendetegn, outfit-elementer).
  • Tilføj en "konsistenstoken"-instruktion som "Brug det samme tegn på tværs af alle output — ændr ikke identifikationsmærker".
  • For output med flere billeder skal du angive et eller flere referencebilleder som input for at låse ligheden.

Sådan beder du om konsekvente redigeringer

  • Start med at beskrive de centrale identitetsegenskaber, du ønsker bevaret: alder, hårfarve, særlige træk (f.eks. "har en lille modermærke på venstre kind") og tøjstil.
  • Brug en todelt prompt, når du redigerer: beskriv først hvad skal forblive identiske, beskriv derefter lave om du ønsker. Eksempel: "Bevar: 28-årig østasiatisk kvinde, kort sort bob, lille modermærke på venstre kind. Ændring: Placer hende i en diner fra 1970'erne iført en rød læderjakke, smilende og med varmt wolframlys."
  • Når du udfører flertrinsredigeringer, skal du inkludere et lille referencetoken som "(KEEP_ID: A)" i prompten og genbruge det til at signalere det samme emne på tværs af prompter.

Eksempel prompt

"Lav et fotorealistisk portræt af Amina, en 28-årig grafisk forfatter med en kort asymmetrisk klipning, en halvmåneformet modermærke på venstre kind, varme brune øjne og en grøn læderjakke. Bevar Aminas identificerende træk på tværs af de følgende 6 sceneprompter: 'Amina på en morgenkaffebar', 'Amina tegner i parken', ... Brug den samme karakterlignende form i hver scene.

Kodestykke (Python, generer flere billeder)

Dette eksempel bruger Gemini API-klienten, der er vist i Googles dokumenter – send din beskrivende prompt og loop-scenevarianter.

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()
base_description = (
    "Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
    "crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)

scenes = [
    "Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
    "Amina sketching in the park, windy afternoon, soft bokeh background.",
    # add more scenes...

]

for i, scene in enumerate(scenes, start=1):
    prompt = f"{base_description} Scene: {scene}"
    response = client.models.generate_content(
        model="gemini-2.5-flash-image-preview",
        contents=,
    )
    parts = response.candidates.content.parts
    for part in parts:
        if part.inline_data:
            img = Image.open(BytesIO(part.inline_data.data))
            img.save(f"amina_scene_{i}.png")

2) Hvordan kan Nano Banana accelerere e-handelsproduktfotografering og A/B-billeder?

Hvorfor dette er kreativt og nyttigt

Produktteams bruger enorme ressourcer på flere optagelser, lysopsætninger og variationer (farver, baggrunde). Nano Banana's flerbilledfusion og præcis og hurtig redigering giver dig mulighed for hurtigt at generere ensartede produktvarianter og livsstilskompositter – til katalogbilleder, livsstilsscener og sociale medier – hvilket reducerer iterationstid og produktionsomkostninger.

Sådan spørger du efter produktvarianter

  • Angiv en kort produktspecifikation (dimensioner, materialer, farvepalet) og den fotografiske stil (f.eks. "studiehvid baggrund, 45° vinkel, blød skygge").
  • For varianter: “Lav 4 variationer af dette Bluetooth-headset: sort, pink, grå med orange ørepropper og grå med blåt glimt – alle med samme belysning, samme kameravinkel og i et hvidt rum.”
  • Brug multi-image fusion til at placere produktet i forskellige scener: "Placer denne rygsæk på et picnictæppe i den gyldne time med lav dybdeskarphed."

Eksempel på prompt (produkt)

"Billede A (produktreference): Premium læderrygsæk. Skab tre katalogvarianter med hvid baggrund — skovgrøn, brun, trækul — taget i en 45° vinkel, naturlig blød skygge, ISO-fornemmelse på 100."

Kodestykke: hurtig Python-generering (katalogvariant)

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=,
)

# Save images from response parts (example)

for i, part in enumerate(response.candidates.content.parts):
    if part.inline_data:
        img = Image.open(BytesIO(part.inline_data.data))
        img.save(f"backpack_variant_{i}.png")

Dette kodestykke afspejler Googles dokumenterede brugsmønster og er et godt udgangspunkt for at automatisere oprettelsen af ​​produktvarianter.

Outputbillede:

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

3) Hvordan kan jeg lave lærerige illustrationer, der kombinerer fotos og diagrammer?

Hvorfor dette fungerer

Nano Banana integrerer verdensviden (Geminis multimodale ræsonnement), så den kan fortolke håndtegnede diagrammer, annotere billeder eller skabe forklarende visuelle elementer ud fra en blanding af fotos og tekstuelle instruktioner – praktisk til e-læring, teknisk dokumentation og interaktive undervisere.

Sådan spørger du

  • Sørg for billeder (f.eks. et foto af et fysisk eksperiment) og en prompt som "Annoter dette billede med etiketter og pile, der forklarer nøglekomponenterne, og lav et andet billede, der viser systemet i tværsnit."

Eksempel prompt

Generer fire billedforklaringer af viden: Menneskehjernens neurale netværk, cellulær rehabilitering, SATP-produktion, DNA-dobbelthelixens genetiske kode, klorpastens plantefotosyntese.

Outputbillede:

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

4) Hvordan kan jeg forvandle rigtige fotos til marketingvariationer, der passer til brandet (outfit, belysning, baggrund)?

Hvorfor dette fungerer

Modellen understøtter målrettet transformation og lokale redigeringer udtrykt via naturligt sprog: skift et outfit, juster belysning, udskift baggrunden eller fjern objekter – og det forsøger at bevare motivets identitet og den overordnede realisme. Dette muliggør hurtige markedsføringsvarianter (sæsonbestemte outfits, lokaliserede scener).

Sådan spørger du

  • Angiv det originale billede som input.
  • Spørg efter målrettede redigeringer med eksplicitte instruktioner, f.eks. "Erstat jakken med en rød uldpeacoat, skift baggrunden til bygade i skumringen, tilføj varmt lys fra kanten."

Eksempel prompt

"Ud fra det uploadede billede skal du erstatte den blå denimjakke med en skræddersyet rød uldpeacoat, indstille baggrunden til en tidlig aftengade i byen med let bokeh, og tilføje et blidt lysindfald i kanten for at adskille motivet fra baggrunden."

Hints

  • Hvis du har brug for iterativ kontrol, så foretag flertrinsredigeringer: bed om en første redigering, og forfin derefter ("fjern hatten", "opvarm nu farvetemperaturen").

5) Hvordan kan animationsskabere og prævisualiseringsteams lave prototyper af scener og storyboards?

Hvorfor det er nyttigt

Instruktører og DP'er kan hurtigt lave prototyper til lysopsætninger, garderober og kamerakompositioner. Nano Banana kan producere storyboards med ensartede karakterer, hvilket hjælper med planlægning og forberedelse. ()

H3: Eksempel på prompt

There is a tree house in the forest at night with colorful lights hanging on the trees

Outputbillede:

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

6) Hvordan kan Nano Banana bruges til konceptkunst, spilelementer og ensartede karakterer i spillet?

Hvorfor spilstudier og indie-udviklere burde bekymre sig

At skabe kunstneriske elementer og iterere karakterudseende kræver normalt, at kunstnere gentagne gange omarbejder karaktererne. Nano Bananas karakterkonsistens gør det praktisk at generere adskillige poseringer, outfits og lysopsætninger, der forbliver tro mod en enkelt karakteridentitet – en enorm tidsbesparelse i præproduktion og hurtig prototyping.

Sådan beder du om spilaktiver

  • Definer det "kanoniske" karakterskema i teksten: højde, kropstype, nøglefunktioner, basisgarderobeelementer.
  • Anmod om flere output: "Generer tre varianter af kamprustning med de samme ansigtstræk, hver vist forfra, i profil og i ¾-positurer."
  • Til miljøkunst skal du bruge flerbilledfusion: giv et billede af karakteren og et af miljøet, og bed om at fusionere dem.

Eksempel på prompt (spilaktiver)

"Skab tre pansrede varianter til 'Kael, vindvogteren': behold ansigtstrækkene (smal kæbe, ar over højre øjenbryn). Rustning A: læder + blågrønt stof; Rustning B: skællakse + messing; Rustning C: skjult matsort. Udfør hele kroppens front, profil, ¾."

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

Armor C: Stealth Mat Sort

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

Rustning B: Skala + Messing

7 kreative anvendelser af Gemini 2.5 Flash Image (Nano Banana)

Rustning A: Læder + Blågrønt stof

7) Hvordan kan jeg automatisere arbejdsgange til fotoretouchering med konversationsredigering med flere omgange?

Hvorfor dette fungerer

Nano Banana understøtter konversationel billedredigering med flere trin: du kan anmode om en redigering, inspicere resultatet og følge op med flere instruktioner i naturligt sprog. Det er perfekt til at opbygge en "human-in-the-loop"-retoucheringspipeline, hvor en editor skubber modellen gennem flere gennemgange.

Sådan implementerer du arbejdsgangen

  • Upload et første billede og anmod om en baseline retouchering (belysning, fjernelse af pletter).
  • Send det nyredigerede billede tilbage til modellen med den næste instruktion ("reducer højlys, fremhæv skygger, beskær til 4:5") i hver omgang.
  • Log hvert trin, så du kan fortryde eller anvende den samme proces på en batch.

Mini-workflow-snippet (Python)

# 1) Initial retouch

prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png

# 2) Follow-up tweak

prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png

Hvordan giver jeg Nano Banana de bedste resultater?

Hvilke tilskyndende principper bør jeg følge?

Nano Banana reagerer bedst på beskrivende, narrative stilprompter der forklarer scenen, perspektivet, belysningen og stemningen – ikke bare en liste med nøgleord. Den officielle vejledning anbefaler at angive kamera-, objektiv-, belysnings- og stilistiske signaler til fotorealisme eller stil- og paletsignaler til illustrationer. Angiv også eksplicit begrænsninger (billedformat, baggrund, tekstkrav).

Hvordan strukturerer jeg en stærk prompt?

Her er korte, genanvendelige skabeloner:

  • Fotorealistisk skabelon:
    A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: .
  • Stiloverførsels-/kompositionsskabelon:
    Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style: .

Hurtige tekniske tips (hurtig liste)

  • Brug én klar fortællende sætning i stedet for mange usammenhængende tags.
  • Tilføj kamera detaljer til fotorealisme (f.eks. "85 mm, lille dybdeskarphed").
  • For at sikre ensartede tegn på tværs af redigeringer skal du referere til det forrige billede og den attribut, du ønsker at bevare (f.eks. "behold motivets fregner og blå tørklæde, skift frisure til...").
  • Upload kildebilledet, når du redigerer og beskriv præcis hvilke regioner eller elementer, der skal ændres.
  • Brug iterative redigeringer med flere trin til at forfine bittesmå visuelle detaljer (Nano Banana understøtter konversationsforfining).

Endelig note

Nano Banana (Gemini 2.5 Flash Image) er et kreativt spring: det giver skabere mulighed for at bevare karakter- og produktkontinuitet, samtidig med at det muliggør dristige nye redigeringer, fusion af flere billeder og hurtig iteration. Brug det til at accelerere historiefortælling, reducere produktionsfriktion og prototype visuelle billeder i høj fart – men kombiner disse gevinster med grundig gennemgang og etiske sikkerhedsforanstaltninger.

Kom godt i gang

CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, formatering af anmodninger og svarhåndtering forenkler CometAPI dramatisk integrationen af ​​AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.

Udviklere kan få adgang Gemini 2.5 Flash-billede(Nano Banana Comet API-liste gemini-2.5-flash-image-preview/gemini-2.5-flash-image stilposter i deres katalog.) via CometAPI, er de seneste modelversioner, der er angivet, fra artiklens udgivelsesdato. For at begynde, skal du udforske modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.

Læs mere

500+ modeller i én API

Op til 20% rabat