Gemini 2.5 Flash Image (også kendt som "Nano banana") er Googles nyeste model til generering og redigering af native billeder i Gemini 2.5-familien. Den fokuserer på fusion af flere billeder, præcis redigering i naturligt sprog og hurtige multimodale arbejdsgange.
Introduktion til modellen
Hvad det er — Gemini 2.5 Flash-billede er en multimodal billedgenererings- og redigeringsmodel bygget på Gemini 2.5-familien. Den er designet til at producere fotorealistiske billeder, udføre målrettede redigeringer (indmaling, stiloverførsel, objektbytter) og bland billeder fra flere kilder til et enkelt sammenhængende output — samtidig med at Gemini's forbedrede sproglige ræsonnement anvendes til at kontrollere komposition og semantik.
Nøglefunktioner
- Generering og redigering af oprindelige billeder — generer billeder eller rediger eksisterende fotos via instruktioner i naturligt sprog. (Generer / Rediger).
- Flerbilledfusion — kombiner flere inputbilleder til én fotorealistisk scene.
- Karakterkonsistens — behold det samme emne- eller karakterudseende på tværs af redigeringer og prompts. (Konsistens).
- SynthID-vandmærkning — alle output inkluderer en usynlig SynthID at identificere AI-genereret indhold. (Vandmærke).
Tekniske detaljer
- Arkitektur og positionering: bygget på Gemini 2.5 Flash-familien — designet som en lav latenstid "Flash"-variant, der bytter en lille modelstørrelse/gennemstrømning for at opnå en meget hurtigere respons pr. opkald og omkostningseffektivitet, samtidig med at den bevarer en stærkere argumentation end tidligere Flash-niveauer.
- Inputformater og begrænsninger: accepterer inline base64 billeder for små input og fil uploads via File API'en til større billeder (anbefales til >20 MB). Understøtter almindelige MIME-typer (JPEG, PNG).
- Driftsformer: tekst-til-billede, billedredigering (inpainting / semantisk maskering), stiloverførsel, flerbilledkomposition og sammenflettet tekst+billede-svar (nyttigt til illustrerede instruktioner, opskrifter eller blandet indhold).
- Proveniens og sikkerhedsmekanismer: synlige vandmærker på AI-output plus skjulte SynthID-markører og politikhåndhævelseslag for at begrænse eksplicit, ikke-tilladt indhold.
Benchmark ydeevne

Begrænsninger og kendte risici
- Begrænsninger i indholdspolitikken: modeller håndhæver indholdspolitikker (f.eks. forbyder eksplicit seksuelt indhold og noget ulovligt indhold), men håndhævelsen er ikke perfekt – generering af billeder af offentlige personer eller kontroversielle ikoner kan stadig være muligt i nogle scenarier, så Politiktjek er afgørende. )
- Fejltilstande: mulig identitetsdrift i ekstreme redigeringer, lejlighedsvis semantisk fejljustering (når prompter er underspecificerede) og artefakter i meget komplekse scener eller ekstreme synspunktskift.
- Oprindelse og misbrug: Selvom vandmærker og SynthID er til stede, forhindrer disse ikke misbrug – de hjælper med at opdage og identificere data, men er ikke en erstatning for menneskelig gennemgang i følsomme arbejdsgange.
Typiske brugssager
- Produkt og e-handel: placer/katalogiser produkter i livsstilsbilleder via flerbilledfusion.
- Kreative værktøjer / design: hurtige iterationer i designapps (Adobe Firefly-integration nævnt).
- Fotoredigering og retouchering: lokaliserede redigeringer fra naturligt sprog (fjern objekter, skift farve/belysning, omstil).
- Fortællings-/karakteregenskaber: holde karaktererne konsistente på tværs af paneler og scener.
Sådan ringer du Gemini 2.5 Flash-billede API fra CometAPI
Gemini 2.5 Flash Image API-priser i CometAPI, 20 % rabat på den officielle pris:
| Pris | $0.3120 |
Påkrævede trin
- Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
- Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
- Hent url'en til dette websted: https://api.cometapi.com/
Brug metoden
- Vælg "
Gemini-2.5 Flash-Image” endepunkt for at sende API-anmodningen og indstille anmodningsteksten. Forespørgselsmetoden og anmodningsteksten er hentet fra vores websteds API-dokument. Vores websted tilbyder også Apifox-test for din bekvemmelighed. - Erstatte med din faktiske CometAPI-nøgle fra din konto.
- Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
- . Behandle API-svaret for at få det genererede svar.
CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til API-dok:
- Endpoint:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Modelparameter: gemini-2.5-flash-billede-forhåndsvisning / gemini-2.5-flash-billede
- Godkendelse:
Bearer YOUR_CometAPI_API_KEY - Indholdstype:
application/json.
Bemærk: Når du kalder API'en, skal du indstille parameteren "stream" til true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Se også GPT-image-1 API



