Gemini 2.5 Flash Image (også kjent som «Nano banana») er Googles nyeste modell for generering og redigering av native bilder i Gemini 2.5-familien. Den fokuserer på flerbildefusjon, presise redigeringer i naturlig språk og raske multimodale arbeidsflyter.
Introduksjon til modellen
Hva det er – Gemini 2.5 Flash-bilde er en multimodal modell for bildegenerering og -redigering bygget på Gemini 2.5-familien. Den er designet for å produsere fotorealistiske bilder, utføre målrettede redigeringer (innmaling, stiloverføring, objektbytter), og bland bilder fra flere kilder til én sammenhengende utdata – samtidig som man bruker Geminis forbedrede språklige resonnement for å kontrollere komposisjon og semantikk.
Nøkkelegenskaper
- Generering og redigering av originale bilder — generere bilder eller redigere eksisterende bilder via instruksjoner i naturlig språk. (Generer / Rediger).
- Flerbildefusjon — kombinere flere inndatabilder til én fotorealistisk scene.
- Karakterkonsistens — behold samme emne- eller karakterutseende på tvers av redigeringer og ledetekster. (Konsistens).
- SynthID-vannmerking — alle utganger inkluderer en usynlig SynthID for å identifisere AI-generert innhold. (Vannmerke).
Tekniske detaljer
- Arkitektur og posisjonering: bygget på Gemini 2.5 Flash-familien – designet som en lav latens «Flash»-variant som bytter bort en liten modellstørrelse/gjennomstrømning for mye raskere respons per samtale og kostnadseffektivitet, samtidig som den beholder sterkere resonnement enn tidligere Flash-nivåer.
- Inndataformater og begrensninger: aksepterer inline base64 bilder for små innganger og filopplastinger via File API for større bilder (anbefales for >20 MB). Støtter vanlige MIME-typer (JPEG, PNG).
- Driftsmåter: tekst-til-bilde, bilderedigering (innmaling / semantisk maskering), stiloverføring, flerbildekomposisjon og sammenflettet tekst+bilde-svar (nyttig for illustrerte instruksjoner, oppskrifter eller blandet innhold).
- Opprinnelses- og sikkerhetsmekanismer: synlige vannmerker på AI-utganger pluss skjulte SynthID-markører og lag med policyhåndhevelse for å begrense eksplisitt innhold som ikke er tillatt.
Benchmark ytelse

Begrensninger og kjente risikoer
- Begrensninger i innholdspolicyen: modeller håndhever innholdsregler (f.eks. forby eksplisitt seksuelt innhold og noe ulovlig innhold), men håndhevingen er ikke perfekt – det kan fortsatt være mulig å generere bilder av offentlige personer eller kontroversielle ikoner i noen scenarier, så policykontroller er viktige. )
- Feilmoduser: mulig identitetsdrift i ekstreme redigeringer, sporadisk semantisk feiljustering (når ledetekster er underspesifisert), og artefakter i svært komplekse scener eller ekstreme synspunktendringer.
- Opprinnelse og misbruk: Selv om vannmerker og SynthID finnes, forhindrer disse ikke misbruk – de hjelper med deteksjon og kreditering, men er ikke en erstatning for menneskelig gjennomgang i sensitive arbeidsflyter.
Typiske brukstilfeller
- Produkt og e-handel: plasser/katalogiser produkter i livsstilsbilder via flerbildefusjon.
- Kreativt verktøy / design: raske iterasjoner i designapper (Adobe Firefly-integrasjon sitert).
- Fotoredigering og retusjering: lokaliserte redigeringer fra naturlig språk (fjerne objekter, endre farge/belysning, endre stil).
- Historiefortelling / karakterressurser: holde karakterene konsistente på tvers av paneler og scener.
Hvordan ringe Gemini 2.5 Flash-bilde API fra CometAPI
Gemini 2.5 Flash Image API-priser i CometAPI, 20 % avslag på den offisielle prisen:
| Pris | $0.3120 |
Nødvendige trinn
- Logg på cometapi.com. Hvis du ikke er vår bruker ennå, vennligst registrer deg først
- Få tilgangslegitimasjons-API-nøkkelen til grensesnittet. Klikk "Legg til token" ved API-tokenet i det personlige senteret, hent tokennøkkelen: sk-xxxxx og send inn.
- Få url til dette nettstedet: https://api.cometapi.com/
Bruk metoden
- Velg "
Gemini-2.5 Flash-Image” endepunkt for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten er hentet fra vårt API-dokument for nettstedet vårt. Vårt nettsted gir også Apifox-test for din bekvemmelighet. - Erstatt med din faktiske CometAPI-nøkkel fra kontoen din.
- Sett inn spørsmålet eller forespørselen din i innholdsfeltet – det er dette modellen vil svare på.
- . Behandle API-svaret for å få det genererte svaret.
CometAPI tilbyr et fullt kompatibelt REST API – for sømløs migrering. Viktige detaljer for API-dok:
- endepunkt:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Modellparameter: forhåndsvisning av gemini-2.5-blitsbilde / gemini-2.5-blitsbilde
- Autentisering:
Bearer YOUR_CometAPI_API_KEY - Innholdstype:
application/json.
Merk: Når du starter API-et, sett parameteren «stream» til true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Se også GPT-image-1 API



