Gemini 2.5 Flash Image API (Nano-Banana)

CometAPI
AnnaSep 10, 2025
Gemini 2.5 Flash Image API (Nano-Banana)

Gemini 2.5 Flash Image (også kjent som «Nano banana») er Googles nyeste modell for generering og redigering av native bilder i Gemini 2.5-familien. Den fokuserer på flerbildefusjon, presise redigeringer i naturlig språk og raske multimodale arbeidsflyter.

Introduksjon til modellen

Hva det er – Gemini 2.5 Flash-bilde er en multimodal modell for bildegenerering og -redigering bygget på Gemini 2.5-familien. Den er designet for å produsere fotorealistiske bilder, utføre målrettede redigeringer (innmaling, stiloverføring, objektbytter), og bland bilder fra flere kilder til én sammenhengende utdata – samtidig som man bruker Geminis forbedrede språklige resonnement for å kontrollere komposisjon og semantikk.

Nøkkelegenskaper

  • Generering og redigering av originale bilder — generere bilder eller redigere eksisterende bilder via instruksjoner i naturlig språk. (Generer / Rediger).
  • Flerbildefusjon — kombinere flere inndatabilder til én fotorealistisk scene.
  • Karakterkonsistens — behold samme emne- eller karakterutseende på tvers av redigeringer og ledetekster. (Konsistens).
  • SynthID-vannmerking — alle utganger inkluderer en usynlig SynthID for å identifisere AI-generert innhold. (Vannmerke).

Tekniske detaljer

  • Arkitektur og posisjonering: bygget på Gemini 2.5 Flash-familien – designet som en lav latens «Flash»-variant som bytter bort en liten modellstørrelse/gjennomstrømning for mye raskere respons per samtale og kostnadseffektivitet, samtidig som den beholder sterkere resonnement enn tidligere Flash-nivåer.
  • Inndataformater og begrensninger: aksepterer inline base64 bilder for små innganger og filopplastinger via File API for større bilder (anbefales for >20 MB). Støtter vanlige MIME-typer (JPEG, PNG).
  • Driftsmåter: tekst-til-bilde, bilderedigering (innmaling / semantisk maskering), stiloverføring, flerbildekomposisjon og sammenflettet tekst+bilde-svar (nyttig for illustrerte instruksjoner, oppskrifter eller blandet innhold).
  • Opprinnelses- og sikkerhetsmekanismer: synlige vannmerker på AI-utganger pluss skjulte SynthID-markører og lag med policyhåndhevelse for å begrense eksplisitt innhold som ikke er tillatt.

Benchmark ytelse

Gemini 2.5 Flash Image API (Nano-Banana)

Begrensninger og kjente risikoer

  • Begrensninger i innholdspolicyen: modeller håndhever innholdsregler (f.eks. forby eksplisitt seksuelt innhold og noe ulovlig innhold), men håndhevingen er ikke perfekt – det kan fortsatt være mulig å generere bilder av offentlige personer eller kontroversielle ikoner i noen scenarier, så policykontroller er viktige. )
  • Feilmoduser: mulig identitetsdrift i ekstreme redigeringer, sporadisk semantisk feiljustering (når ledetekster er underspesifisert), og artefakter i svært komplekse scener eller ekstreme synspunktendringer.
  • Opprinnelse og misbruk: Selv om vannmerker og SynthID finnes, forhindrer disse ikke misbruk – de hjelper med deteksjon og kreditering, men er ikke en erstatning for menneskelig gjennomgang i sensitive arbeidsflyter.

Typiske brukstilfeller

  • Produkt og e-handel: plasser/katalogiser produkter i livsstilsbilder via flerbildefusjon.
  • Kreativt verktøy / design: raske iterasjoner i designapper (Adobe Firefly-integrasjon sitert).
  • Fotoredigering og retusjering: lokaliserte redigeringer fra naturlig språk (fjerne objekter, endre farge/belysning, endre stil).
  • Historiefortelling / karakterressurser: holde karakterene konsistente på tvers av paneler og scener.

Hvordan ringe Gemini 2.5 Flash-bilde API fra CometAPI

Gemini 2.5 Flash Image API-priser i CometAPI, 20 % avslag på den offisielle prisen:

Pris$0.3120

Nødvendige trinn

  • Logg på cometapi.com. Hvis du ikke er vår bruker ennå, vennligst registrer deg først
  • Få tilgangslegitimasjons-API-nøkkelen til grensesnittet. Klikk "Legg til token" ved API-tokenet i det personlige senteret, hent tokennøkkelen: sk-xxxxx og send inn.
  • Få url til dette nettstedet: https://api.cometapi.com/

Bruk metoden

  1. Velg "Gemini-2.5 Flash-Image” endepunkt for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten er hentet fra vårt API-dokument for nettstedet vårt. Vårt nettsted gir også Apifox-test for din bekvemmelighet.
  2. Erstatt med din faktiske CometAPI-nøkkel fra kontoen din.
  3. Sett inn spørsmålet eller forespørselen din i innholdsfeltet – det er dette modellen vil svare på.
  4. . Behandle API-svaret for å få det genererte svaret.

CometAPI tilbyr et fullt kompatibelt REST API – for sømløs migrering. Viktige detaljer for  API-dok:

  • endepunkt: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Modellparameter: forhåndsvisning av gemini-2.5-blitsbilde / gemini-2.5-blitsbilde
  • Autentisering: Bearer YOUR_CometAPI_API_KEY
  • Innholdstype: application/json .

Merk: Når du starter API-et, sett parameteren «stream» til true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Se også GPT-image-1 API

SHARE THIS BLOG

500+ modeller i ett API

Opptil 20 % rabatt