Gemini 2.5 Flash Image API (Nano-Banan)

CometAPI
AnnaSep 10, 2025
Gemini 2.5 Flash Image API (Nano-Banan)

Gemini 2.5 Flash Image (også kendt som "Nano banana") er Googles nyeste model til generering og redigering af native billeder i Gemini 2.5-familien. Den fokuserer på fusion af flere billeder, præcis redigering i naturligt sprog og hurtige multimodale arbejdsgange.

Introduktion til modellen

Hvad det er — Gemini 2.5 Flash-billede er en multimodal billedgenererings- og redigeringsmodel bygget på Gemini 2.5-familien. Den er designet til at producere fotorealistiske billeder, udføre målrettede redigeringer (indmaling, stiloverførsel, objektbytter) og bland billeder fra flere kilder til et enkelt sammenhængende output — samtidig med at Gemini's forbedrede sproglige ræsonnement anvendes til at kontrollere komposition og semantik.

Nøglefunktioner

  • Generering og redigering af oprindelige billeder — generer billeder eller rediger eksisterende fotos via instruktioner i naturligt sprog. (Generer / Rediger).
  • Flerbilledfusion — kombiner flere inputbilleder til én fotorealistisk scene.
  • Karakterkonsistens — behold det samme emne- eller karakterudseende på tværs af redigeringer og prompts. (Konsistens).
  • SynthID-vandmærkning — alle output inkluderer en usynlig SynthID at identificere AI-genereret indhold. (Vandmærke).

Tekniske detaljer

  • Arkitektur og positionering: bygget på Gemini 2.5 Flash-familien — designet som en lav latenstid "Flash"-variant, der bytter en lille modelstørrelse/gennemstrømning for at opnå en meget hurtigere respons pr. opkald og omkostningseffektivitet, samtidig med at den bevarer en stærkere argumentation end tidligere Flash-niveauer.
  • Inputformater og begrænsninger: accepterer inline base64 billeder for små input og fil uploads via File API'en til større billeder (anbefales til >20 MB). Understøtter almindelige MIME-typer (JPEG, PNG).
  • Driftsformer: tekst-til-billede, billedredigering (inpainting / semantisk maskering), stiloverførsel, flerbilledkomposition og sammenflettet tekst+billede-svar (nyttigt til illustrerede instruktioner, opskrifter eller blandet indhold).
  • Proveniens og sikkerhedsmekanismer: synlige vandmærker på AI-output plus skjulte SynthID-markører og politikhåndhævelseslag for at begrænse eksplicit, ikke-tilladt indhold.

Benchmark ydeevne

Gemini 2.5 Flash Image API (Nano-Banan)

Begrænsninger og kendte risici

  • Begrænsninger i indholdspolitikken: modeller håndhæver indholdspolitikker (f.eks. forbyder eksplicit seksuelt indhold og noget ulovligt indhold), men håndhævelsen er ikke perfekt – generering af billeder af offentlige personer eller kontroversielle ikoner kan stadig være muligt i nogle scenarier, så Politiktjek er afgørende. )
  • Fejltilstande: mulig identitetsdrift i ekstreme redigeringer, lejlighedsvis semantisk fejljustering (når prompter er underspecificerede) og artefakter i meget komplekse scener eller ekstreme synspunktskift.
  • Oprindelse og misbrug: Selvom vandmærker og SynthID er til stede, forhindrer disse ikke misbrug – de hjælper med at opdage og identificere data, men er ikke en erstatning for menneskelig gennemgang i følsomme arbejdsgange.

Typiske brugssager

  • Produkt og e-handel: placer/katalogiser produkter i livsstilsbilleder via flerbilledfusion.
  • Kreative værktøjer / design: hurtige iterationer i designapps (Adobe Firefly-integration nævnt).
  • Fotoredigering og retouchering: lokaliserede redigeringer fra naturligt sprog (fjern objekter, skift farve/belysning, omstil).
  • Fortællings-/karakteregenskaber: holde karaktererne konsistente på tværs af paneler og scener.

Sådan ringer du Gemini 2.5 Flash-billede API fra CometAPI

Gemini 2.5 Flash Image API-priser i CometAPI, 20 % rabat på den officielle pris:

Pris$0.3120

Påkrævede trin

  • Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
  • Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
  • Hent url'en til dette websted: https://api.cometapi.com/

Brug metoden

  1. Vælg "Gemini-2.5 Flash-Image” endepunkt for at sende API-anmodningen og indstille anmodningsteksten. Forespørgselsmetoden og anmodningsteksten er hentet fra vores websteds API-dokument. Vores websted tilbyder også Apifox-test for din bekvemmelighed.
  2. Erstatte med din faktiske CometAPI-nøgle fra din konto.
  3. Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
  4. . Behandle API-svaret for at få det genererede svar.

CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til  API-dok:

  • Endpoint: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Modelparameter: gemini-2.5-flash-billede-forhåndsvisning / gemini-2.5-flash-billede
  • Godkendelse: Bearer YOUR_CometAPI_API_KEY
  • Indholdstype: application/json .

Bemærk: Når du kalder API'en, skal du indstille parameteren "stream" til true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Se også GPT-image-1 API

SHARE THIS BLOG

500+ modeller i én API

Op til 20% rabat