Tekniske spesifikasjoner for Gemini 3.1 Flash Image Preview
| Element | Gemini 3.1 Flash Image Preview |
|---|---|
| Leverandør | |
| Modellfamilie | Gemini 3.1 (Flash tier) |
| Primært fokus | Rask multimodal generering med bildeforhåndsvisning |
| Inndatatyper | Tekst, Bilde |
| Utdatatyper | Tekst, Bilde (forhåndsgenerering) |
| Kontekstvindu | Opptil 1M tokens (Gemini 3.x Flash tier standard) |
| Latensnivå | Lav latens, høy gjennomstrømning |
| Strømmestøtte | Ja |
| Verktøykalling | Ja (Gemini API tools framework) |
| Versjon | 3.1 |
Hva er Nano Banana 2
Nano Banana 2 er det populære kallenavnet som brukes av pressen og utviklermiljøet for den nylig lanserte Gemini-3.1-Flash-Image-modellen. Google posisjonerer den som bilde-motoren på “Flash”-nivå som bringer nær-Pro visuell fidelitet til et mye lavere latens- og kostnadsnivå — egnet for høyt volum, rask iterativ redigering og integrerte produktarbeidsflyter på tvers av Google-tjenester. Den arver Gemini 3.1s multimodale resonnering og legger til bildefokuserte kapabiliteter (leselig tekst i bilder, sammensetning av flere bilder, støtte for brede sideforhold, native 4K).
Hovedfunksjoner
- Høyhastighets, multiresolusjonsgenerering: Flash-tier-hastighet med valg for 0.5K / 1K / 2K / 4K utganger og nye ekstreme sideforhold (1:4, 4:1, 1:8, 8:1).
- Sanntids nettforankring: Integrerer både tekst- og bildesøkresultater for å forankre generert innhold i aktuell nettinformasjon når “Thinking” eller søkeforankring er aktivert. Nyttig for oppdaterte referanser og faktabaserte infografikker.
- Forbedret tekstrendering: Bedre rendering av kort tekst og grafisk tekst (fonter, størrelser) enn tidligere Flash-modeller; fortsatt ikke perfekt på lange avsnitt/små tekster.
- Multi-inndataredigering og flerveis arbeidsflyter: Sterk støtte for å kombinere flere bilder som inndata og for iterative redigeringer over flere omganger.
📊 Benchmark-ytelse — Bildegenerering og redigering (Elo-poeng)
| Kapasitet | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Tekst-til-bilde — Total preferanse | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Tekst-til-bilde — Visuell kvalitet | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Tekst-til-bilde — Infografikk (faktualitet) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Redigering — Generelt | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Redigering — Figur | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Redigering — Kreativ | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Redigering — Objekt/miljø | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Redigering — Multi-inndata | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Redigering — Stilisering | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Viktige konklusjoner fra denne benchmark-tabellen:
- På tvers av kategoriene for tekst-til-bilde-generering og bilderedigering leder eller matcher Gemini 3.1 Flash Image konsekvent de høyeste poengene blant Flash-tier og mange konkurrerende bildemodeller.
- Modellen viser spesielt sterke resultater i Visuell kvalitet og Infografikk (faktualitet) — noe som indikerer at den utmerker seg både i estetisk kvalitet og i å gjengi strukturelt korrekt innhold.
- Ved multi-inndata-redigering viser Nano Banana 2 også robust generalisering, med høyere poeng enn den forrige Flash-generasjonen.
Disse evalueringene gjennomføres via menneskelige side-ved-side Elo-sammenligninger på et variert benchmarksuite, som reflekterer både preferanse og fidelitet på vanlige oppgaver for bildegenerering/redigering.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modell | Posisjonering | Representativ benchmark/merknader |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Flash tier: hastighet + høy visuell kvalitet (2K–4K) | Samlet preferanse 1079.0 ± 7.0; visuell kvalitet 1140 ± 6.0 (intern GenAI-Bench). |
| Gemini 2.5 Flash Image (Nano Banana) | Tidligere Flash-utgivelse (lavere fidelitet) | Svakt lavere preferanse-/visuelle poeng enn 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Pro-tier: høyere opplevd fidelitet for komplekse oppgaver, høyere kost/latens | Ulike avveininger; noen metrikker viser ulike relative rangeringer i spesialiserte oppgaver. |
| GPT-Image 1.5 / andre kommersielle modeller | Konkurrenter (åpne/lukkede) | I Googles interne benchmarks scoret GPT-Image og andre under Gemini 3.1 på visuell kvalitet og samlet preferanse i den rapporterte evalueringen. Uavhengige tredjepartssammenligninger varierer. |
Når bør du velge Flash Image Preview:
- Sanntids bildeforhåndsvisning i apper
- Kostnadssensitiv storskala bildegenerering
- Interaktive designassistenter
Hvordan få tilgang til og integrere Nano Banana 2
Trinn 1: Registrer deg for API-nøkkel
Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn i din CometAPI console. Hent tilgangslegitimasjonen API-nøkkel for grensesnittet. Klikk “Add Token” ved API-tokenet i det personlige senteret, hent token-nøkkel: sk-xxxxx og send inn.
Trinn 2: Send forespørsler til Nano Banana 2 API
Velg “gemini-3.1-flash-image-preview8”-endepunktet for å sende API-forespørselen og sett forespørselens body. Forespørselsmetoden og body hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for din bekvemmelighet. Bytt ut <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. Hvor du kaller det: Gemini genererer bilde
Nano Banana 2 støtter bilderedigering, bildegenerering og arbeidsflyter med flere bilder. For bilderedigering må du laste opp bilde-URL-en. For flere parametere, se dokumentasjonen.
Trinn 3: Hent og verifiser resultater
Behandle API-responsen for å få det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata. Du kan laste ned bildet direkte til din lokale maskin i playground (vanligvis i PNG-format). En bilde-URL genereres i API-prosessen; vennligst last den ned snarest.