Google DeepMind har i dag annonsert betydelige utvidelser av Gemini 2.5-familien, og avduket de stabile utgivelsene av Gemini 2.5 Pro og Gemini 2.5 Flash, samt en forhåndsvisning av den helt nye Gemini 2.5 Flash-Lite-modellen. Disse oppdateringene gjenspeiler Googles fortsatte forpliktelse til å tilby et spekter av AI-modeller som balanserer kostnad, hastighet og ytelse for ulike arbeidsbelastninger.
Stabile utgivelser: Gemini 2.5 Pro og Flash
- juni 2025 annonserte Google at Gemini 2.5 Pro og Gemini 2.5 Flash var generell tilgjengelige. Pro-varianten leverer maksimal resonneringskraft og er skreddersydd for oppgaver med høy kompleksitet, som avansert kodegenerering, vitenskapelig analyse og storskala datasyntese. I motsetning til dette tilbyr Gemini 2.5 Flash et mellomnivåalternativ optimalisert for daglig bruk som krever lav latens – ideelt for chatboter, oppsummering og innholdsproduksjon i stor skala.
Oversikt: Tre modeller i Gemini-2.5-familien
| Modell | status | Sterke | Ideelle brukstilfeller |
|---|---|---|---|
| Gemini 2.5 Flash-Lite (forhåndsvisning) | Forhåndsvisning | Raskest og billigst; multimodal; kontrollerbar resonnering; verktøyaktivert | Oppgaver med høyt volum som chatboter, oppsummeringer og søk |
| Gemini 2.5 Flash | Stabil | Balansert: lav latens, god resonnering, multimodal | Samtaler i sanntid, kundestøtte |
| Gemini 2.5 Pro | Stabil | Mest kapabel: dyp resonnering, stor kontekst, multimodal | Forskning, kompleks koding, vitenskapelige oppgaver |

Gemini 2.5 Flash-Lite: Forhåndsvisning av høydepunkter
Ultralav latens og kostnadsbesparelserUtviklet for sanntidsapplikasjoner med høyt volum, som oversettelse, klassifisering og oppsummering. Har raskere inferens og lavere kostnad per samtale sammenlignet med både 2.0 Flash-Lite og fullversjonen av Flash.
Forbedret grunnleggende ytelseOvergår tidligere Flash-Lite-modeller på tvers av referansepunkter innen kodegenerering, logikk, matematikk, multimodal resonnering og naturfag.
Kostnad og effektivitetFlash-Lite-priser (forhåndsvisning): ~$0.10 per 1 million input-tokener og ~$0.40 per 1 million output-tokener – betydelig billigere enn Flash ($0.30/$2.50) og Pro ($1.25/$10).
Full Gemini -2.5-funksjoner:
- Kontrollerbar tenkningBrukere kan angi «tenkebudsjetter» (tokengrenser) for å bytte hastighet mot dybde – Flash-Lite kan slå dette på etter behov.
- Multimodal inngangStøtter tekst, bilde, lyd og video (inkludert timeslange klipp), med mulighet for å analysere diagrammer, brukergrensesnitt, scener og hendelsessammendrag.
- VerktøyintegrasjonInkluderer Google-søk, kodeutførelse og et kontekstvindu med millioner av tokens, som matcher funksjonene til Flash og Pro.
Posisjonering på pris-ytelseskurven
Google plasserer Flash-Lites høye hastighet og lave kostnad som den beste Pareto grense, som betyr at den er blant de mest kostnadseffektive, men likevel kapable modellene i verden (). I sammenlignende evalueringer, Flash-Lite representerer den beste verdien: smart, men rimelig.
Om Flash og Pro
- Gemini 2.5 FlashStabil, multimodal tenkemodell med lav latens. Plassert under Pro, men omtrent på nivå med GPT-4o i kapasitet, med overlegen hastighet og kostnadseffektivitet ().
- Gemini 2.5 ProGoogles mest avanserte modell. Kjent for å håndtere timevis lang video/lyd, kompleks kode og matematikk, og resonnering med stor kontekst. Introduserer også selektive «tenkebudsjetter» og forbedret kodekvalitet for å fungere som en langsiktig stabil flaggskip-AI.
Implementering og priser
- TilgjengelighetAlle tre modellene er tilgjengelige via Google AI Studio, Google Cloud Vertex AI, og Gemini-appen .
- Kostnadsstruktur (Vertex AI-priser fra 16. juni 2025):
- pro1.25 USD/1 mill. input, 10 USD/1 mill. output (høyere enn 200 XNUMX tokens)
- Blitz: $0.15/1M input, $3.50/1M output i «tenkemodus» – og inkluderer 1,500 gratis jordede prompter daglig ()
- Flash-Lite (forhåndsvisning): ~$0.10/$0.40 per 1 million tokens
Komme i gang
CometAPI tilbyr et enhetlig REST-grensesnitt som samler hundrevis av AI-modeller – under et konsistent endepunkt, med innebygd API-nøkkeladministrasjon, brukskvoter og faktureringsdashboards. I stedet for å sjonglere flere leverandør-URL-er og legitimasjonsinformasjon.
Utviklere har tilgang Gemini 2.5 Flash-Lite (forhåndsversjon) API gjennom CometAPI, de nyeste modellene som er oppført er per artikkelens publiseringsdato. For å begynne, utforsk modellens muligheter i lekeplass og konsulter API-veiledning for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og fått API-nøkkelen. CometAPI tilby en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med å integrere.
