Google lanserer ny Gemini 2.5 Flash-Lite-modell

CometAPI
AnnaJun 17, 2025
Google lanserer ny Gemini 2.5 Flash-Lite-modell

Google DeepMind har i dag annonsert betydelige utvidelser av Gemini 2.5-familien, og avduket de stabile utgivelsene av Gemini 2.5 Pro og Gemini 2.5 Flash, samt en forhåndsvisning av den helt nye Gemini 2.5 Flash-Lite-modellen. Disse oppdateringene gjenspeiler Googles fortsatte forpliktelse til å tilby et spekter av AI-modeller som balanserer kostnad, hastighet og ytelse for ulike arbeidsbelastninger.

Stabile utgivelser: Gemini 2.5 Pro og Flash

  1. juni 2025 annonserte Google at Gemini 2.5 Pro og Gemini 2.5 Flash var generell tilgjengelige. Pro-varianten leverer maksimal resonneringskraft og er skreddersydd for oppgaver med høy kompleksitet, som avansert kodegenerering, vitenskapelig analyse og storskala datasyntese. I motsetning til dette tilbyr Gemini 2.5 Flash et mellomnivåalternativ optimalisert for daglig bruk som krever lav latens – ideelt for chatboter, oppsummering og innholdsproduksjon i stor skala.

Oversikt: Tre modeller i Gemini-2.5-familien

ModellstatusSterkeIdeelle brukstilfeller
Gemini 2.5 Flash-Lite (forhåndsvisning)ForhåndsvisningRaskest og billigst; multimodal; kontrollerbar resonnering; verktøyaktivertOppgaver med høyt volum som chatboter, oppsummeringer og søk
Gemini 2.5 FlashStabilBalansert: lav latens, god resonnering, multimodalSamtaler i sanntid, kundestøtte
Gemini 2.5 ProStabilMest kapabel: dyp resonnering, stor kontekst, multimodalForskning, kompleks koding, vitenskapelige oppgaver

Google lanserer ny Gemini 2.5 Flash-Lite-modell

Gemini 2.5 Flash-Lite: Forhåndsvisning av høydepunkter

Ultralav latens og kostnadsbesparelserUtviklet for sanntidsapplikasjoner med høyt volum, som oversettelse, klassifisering og oppsummering. Har raskere inferens og lavere kostnad per samtale sammenlignet med både 2.0 Flash-Lite og fullversjonen av Flash.

Forbedret grunnleggende ytelseOvergår tidligere Flash-Lite-modeller på tvers av referansepunkter innen kodegenerering, logikk, matematikk, multimodal resonnering og naturfag.

Kostnad og effektivitetFlash-Lite-priser (forhåndsvisning): ~$0.10 per 1 million input-tokener og ~$0.40 per 1 million output-tokener – betydelig billigere enn Flash ($0.30/$2.50) og Pro ($1.25/$10).

Full Gemini -2.5-funksjoner:

  • Kontrollerbar tenkningBrukere kan angi «tenkebudsjetter» (tokengrenser) for å bytte hastighet mot dybde – Flash-Lite kan slå dette på etter behov.
  • Multimodal inngangStøtter tekst, bilde, lyd og video (inkludert timeslange klipp), med mulighet for å analysere diagrammer, brukergrensesnitt, scener og hendelsessammendrag.
  • VerktøyintegrasjonInkluderer Google-søk, kodeutførelse og et kontekstvindu med millioner av tokens, som matcher funksjonene til Flash og Pro.

Posisjonering på pris-ytelseskurven

Google plasserer Flash-Lites høye hastighet og lave kostnad som den beste Pareto grense, som betyr at den er blant de mest kostnadseffektive, men likevel kapable modellene i verden (). I sammenlignende evalueringer, Flash-Lite representerer den beste verdien: smart, men rimelig.


Om Flash og Pro

  • Gemini 2.5 FlashStabil, multimodal tenkemodell med lav latens. Plassert under Pro, men omtrent på nivå med GPT-4o i kapasitet, med overlegen hastighet og kostnadseffektivitet ().
  • Gemini 2.5 ProGoogles mest avanserte modell. Kjent for å håndtere timevis lang video/lyd, kompleks kode og matematikk, og resonnering med stor kontekst. Introduserer også selektive «tenkebudsjetter» og forbedret kodekvalitet for å fungere som en langsiktig stabil flaggskip-AI.

Implementering og priser

  • TilgjengelighetAlle tre modellene er tilgjengelige via Google AI Studio, Google Cloud Vertex AI, og Gemini-appen .
  • Kostnadsstruktur (Vertex AI-priser fra 16. juni 2025):
  • pro1.25 USD/1 mill. input, 10 USD/1 mill. output (høyere enn 200 XNUMX tokens)
  • Blitz: $0.15/1M input, $3.50/1M output i «tenkemodus» – og inkluderer 1,500 gratis jordede prompter daglig ()
  • Flash-Lite (forhåndsvisning): ~$0.10/$0.40 per 1 million tokens

Komme i gang

CometAPI tilbyr et enhetlig REST-grensesnitt som samler hundrevis av AI-modeller – under et konsistent endepunkt, med innebygd API-nøkkeladministrasjon, brukskvoter og faktureringsdashboards. I stedet for å sjonglere flere leverandør-URL-er og legitimasjonsinformasjon.

Utviklere har tilgang Gemini 2.5 Flash-Lite (forhåndsversjon) API gjennom CometAPI, de nyeste modellene som er oppført er per artikkelens publiseringsdato. For å begynne, utforsk modellens muligheter i lekeplass og konsulter API-veiledning for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og fått API-nøkkelen. CometAPI tilby en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med å integrere.

Les mer

500+ modeller i ett API

Opptil 20 % rabatt