Google lancerer ny Gemini 2.5 Flash-Lite-model

CometAPI
AnnaJun 17, 2025
Google lancerer ny Gemini 2.5 Flash-Lite-model

Google DeepMind har i dag annonceret betydelige udvidelser af sin Gemini 2.5-familie og afsløret de stabile versioner af Gemini 2.5 Pro og Gemini 2.5 Flash samt en forhåndsvisning af den helt nye Gemini 2.5 Flash-Lite-model. Disse opdateringer afspejler Googles fortsatte engagement i at tilbyde et spektrum af AI-modeller, der balancerer omkostninger, hastighed og ydeevne til forskellige arbejdsbyrder.

Stabile udgivelser: Gemini 2.5 Pro & Flash

Den 17. juni 2025 annoncerede Google den generelle tilgængelighed af Gemini 2.5 Pro og Gemini 2.5 Flash. Pro-varianten leverer maksimal ræsonnementskraft og er skræddersyet til højkomplekse opgaver såsom avanceret kodegenerering, videnskabelig analyse og storstilet datasyntese. I modsætning hertil tilbyder Gemini 2.5 Flash en mellemklasse-løsning, der er optimeret til daglig brug, der kræver lav latenstid – ideel til chatbots, opsummering og indholdsoprettelse i stor skala.

Oversigt: Tre modeller i Gemini -2.5-familien

ModelStatusStyrkerIdeel brugssager
Gemini 2.5 Flash-Lite (forhåndsvisning)EksempelHurtigst og billigst; multimodal; kontrollerbar ræsonnement; værktøjsaktiveretOpgaver med høj volumen som chatbots, opsummeringer og søgning
Gemini 2.5 FlashStabilBalanceret: lav latenstid, god ræsonnement, multimodalSamtaler i realtid, kundesupport
Gemini 2.5 ProStabilMest kapabel: dybdegående ræsonnement, omfattende kontekst, multimodalResearch, kompleks kodning, videnskabelige opgaver

Google lancerer ny Gemini 2.5 Flash-Lite-model

Gemini 2.5 Flash-Lite: Forhåndsvisning af højdepunkter

Ultralav latenstid og omkostningsbesparelserDesignet til realtidsapplikationer med høj volumen, såsom oversættelse, klassificering og opsummering. Har hurtigere inferens og lavere omkostninger pr. opkald sammenlignet med både 2.0 Flash-Lite og den fulde Flash-version.

Forbedret grundlæggende ydeevneOvergår tidligere Flash-Lite-modeller på tværs af benchmarks inden for kodegenerering, logik, matematik, multimodal ræsonnement og naturvidenskab.

Omkostninger og effektivitetFlash-Lite-priser (forhåndsvisning): ~$0.10 pr. 1 million input-tokens og ~$0.40 pr. 1 million output-tokens – betydeligt billigere end Flash ($0.30/$2.50) og Pro ($1.25/$10).

Fuld Gemini -2.5-funktioner:

  • Kontrollerbar tænkningBrugere kan indstille "tænkebudgetter" (tokengrænser) for at bytte hastighed for dybde – Flash-Lite kan slå dette til efter behov.
  • Multimodal inputUnderstøtter tekst, billede, lyd og video (inklusive timelange klip) med mulighed for at analysere diagrammer, brugergrænseflade, scener og hændelsesresuméer.
  • VærktøjsintegrationInkluderer Google-søgning, kodeudførelse og et kontekstvindue med millioner af tokens, der matcher funktionerne i Flash og Pro.

Positionering på pris-ydelseskurven

Google placerer Flash-Lites høje hastighed og lave pris som den bedste Pareto grænse, hvilket betyder, at den er blandt de mest omkostningseffektive, men alligevel effektive modeller på verdensplan (). I sammenlignende evalueringer, Flash-Lite repræsenterer den bedste værdi: smart, men alligevel overkommelig.


Om Flash og Pro

  • Gemini 2.5 FlashStabil, multimodal tænkemodel med lav latenstid. Placeret under Pro, men nogenlunde på niveau med GPT-4o i kapacitet, med overlegen hastighed og omkostningseffektivitet ().
  • Gemini 2.5 ProGoogles mest avancerede model. Kendt for at håndtere timevis lang video/lyd, kompleks kode og matematik samt ræsonnement med omfattende kontekster. Introducerer også selektive "tænkningsbudgetter" og forbedret kodekvalitet for at fungere som en langsigtet stabil flagskibs-AI.

Implementering og prisfastsættelse

  • tilgængelighedAlle tre modeller er tilgængelige via Google AI Studio, Google Cloud Vertex AI, og Gemini app .
  • Omkostningsstruktur (Vertex AI-priser fra 16. juni 2025):
  • om1.25 USD/1 mio. input, 10 USD/1 mio. output (højere end 200 tokens)
  • Blink: $0.15/1M input, $3.50/1M output i "tænketilstand" - og inkluderer 1,500 gratis jordbaserede prompts dagligt ()
  • Flash-Lite (forhåndsvisning): ~$0.10/$0.40 pr. 1 million tokens

Kom godt i gang

CometAPI leverer en samlet REST-grænseflade, der samler hundredvis af AI-modeller – under et ensartet slutpunkt med indbygget API-nøglestyring, brugskvoter og faktureringsdashboards. I stedet for at jonglere med flere leverandør-URL'er og legitimationsoplysninger.

Udviklere kan få adgang Gemini 2.5 Flash-Lite (forhåndsvisning) API ved CometAPI, de nyeste modeller, der er anført, er fra artiklens udgivelsesdato. For at begynde, skal du udforske modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.

Læs mere

500+ modeller i én API

Op til 20% rabat