ModellerStøtteBedriftBlogg
500+ AI-modell API, Alt I Én API. Bare I CometAPI
Modeller API
Utvikler
HurtigstartDokumentasjonAPI Dashbord
Ressurser
AI-modellerBloggBedriftEndringsloggOm oss
2025 CometAPI. Alle rettigheter reservert.PersonvernerklæringTjenestevilkår
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Inndata:$0.08/M
Utdata:$0.32/M
Kontekst:1M
Maks utdata:65K
En optimalisert Gemini 2.5 Flash-modell for høy kostnadseffektivitet og høy gjennomstrømning. Den minste og mest kostnadseffektive modellen, bygget for bruk i stor skala.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API
Versjoner

Tekniske detaljer

  • Adaptiv resonnering: Gemini 2.5 Flash-Lite støtter tenkning ved behov, slik at utviklere kan tildele datakraft bare når dypere resonnering er nødvendig.
  • Verktøyintegrasjoner: Full kompatibilitet med Gemini 2.5s innebygde verktøy, inkludert Grounding with Google Search, Code Execution, URL Context og Function Calling for sømløse multimodale arbeidsflyter.
  • Model Context Protocol (MCP): Utnytter Googles MCP for å hente sanntidsdata fra nettet, og sikrer at svarene er oppdaterte og kontekstuelt relevante.
  • Distribusjonsalternativer: Tilgjengelig gjennom CometAPI, Gemini API, Vertex AI og Google AI Studio, med et forhåndsvisningsspor for tidlige brukere som vil eksperimentere og gi tilbakemeldinger.

Referanseytelse for Gemini 2.5 Flash-Lite

  • Forsinkelse (latency): Oppnår opptil 50% lavere median svartider sammenlignet med Gemini 2.5 Flash, med typisk under 100 ms latens på standard klassifiserings- og oppsummeringsbenchmarker.
  • Gjennomstrømning: Optimalisert for høyvolums arbeidsbelastninger, opprettholder titusenvis av forespørsler per minutt uten ytelsesforringelse.
  • Pris-ytelse: Viser 25% reduksjon i kostnad per 1,000 tokens sammenlignet med Flash-motstykket, og er dermed det Pareto-optimale valget for kostnadssensitive utrullinger.
  • Bransjeadopsjon: Tidlige brukere rapporterer sømløs integrasjon i produksjonspipelines, med ytelsesmetricer som samsvarer med eller overgår de første prognosene.

Gemini 2.5 Flash Lite


Ideelle bruksområder

  • Høyfrekvente, lavkompleksitetsoppgaver: Automatisk merking, sentimentanalyse og masseoversettelse
  • Kostnadssensitive pipeliner: Datauttrekk fra store dokumentkorpora, periodisk batch-oppsummering
  • Edge- og mobilsituasjoner: Når latens er kritisk, men ressursbudsjettene er begrenset

Begrensninger ved Gemini 2.5 Flash-Lite

  • Forhåndsvisningsstatus: Kan gjennomgå API-endringer før GA; integrasjoner bør ta høyde for mulige versjonsøkninger.
  • Ingen finjustering underveis: Kan ikke laste opp egendefinerte vekter; stol på prompt engineering og systemmeldinger.
  • Redusert kreativitet: Tunet for deterministiske oppgaver med høy gjennomstrømning; mindre egnet for åpen generering eller «kreativ» skriving.
  • Ressurstak: Skalerer lineært bare opp til ~16 vCPUs; utover dette avtar gjennomstrømningsgevinstene.
  • Multimodale begrensninger: Støtter bilde-/lydinndata, men med begrenset kvalitet; ikke ideelt for tunge visjons- eller lydtranskripsjonsoppgaver.
  • Avveiing for kontekstvindu: Selv om det aksepterer opptil 1 M tokens, kan praktisk inferens i den skalaen gi redusert gjennomstrømning.

Funksjoner for Gemini 2.5 Flash Lite

Utforsk nøkkelfunksjonene til Gemini 2.5 Flash Lite, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for Gemini 2.5 Flash Lite

Utforsk konkurransedyktige priser for Gemini 2.5 Flash Lite, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Gemini 2.5 Flash Lite kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Eksempelkode og API for Gemini 2.5 Flash Lite

Få tilgang til omfattende eksempelkode og API-ressurser for Gemini 2.5 Flash Lite for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til Gemini 2.5 Flash Lite i prosjektene dine.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versjoner av Gemini 2.5 Flash Lite

Grunnen til at Gemini 2.5 Flash Lite har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
version
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking

Flere modeller

A

Claude Opus 4.6

Inndata:$4/M
Utdata:$20/M
Claude Opus 4.6 er en stor språkmodell i «Opus»-klassen fra Anthropic, lansert i februar 2026. Den er posisjonert som en arbeidshest for arbeidsflyter innen kunnskapsarbeid og forskning — med forbedringer i resonnering over lange kontekster, flertrinns planlegging, verktøybruk (inkludert agentbaserte programvarearbeidsflyter) og oppgaver på datamaskin, som automatisk generering av lysbilder og regneark.
A

Claude Sonnet 4.6

Inndata:$2.4/M
Utdata:$12/M
Claude Sonnet 4.6 er vår mest kapable Sonnet-modell hittil. Det er en fullstendig oppgradering av modellens ferdigheter innen koding, bruk av datamaskin, resonnering over lange kontekster, agentplanlegging, kunnskapsarbeid og design. Sonnet 4.6 har også et kontekstvindu på 1M token i beta.
O

GPT-5.4 nano

Inndata:$0.16/M
Utdata:$1/M
GPT-5.4 nano er utviklet for oppgaver der hastighet og kostnader er viktigst, som klassifisering, datauttrekk, rangering og underagenter.
O

GPT-5.4 mini

Inndata:$0.6/M
Utdata:$3.6/M
GPT-5.4 mini bringer styrkene fra GPT-5.4 til en raskere, mer effektiv modell, designet for arbeidslaster i stor skala.
A

Claude Mythos Preview

A

Claude Mythos Preview

Kommer snart
Inndata:$60/M
Utdata:$240/M
Claude Mythos Preview er vår mest kapable frontier-modell til dags dato, og viser et markant sprang i resultater på mange evalueringsbenchmarker sammenlignet med vår forrige frontier-modell, Claude Opus 4.6.
X

mimo-v2-pro

Inndata:$0.8/M
Utdata:$2.4/M
MiMo-V2-Pro er Xiaomis flaggskip-grunnmodell, med over 1T totale parametere og en kontekstlengde på 1M, dypt optimalisert for agentiske scenarier. Den er svært tilpasningsdyktig til generelle agentrammeverk som OpenClaw. Den rangerer blant den globale toppklassen i standardbenchmarkene PinchBench og ClawBench, med opplevd ytelse som nærmer seg Opus 4.6. MiMo-V2-Pro er utformet for å fungere som hjernen i agentsystemer, orkestrere komplekse arbeidsflyter, drive produksjonsnære ingeniøroppgaver og levere resultater pålitelig.

Relaterte blogger

Er Free Gemini 2.5 Pro API nede? Endringer i gratiskvoten i 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Er Free Gemini 2.5 Pro API nede? Endringer i gratiskvoten i 2025

Google har kraftig strammet inn gratisnivået for Gemini API: Gemini 2.5 Pro er fjernet fra gratisnivået, og de daglige gratisforespørslene for Gemini 2.5 Flash ble kraftig redusert (rapporter: ~250 → ~20/dag). Det betyr ikke at modellen er permanent "død" for eksperimentering — men det betyr at gratis tilgang i praksis er blitt sterkt redusert for mange reelle brukstilfeller.