ModellerSupportVirksomhedBlog
500+ AI Model API, Alt I Én API. Kun I CometAPI
Modeller API
Udvikler
Hurtig StartDokumentationAPI Dashboard
Ressourcer
AI-modellerBlogVirksomhedÆndringslogOm os
2025 CometAPI. Alle rettigheder forbeholdes.PrivatlivspolitikServicevilkår
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Indtast:$0.08/M
Output:$0.32/M
Kontekst:1M
Maks Output:65K
En optimeret Gemini 2.5 Flash-model med høj omkostningseffektivitet og højt gennemløb. Den mindste, mest omkostningseffektive model, bygget til brug i stor skala.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API
Versioner

Tekniske detaljer

  • Adaptiv ræsonnering: Gemini 2.5 Flash-Lite understøtter tænkning efter behov, så udviklere kun allokerer beregningsressourcer, når dybere ræsonnering er påkrævet.
  • Integration med værktøjer: Fuld kompatibilitet med Gemini 2.5's native værktøjer, inklusive Grounding with Google Search, Code Execution, URL Context og Function Calling til sømløse multimodale arbejdsgange.
  • Model Context Protocol (MCP): Udnytter Googles MCP til at hente webdata i realtid og sikrer, at svar er opdaterede og kontekstuelt relevante.
  • Implementeringsmuligheder: Tilgængelig via CometAPI, Gemini API, Vertex AI og Google AI Studio, med en preview-kanal for tidlige brugere til at eksperimentere og give feedback.

Benchmark-ydeevne for Gemini 2.5 Flash-Lite

  • Latens: Opnår op til 50 % lavere medianresponstider sammenlignet med Gemini 2.5 Flash, med typisk latens under 100 ms på standardklassifikations- og opsummeringsbenchmarks.
  • Gennemløb: Optimeret til højvolumen-arbejdsbelastninger og kan opretholde titusindvis af forespørgsler pr. minut uden forringelse af ydeevnen.
  • Pris-ydelse: Viser en 25 % reduktion i omkostning pr. 1,000 tokens sammenlignet med Flash-varianten, hvilket gør den til et pareto-optimalt valg for omkostningsfølsomme implementeringer.
  • Brancheadoption: Tidlige brugere rapporterer problemfri integration i produktionspipelines, med ydeevnemålinger der matcher eller overgår de oprindelige fremskrivninger.

Gemini 2.5 Flash Lite


Ideelle anvendelsestilfælde

  • Højfrekvente opgaver med lav kompleksitet: Automatiseret tagging, sentimentanalyse og masseoversættelse
  • Omkostningsfølsomme pipelines: Dataudtræk fra store dokumentkorpora, periodisk batch-opsummering
  • Edge- og mobile scenarier: Når latens er kritisk, men ressourcebudgettet er begrænset

Begrænsninger for Gemini 2.5 Flash-Lite

  • Preview-status: Kan undergå API-ændringer før GA; integrationer bør tage højde for mulige versionsændringer.
  • Ingen on-the-fly finjustering: Kan ikke uploade brugerdefinerede vægte; basér dig på prompt engineering og systemmeddelelser.
  • Reduceret kreativitet: Tuneret til deterministiske opgaver med høj gennemløbskapacitet; mindre egnet til åbne genereringsopgaver eller “kreativ” skrivning.
  • Ressourceloft: Skalerer lineært kun op til ~16 vCPU'er; derudover aftager gennemløbsgevinster.
  • Multimodale begrænsninger: Understøtter billede-/lydinput men med begrænset fidelitet; ikke ideel til tunge visions- eller lydtransskriptionsopgaver.
  • Trade-off for kontekstvindue: Selvom den accepterer op til 1 M tokens, kan praktisk inferens i den skala medføre reduceret gennemløb.

Funktioner til Gemini 2.5 Flash Lite

Udforsk de vigtigste funktioner i Gemini 2.5 Flash Lite, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for Gemini 2.5 Flash Lite

Udforsk konkurrencedygtige priser for Gemini 2.5 Flash Lite, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Gemini 2.5 Flash Lite kan forbedre dine projekter, mens omkostningerne holdes håndterbare.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Eksempelkode og API til Gemini 2.5 Flash Lite

Få adgang til omfattende eksempelkode og API-ressourcer for Gemini 2.5 Flash Lite for at strømline din integrationsproces. Vores detaljerede dokumentation giver trin-for-trin vejledning, der hjælper dig med at udnytte det fulde potentiale af Gemini 2.5 Flash Lite i dine projekter.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versioner af Gemini 2.5 Flash Lite

Årsagen til, at Gemini 2.5 Flash Lite har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

Flere modeller

A

Claude Opus 4.6

Indtast:$4/M
Output:$20/M
Claude Opus 4.6 er Anthropic’s "Opus"-klasse store sprogmodel, lanceret i februar 2026. Den er positioneret som en arbejdshest til vidensarbejde og forskningsarbejdsgange — med forbedret langkontekstuel ræsonnering, flertrinsplanlægning, brug af værktøjer (herunder agent-baserede softwarearbejdsgange) og computeropgaver såsom automatiseret generering af slides og regneark.
A

Claude Sonnet 4.6

Indtast:$2.4/M
Output:$12/M
Claude Sonnet 4.6 er vores hidtil mest kapable Sonnet-model. Det er en fuld opgradering af modellens færdigheder på tværs af kodning, computerbrug, langkontekstlig ræsonnering, agentplanlægning, vidensarbejde og design. Sonnet 4.6 har også et kontekstvindue på 1M tokens i beta.
O

GPT-5.4 nano

Indtast:$0.16/M
Output:$1/M
GPT-5.4 nano er designet til opgaver, hvor hastighed og omkostninger er vigtigst, såsom klassificering, dataudtræk, rangering og subagenter.
O

GPT-5.4 mini

Indtast:$0.6/M
Output:$3.6/M
GPT-5.4 mini samler styrkerne fra GPT-5.4 i en hurtigere og mere effektiv model, der er designet til arbejdsbelastninger i stor skala.
A

Claude Mythos Preview

A

Claude Mythos Preview

Kommer snart
Indtast:$60/M
Output:$240/M
Claude Mythos Preview er vores hidtil mest kapable frontier-model og viser et markant spring i resultaterne på tværs af mange benchmark-tests sammenlignet med vores tidligere frontier-model, Claude Opus 4.6.
X

mimo-v2-pro

Indtast:$0.8/M
Output:$2.4/M
MiMo-V2-Pro er Xiaomis flagskibs-grundmodel med over 1T samlede parametre og en kontekstlængde på 1M, dybt optimeret til agentbaserede scenarier. Den er meget tilpasningsdygtig til generelle agent-rammeværk som OpenClaw. Den placerer sig blandt den globale top i de standardiserede PinchBench- og ClawBench-benchmarks, med en oplevet ydeevne, der nærmer sig Opus 4.6. MiMo-V2-Pro er designet til at fungere som hjernen i agent-systemer, orkestrere komplekse arbejdsgange, håndtere produktionsingeniøropgaver og levere pålidelige resultater.

Relaterede blogs

Er den gratis Gemini 2.5 Pro API nede? Ændringer i den gratis kvote i 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Er den gratis Gemini 2.5 Pro API nede? Ændringer i den gratis kvote i 2025

Google har markant strammet det gratis niveau for Gemini API: Gemini 2.5 Pro er blevet fjernet fra det gratis niveau, og Gemini 2.5 Flashs daglige gratis anmodninger er blevet skåret dramatisk ned (rapporter: ~250 → ~20/dag). Det betyder ikke, at modellen er permanent “død” til eksperimenter — men det betyder, at gratis adgang reelt er blevet udhulet for mange reelle brugsscenarier.