Gemini 2.5 Flash er udviklet til at levere hurtige svar uden at gå på kompromis med outputkvaliteten. Den understøtter multimodale input, herunder tekst, billeder, lyd og video, hvilket gør den egnet til mange forskellige anvendelser. Modellen er tilgængelig via platforme som Google AI Studio og Vertex AI og giver udviklere de nødvendige værktøjer til problemfri integration i forskellige systemer.

Grundlæggende oplysninger (Funktioner)

Gemini 2.5 Flash introducerer flere markante funktioner, der adskiller den inden for Gemini 2.5-familien:

Hybrid ræsonnering: Udviklere kan angive en thinking_budget-parameter for præcist at styre, hvor mange tokens modellen bruger på intern ræsonnering før output.
Pareto-fronten: Positioneret på det optimale omkostnings-ydelsespunkt tilbyder Flash det bedste pris-til-intelligens-forhold blandt 2.5-modellerne.
Multimodal understøttelse: Behandler tekst, billeder, video og lyd nativt og muliggør mere righoldig samtale og analyse.
Kontekst på 1 million tokens: Enestående kontekstlængde, der muliggør dyb analyse og forståelse af lange dokumenter i én anmodning.

Modelversionering

Gemini 2.5 Flash har gennemgået følgende vigtige versioner:

gemini-2.5-flash-lite-preview-09-2025: Forbedret værktøjsanvendelighed: Bedre performance på komplekse opgaver i flere trin, med en 5% stigning i SWE-Bench Verified-scorer (fra 48.9% til 54%). Forbedret effektivitet: Ved aktivering af reasoning opnås output af højere kvalitet med færre tokens, hvilket reducerer latenstid og omkostninger.
Preview 04-17: Tidlig adgangsudgivelse med “thinking”-kapabilitet, tilgængelig via gemini-2.5-flash-preview-04-17.
Stabil General Availability (GA): Fra den 17. juni 2025 erstatter det stabile endpoint gemini-2.5-flash previewet og sikrer produktionsklar pålidelighed uden API-ændringer i forhold til previewet fra 20. maj.
Udfasning af Preview: Preview-endpoints var planlagt til nedlukning den 15. juli 2025; brugere skal migrere til GA-endpointet før denne dato.

Fra juli 2025 er Gemini 2.5 Flash nu offentligt tilgængelig og stabil (ingen ændringer fra gemini-2.5-flash-preview-05-20). Hvis du bruger gemini-2.5-flash-preview-04-17, fortsætter den eksisterende preview-prisfastsættelse indtil den planlagte udfasning af model-endpointet den 15. juli 2025, hvor det bliver lukket. Du kan migrere til den generelt tilgængelige model "gemini-2.5-flash".

Hurtigere, billigere, mere intelligent:

Designmål: lav latenstid + høj gennemstrømning + lave omkostninger;
Generel hastighedsforbedring i ræsonnering, multimodal behandling og lange tekstopgaver;
Tokenforbrug reduceres med 20–30%, hvilket markant sænker omkostningerne ved ræsonnering.

Tekniske specifikationer

Input-kontekstvindue: Op til 1 million tokens, hvilket muliggør omfattende kontekstbevarelse.

Output-tokens: I stand til at generere op til 8,192 tokens pr. svar.

Understøttede modaliteter: Tekst, billeder, lyd og video.

Integrationsplatforme: Tilgængelig via Google AI Studio og Vertex AI.

Prisfastsættelse: Konkurrencedygtig token-baseret prismodel, der faciliterer omkostningseffektiv implementering.

Tekniske detaljer

Under motorhjelmen er Gemini 2.5 Flash en transformer-baseret stor sprogmodel trænet på en blanding af web-, kode-, billede- og videodata. Centrale tekniske specifikationer omfatter:

Multimodal træning: Trænet til at tilpasse flere modaliteter; Flash kan problemfrit blande tekst med billeder, video eller lyd, nyttigt til opgaver som videosummering eller lydundertekster.

Dynamisk tænkeproces: Implementerer en intern ræsonneringssløjfe, hvor modellen planlægger og nedbryder komplekse prompts før endeligt output.

Konfigurerbare tænke-budgetter: thinking_budget kan indstilles fra 0 (ingen ræsonnering) op til 24,576 tokens, hvilket muliggør afvejninger mellem latenstid og svar-kvalitet.

Værktøjsintegration: Understøtter Grounding with Google Search, Code Execution, URL Context og Function Calling, hvilket muliggør realverdenshandlinger direkte fra naturlige sprog-prompts.

Benchmark-ydelse

I strenge evalueringer demonstrerer Gemini 2.5 Flash branchens førende performance:

LMArena Hard Prompts: Scorerede kun overgået af 2.5 Pro på den krævende Hard Prompts-benchmark og viste stærke evner i flertrinsræsonnering.
MMLU-score på 0.809: Overgår gennemsnitlig modelperformance med 0.809 MMLU-nøjagtighed, hvilket afspejler bred domæneviden og ræsonneringsstyrke.
Latenstid og gennemstrømning: Opnår 271.4 tokens/sec dekoderhastighed med 0.29 s Time-to-First-Token, hvilket gør den ideel til latenstidsfølsomme arbejdsbelastninger.
Førende på pris-ydelsesforhold: Ved \$0.26/1 M tokens underbyder Flash mange konkurrenter, samtidig med at den matcher eller overgår dem på centrale benchmarks.

Disse resultater indikerer Gemini 2.5 Flashs konkurrencemæssige fordel inden for ræsonnering, videnskabelig forståelse, matematisk problemløsning, kodning, visuel fortolkning og flersproglige kapaciteter:

Begrænsninger

Selvom den er kraftfuld, har Gemini 2.5 Flash visse begrænsninger:

Sikkerhedsrisici: Modellen kan udvise en “prædikende” tone og kan producere plausibelt klingende, men forkerte eller biased outputs (hallucinationer), især ved edge-case-forespørgsler. Omhyggeligt menneskeligt tilsyn er fortsat essentielt.
Rate limits: API-brug er begrænset af rate limits (10 RPM, 250,000 TPM, 250 RPD) på standardniveauer, hvilket kan påvirke batchbehandling eller højvolumenapplikationer.
Intelligens-niveau: Selvom den er usædvanligt kapabel for en flash-model, er den mindre præcis end 2.5 Pro på de mest krævende agentiske opgaver som avanceret kodning eller multi-agent-koordinering.
Omkostningsafvejninger: Selvom den tilbyder det bedste pris-ydelsesforhold, øger omfattende brug af thinking-tilstand det samlede tokenforbrug og dermed omkostningerne ved dybt ræsonnerende prompts.

Priser for Gemini 2.5 Flash

Udforsk konkurrencedygtige priser for Gemini 2.5 Flash, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Gemini 2.5 Flash kan forbedre dine projekter, mens omkostningerne holdes håndterbare.

gemini-2.5-flash (same price across variants)

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-2.5-flash	gemini-2.5-flash-thinking	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash-all	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash	$0.24	$2.00

Eksempelkode og API til Gemini 2.5 Flash

Gemini 2.5 Flash API er Googles nyeste multimodale AI-model, designet til højhastigheds- og omkostningseffektive opgaver med kontrollerbare ræsonneringsevner, som gør det muligt for udviklere at slå avancerede "thinking"-funktioner til eller fra via Gemini API'et.

Python
JavaScript
Curl

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Versioner af Gemini 2.5 Flash

Årsagen til, at Gemini 2.5 Flash har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.

version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-image-preview
gemini-2.5-flash-thinking
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-thinking