Gemini 2.5 Flash er konstruert for å levere raske svar uten å gå på bekostning av kvaliteten på resultatene. Den støtter multimodale inndata, inkludert tekst, bilder, lyd og video, noe som gjør den egnet for et bredt spekter av bruksområder. Modellen er tilgjengelig via plattformer som Google AI Studio og Vertex AI, og gir utviklere verktøyene som trengs for sømløs integrasjon i ulike systemer.
Gemini 2.5 Flash introduserer flere fremtredende funksjoner som skiller den fra resten av Gemini 2.5-familien:
Gemini 2.5 Flash har gjennomgått følgende viktige versjoner:
Fra juli 2025 er Gemini 2.5 Flash nå offentlig tilgjengelig og stabil (ingen endringer fra gemini-2.5-flash-preview-05-20). Hvis du bruker gemini-2.5-flash-preview-04-17, vil eksisterende forhåndsvisningspriser fortsette frem til den planlagte avviklingen av modellendepunktet 15. juli 2025, når det blir stengt. Du kan migrere til den generelt tilgjengelige modellen "gemini-2.5-flash".
Raskere, billigere, smartere:
Inndatavindu for kontekst: Opptil 1 million tokens, som muliggjør omfattende kontekstbevaring.
Utgående tokens: Kan generere opptil 8,192 tokens per svar.
Støttede modaliteter: Tekst, bilder, lyd og video.
Integrasjonsplattformer: Tilgjengelig via Google AI Studio og Vertex AI.
Prising: Konkurransedyktig token-basert prismodell som muliggjør kostnadseffektiv utrulling.
Under panseret er Gemini 2.5 Flash en transformer-basert stor språkmodell trent på en blanding av nett-, kode-, bilde- og videodata. Viktige tekniske spesifikasjoner inkluderer:
Multimodal opplæring: Trenet til å samordne flere modaliteter; Flash kan sømløst blande tekst med bilder, video eller lyd, nyttig for oppgaver som videosammendrag eller lydteksting.
Dynamisk tankeprosess: Implementerer en intern resoneringssløyfe der modellen planlegger og bryter ned komplekse prompter før endelig output.
Konfigurerbare tenkebudsjetter: thinking_budget kan settes fra 0 (ingen resonnering) opp til 24,576 tokens, som muliggjør avveininger mellom ventetid og svarkvalitet.
Verktøyintegrasjon: Støtter Grounding with Google Search, Code Execution, URL Context og Function Calling, som muliggjør reelle handlinger direkte fra naturlige språkforespørsler.
I strenge evalueringer demonstrerer Gemini 2.5 Flash bransjeledende ytelse:
Disse resultatene indikerer Gemini 2.5 Flashs konkurransefortrinn innen resonnering, vitenskapelig forståelse, matematisk problemløsing, koding, visuell tolkning og flerspråklige evner:

Selv om den er kraftig, har Gemini 2.5 Flash noen begrensninger:
| Komet-pris (USD / M Tokens) | Offisiell pris (USD / M Tokens) |
|---|---|
Inndata:$0.24/M Utdata:$2.00/M | Inndata:$0.30/M Utdata:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)