Gemini 2.5 Flash is ontworpen om snelle reacties te leveren zonder concessies te doen aan de uitvoerkwaliteit. Het ondersteunt multimodale invoer, waaronder tekst, afbeeldingen, audio en video, waardoor het geschikt is voor uiteenlopende toepassingen. Het model is toegankelijk via platforms als Google AI Studio en Vertex AI, en biedt ontwikkelaars de tools die nodig zijn voor naadloze integratie in diverse systemen.

Basisinformatie (functies)

Gemini 2.5 Flash introduceert een reeks opvallende functies die het onderscheiden binnen de Gemini 2.5-familie:

Hybride redenering: Ontwikkelaars kunnen een thinking_budget-parameter instellen om fijnmazig te bepalen hoeveel tokens het model aan interne redenering besteedt voordat het output geeft.
Paretofrontier: Gepositioneerd op het optimale kosten-prestatiepunt biedt Flash de beste prijs-tot-intelligentie-verhouding onder de 2.5-modellen.
Multimodale ondersteuning: Verwerkt tekst, afbeeldingen, video en audio native, wat rijkere gesprekservaringen en analytische mogelijkheden mogelijk maakt.
Context van 1 miljoen tokens: Ongeëvenaarde contextlengte maakt diepgaande analyse en begrip van lange documenten in één verzoek mogelijk.

Modelversies

Gemini 2.5 Flash is door de volgende belangrijke versies gegaan:

gemini-2.5-flash-lite-preview-09-2025: Verbeterde toolbruikbaarheid: Betere prestaties op complexe taken met meerdere stappen, met een toename van 5% in SWE-Bench Verified-scores (van 48.9% naar 54%). Verbeterde efficiëntie: Bij het inschakelen van redenering wordt met minder tokens een hogere outputkwaliteit bereikt, waardoor latentie en kosten dalen.
Preview 04-17: Vroege toegang-release met “thinking”-mogelijkheid, beschikbaar via gemini-2.5-flash-preview-04-17.
Stable General Availability (GA): Sinds 17 juni 2025 vervangt het stabiele eindpunt gemini-2.5-flash de preview, met betrouwbaarheid op productieniveau en geen API-wijzigingen ten opzichte van de preview van 20 mei.
Uitfasering van preview: Preview-eindpunten stonden gepland om op 15 juli 2025 te worden uitgeschakeld; gebruikers moeten vóór deze datum migreren naar het GA-eindpunt.

Per juli 2025 is Gemini 2.5 Flash nu publiek beschikbaar en stabiel (geen wijzigingen ten opzichte van gemini-2.5-flash-preview-05-20). Als u gemini-2.5-flash-preview-04-17 gebruikt, blijft de bestaande preview-prijsstelling gelden tot de geplande uitfasering van het model-eindpunt op 15 juli 2025, wanneer het wordt uitgeschakeld. U kunt migreren naar het algemeen beschikbare model "gemini-2.5-flash".

Sneller, goedkoper, slimmer:

Ontwerpdoelen: lage latentie + hoge doorvoer + lage kosten;
Algehele versnelling in redenering, multimodale verwerking en taken met lange tekst;
Tokengebruik is met 20–30% verminderd, wat de kosten van redenering aanzienlijk verlaagt.

Technische specificaties

Contextvenster voor invoer: Tot 1 miljoen tokens, waarmee uitgebreide contextbehoud mogelijk is.

Uitvoertokens: Kan tot 8,192 tokens per antwoord genereren.

Ondersteunde modaliteiten: Tekst, afbeeldingen, audio en video.

Integratieplatforms: Beschikbaar via Google AI Studio en Vertex AI.

Prijsstelling: Concurrerend, op tokens gebaseerd prijsmodel, wat kosteneffectieve implementatie faciliteert.

Technische details

Onder de motorkap is Gemini 2.5 Flash een transformergebaseerd groot taalmodel, getraind op een mix van web-, code-, beeld- en videogegevens. Belangrijke technische specificaties zijn:

Multimodale training: Getraind om meerdere modaliteiten op elkaar af te stemmen; Flash kan naadloos tekst combineren met afbeeldingen, video of audio, nuttig voor taken zoals videosamenvatting of audiobeschrijving.

Dynamisch denkproces: Implementeert een interne redeneringslus waarbij het model plant en complexe prompts opbreekt voordat het de uiteindelijke output geeft.

Configureerbare denkbudgetten: De thinking_budget kan worden ingesteld van 0 (geen redenering) tot 24,576 tokens, waardoor afwegingen tussen latentie en antwoordkwaliteit mogelijk zijn.

Toolintegratie: Ondersteunt Grounding with Google Search, Code Execution, URL Context en Function Calling, waardoor acties in de echte wereld direct vanuit natuurlijke taalprompts mogelijk worden.

Benchmarkprestaties

In rigoureuze evaluaties laat Gemini 2.5 Flash toonaangevende prestaties zien:

LMArena Hard Prompts: Scoorde tweede na 2.5 Pro op de veeleisende Hard Prompts-benchmark en toont sterke meerstapsredeneercapaciteiten.
MMLU-score van 0.809: Overtreft gemiddelde modelprestaties met een 0.809 MMLU-nauwkeurigheid, wat wijst op brede domeinkennis en redeneringsvermogen.
Latentie en doorvoer: Behaalt 271.4 tokens/sec decodersnelheid met een 0.29 s Time-to-First-Token, ideaal voor latentiegevoelige workloads.
Leider in prijs-prestatie: Met \$0.26/1 M tokens is Flash goedkoper dan veel concurrenten, terwijl het hen evenaart of overtreft op belangrijke benchmarks.

Deze resultaten duiden op het concurrentievoordeel van Gemini 2.5 Flash in redenering, wetenschappelijk begrip, wiskundig probleemoplossen, coderen, visuele interpretatie en meertalige capaciteiten:

Beperkingen

Hoewel krachtig, kent Gemini 2.5 Flash bepaalde beperkingen:

Veiligheidsrisico’s: Het model kan een “preachy” toon aannemen en plausibel klinkende maar onjuiste of bevooroordeelde outputs produceren (hallucinaties), vooral bij randgevallen. Strikte menselijke controle blijft essentieel.
Ratelimieten: API-gebruik wordt beperkt door ratelimieten (10 RPM, 250,000 TPM, 250 RPD on default tiers), wat batchverwerking of toepassingen met hoog volume kan beïnvloeden.
Intelligentiedrempel: Hoewel uitzonderlijk capabel voor een flash-model, is het minder accuraat dan 2.5 Pro bij de meest veeleisende agent-gestuurde taken zoals geavanceerd coderen of coördinatie tussen meerdere agents.
Kostenafwegingen: Hoewel het de beste prijs-prestatie biedt, verhoogt uitgebreid gebruik van de thinking-modus de totale tokenconsumptie, wat de kosten voor diep redenerende prompts verhoogt.

Functies voor Gemini 2.5 Flash

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意： 1. 保持格式和特殊字符（如{} 变量占位符） 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本，不要添加解释 6. 不要添加任何前缀或说明原文是： "Explore the key features of Gemini 2.5 Flash, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本，需要翻译成荷兰语。我需要保持Gemini 2.5 Flash这个占位符不变。让我翻译： - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译： Ontdek de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次，可能需要调整一下： Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Gemini 2.5 Flash

Ontdek concurrerende prijzen voor Gemini 2.5 Flash, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Gemini 2.5 Flash uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.

gemini-2.5-flash (same price across variants)

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-2.5-flash	gemini-2.5-flash-thinking	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash-all	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash	$0.24	$2.00

Voorbeeldcode en API voor Gemini 2.5 Flash

Gemini 2.5 Flash API is het nieuwste multimodale AI-model van Google, ontworpen voor snelle en kostenefficiënte taken, met instelbare redeneercapaciteiten, waardoor ontwikkelaars geavanceerde redeneerfuncties via de Gemini API kunnen in- of uitschakelen.

Python
JavaScript
Curl

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Versies van Gemini 2.5 Flash

De reden waarom Gemini 2.5 Flash meerdere snapshots heeft, kan mogelijke factoren omvatten zoals variaties in de uitvoer na updates die oudere snapshots vereisen voor consistentie, het bieden van een overgangsperiode voor ontwikkelaars om zich aan te passen en te migreren, en verschillende snapshots die overeenkomen met wereldwijde of regionale eindpunten om de gebruikerservaring te optimaliseren. Voor gedetailleerde verschillen tussen versies, raadpleeg de officiële documentatie.

version
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-thinking
gemini-2.5-flash-all
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-image-preview
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17