Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Invoer:$0.24/M
Uitvoer:$2/M
Context:1M
Max Uitvoer:65K
Gemini 2.5 Flash is een door Google ontwikkeld AI-model, ontworpen om snelle en kosteneffectieve oplossingen te bieden voor ontwikkelaars, vooral voor toepassingen die verbeterde inferentiecapaciteiten vereisen. Volgens de preview-aankondiging van Gemini 2.5 Flash werd het model op 17 april 2025 in preview uitgebracht, ondersteunt het multimodale invoer en heeft het een contextvenster van 1 miljoen tokens. Dit model ondersteunt een maximale contextlengte van 65,536 tokens.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API
Versies

Gemini 2.5 Flash is ontworpen om snelle respons te leveren zonder in te boeten aan outputkwaliteit. Het ondersteunt multimodale input, waaronder tekst, afbeeldingen, audio en video, waardoor het geschikt is voor uiteenlopende toepassingen. Het model is toegankelijk via platforms zoals Google AI Studio en Vertex AI, en biedt ontwikkelaars de tools die nodig zijn voor naadloze integratie in diverse systemen.


Basisinformatie (Functies)

Gemini 2.5 Flash introduceert verschillende opvallende functies die het onderscheiden binnen de Gemini 2.5-familie:

  • Hybride redenering: Ontwikkelaars kunnen een thinking_budget-parameter instellen om precies te bepalen hoeveel tokens het model besteedt aan interne redenering vóór de output.
  • Paretofront: Gepositioneerd op het optimale prijs-prestatiepunt biedt Flash de beste verhouding tussen prijs en intelligentie binnen de 2.5-modellen.
  • Multimodale ondersteuning: Verwerkt native tekst, afbeeldingen, video en audio, wat rijkere conversatie- en analysecapaciteiten mogelijk maakt.
  • Contextvenster van 1 miljoen tokens: Ongeëvenaarde contextlengte maakt diepgaande analyse en begrip van lange documenten in één aanvraag mogelijk.

Versiebeheer van het model

Gemini 2.5 Flash heeft de volgende belangrijke versies doorlopen:

  • gemini-2.5-flash-lite-preview-09-2025: Verbeterde bruikbaarheid van tools: betere prestaties op complexe, meerstappige taken, met een stijging van 5% in SWE-Bench Verified-scores (van 48,9% naar 54%). Verbeterde efficiëntie: bij ingeschakelde reasoning wordt met minder tokens een hogere outputkwaliteit bereikt, wat latentie en kosten verlaagt.
  • Preview 04-17: Vroege toegang met “thinking”-capaciteit, beschikbaar via gemini-2.5-flash-preview-04-17.
  • Stabiele algemene beschikbaarheid (GA): Sinds 17 juni 2025 vervangt het stabiele endpoint gemini-2.5-flash de preview, met productierijpe betrouwbaarheid en zonder API-wijzigingen ten opzichte van de preview van 20 mei.
  • Uitfasering van preview: Preview-endpoints stonden gepland voor uitschakeling op 15 juli 2025; gebruikers moeten vóór deze datum migreren naar het GA-endpoint.

Per juli 2025 is Gemini 2.5 Flash nu publiek beschikbaar en stabiel (geen wijzigingen ten opzichte van de gemini-2.5-flash-preview-05-20). Als u gemini-2.5-flash-preview-04-17 gebruikt, blijft de bestaande preview-prijsstelling van kracht tot de geplande uitfasering van het model-endpoint op 15 juli 2025, wanneer het wordt uitgeschakeld. U kunt migreren naar het algemeen beschikbare model "gemini-2.5-flash".

Sneller, goedkoper, slimmer:

  • Ontwerpdoelen: lage latentie + hoge doorvoer + lage kosten;
  • Algehele versnelling bij redeneren, multimodale verwerking en taken met lange teksten;
  • Het tokenverbruik is met 20–30% verlaagd, waardoor de kosten voor reasoning significant dalen.

Technische specificaties

Contextvenster voor invoer: Tot 1 miljoen tokens, waardoor uitgebreide contextretentie mogelijk is.

Uitvoertokens: Kan tot 8.192 tokens per respons genereren.

Ondersteunde modaliteiten: Tekst, afbeeldingen, audio en video.

Integratieplatforms: Beschikbaar via Google AI Studio en Vertex AI.

Prijzen: Concurrerend, op tokens gebaseerd prijsmodel, wat kostenefficiënte uitrol faciliteert.


Technische details

Onder de motorkap is Gemini 2.5 Flash een transformergebaseerd groot taalmodel, getraind op een mix van web-, code-, beeld- en videodata. Belangrijke technische specificaties zijn onder meer:

Multimodale training: Getraind om meerdere modaliteiten te aligneren; Flash kan naadloos tekst combineren met afbeeldingen, video of audio, nuttig voor taken zoals videosamenvatting of audiobeschrijving.

Dynamisch denkproces: Implementeert een interne redeneringslus waarbij het model plant en complexe prompts opsplitst vóór de uiteindelijke output.

Configureerbare denkbudgetten: Het thinking_budget kan worden ingesteld van 0 (geen reasoning) tot 24,576 tokens, waarmee u kunt afwegen tussen latentie en antwoordkwaliteit.

Tool-integratie: Ondersteunt Grounding with Google Search, Code Execution, URL Context en Function Calling, zodat echte acties direct vanuit natuurlijke taalprompts mogelijk zijn.


Benchmarkprestaties

In strenge evaluaties toont Gemini 2.5 Flash toonaangevende prestaties:

  • LMArena Hard Prompts: Scoorde na 2.5 Pro de hoogste op de veeleisende Hard Prompts-benchmark, wat sterke meerstapsredeneercapaciteiten laat zien.
  • MMLU-score van 0.809: Overtreft het gemiddelde modelprestatieniveau met een 0.809 MMLU-nauwkeurigheid, wat de brede domeinkennis en redeneervaardigheid weerspiegelt.
  • Latentie en doorvoer: Bereikt een decodesnelheid van 271.4 tokens/sec met een 0.29 s Time-to-First-Token, ideaal voor latency-gevoelige workloads.
  • Leider in prijs-prestatie: Met $0.26/1 M tokens is Flash goedkoper dan veel concurrenten, terwijl het op kernbenchmarks evenaart of beter presteert.

Deze resultaten duiden op het concurrentievoordeel van Gemini 2.5 Flash in redeneren, wetenschappelijk begrip, wiskundig probleemoplossen, coderen, visuele interpretatie en meertalige capaciteiten:

Gemini 2.5 Flash


Beperkingen

Hoewel krachtig, kent Gemini 2.5 Flash bepaalde beperkingen:

  • Veiligheidsrisico’s: Het model kan een moraliserende toon aannemen en plausibel klinkende maar onjuiste of bevooroordeelde outputs produceren (hallucinaties), vooral bij randgevallen. Strikte menselijke beoordeling blijft essentieel.
  • Ratelimieten: API-gebruik is begrensd door limieten (10 RPM, 250,000 TPM, 250 RPD in standaardtiers), wat batchverwerking of toepassingen met hoog volume kan beïnvloeden.
  • Ondergrens qua intelligentie: Hoewel uitzonderlijk capabel voor een flash-model, is het minder nauwkeurig dan 2.5 Pro bij de meest veeleisende agentische taken zoals geavanceerd coderen of multi-agentcoördinatie.
  • Kostentrade-offs: Hoewel het de beste prijs-prestatie biedt, verhoogt intensief gebruik van de thinking-modus het totale tokenverbruik, waardoor de kosten voor diep redenerende prompts stijgen.

Functies voor Gemini 2.5 Flash

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Gemini 2.5 Flash, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Gemini 2.5 Flash这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Gemini 2.5 Flash

Ontdek concurrerende prijzen voor Gemini 2.5 Flash, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Gemini 2.5 Flash uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Voorbeeldcode en API voor Gemini 2.5 Flash

Gemini 2.5 Flash API is het nieuwste multimodale AI-model van Google, ontworpen voor snelle, kostenefficiënte taken, met instelbare redeneermogelijkheden, waardoor ontwikkelaars geavanceerde 'thinking'-functies via de Gemini API kunnen in- of uitschakelen.
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Versies van Gemini 2.5 Flash

De reden waarom Gemini 2.5 Flash meerdere snapshots heeft, kan mogelijke factoren omvatten zoals variaties in de uitvoer na updates die oudere snapshots vereisen voor consistentie, het bieden van een overgangsperiode voor ontwikkelaars om zich aan te passen en te migreren, en verschillende snapshots die overeenkomen met wereldwijde of regionale eindpunten om de gebruikerservaring te optimaliseren. Voor gedetailleerde verschillen tussen versies, raadpleeg de officiële documentatie.
version
gemini-2.5-flash-all
gemini-2.5-flash-image
gemini-2.5-flash-preview-04-17
gemini-2.5-flash
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-deepsearch
gemini-2.5-flash-image-preview
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-preview-05-20-thinking
gemini-2.5-flash-thinking

Meer modellen