ModellenPrijzenOnderneming
500+ AI Model API, Alles In Één API. Gewoon In CometAPI
Modellen API
Ontwikkelaar
Snelle StartDocumentatieAPI Dashboard
Bedrijf
Over onsOnderneming
Bronnen
AI-modellenBlogWijzigingslogboekOndersteuning
ServicevoorwaardenPrivacybeleid
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Invoer:$0.24/M
Uitvoer:$2/M
Context:1M
Max Uitvoer:65K
Gemini 2.5 Flash is een door Google ontwikkeld AI-model, ontworpen om snelle en kosteneffectieve oplossingen te bieden voor ontwikkelaars, vooral voor toepassingen die verbeterde inferentiecapaciteiten vereisen. Volgens de preview-aankondiging van Gemini 2.5 Flash werd het model op 17 april 2025 in preview uitgebracht, ondersteunt het multimodale invoer en heeft het een contextvenster van 1 miljoen tokens. Dit model ondersteunt een maximale contextlengte van 65,536 tokens.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API
Versies

Gemini 2.5 Flash is ontworpen om snelle reacties te leveren zonder concessies te doen aan de uitvoerkwaliteit. Het ondersteunt multimodale invoer, waaronder tekst, afbeeldingen, audio en video, waardoor het geschikt is voor uiteenlopende toepassingen. Het model is toegankelijk via platforms als Google AI Studio en Vertex AI, en biedt ontwikkelaars de tools die nodig zijn voor naadloze integratie in diverse systemen.


Basisinformatie (functies)

Gemini 2.5 Flash introduceert een reeks opvallende functies die het onderscheiden binnen de Gemini 2.5-familie:

  • Hybride redenering: Ontwikkelaars kunnen een thinking_budget-parameter instellen om fijnmazig te bepalen hoeveel tokens het model aan interne redenering besteedt voordat het output geeft.
  • Paretofrontier: Gepositioneerd op het optimale kosten-prestatiepunt biedt Flash de beste prijs-tot-intelligentie-verhouding onder de 2.5-modellen.
  • Multimodale ondersteuning: Verwerkt tekst, afbeeldingen, video en audio native, wat rijkere gesprekservaringen en analytische mogelijkheden mogelijk maakt.
  • Context van 1 miljoen tokens: Ongeëvenaarde contextlengte maakt diepgaande analyse en begrip van lange documenten in één verzoek mogelijk.

Modelversies

Gemini 2.5 Flash is door de volgende belangrijke versies gegaan:

  • gemini-2.5-flash-lite-preview-09-2025: Verbeterde toolbruikbaarheid: Betere prestaties op complexe taken met meerdere stappen, met een toename van 5% in SWE-Bench Verified-scores (van 48.9% naar 54%). Verbeterde efficiëntie: Bij het inschakelen van redenering wordt met minder tokens een hogere outputkwaliteit bereikt, waardoor latentie en kosten dalen.
  • Preview 04-17: Vroege toegang-release met “thinking”-mogelijkheid, beschikbaar via gemini-2.5-flash-preview-04-17.
  • Stable General Availability (GA): Sinds 17 juni 2025 vervangt het stabiele eindpunt gemini-2.5-flash de preview, met betrouwbaarheid op productieniveau en geen API-wijzigingen ten opzichte van de preview van 20 mei.
  • Uitfasering van preview: Preview-eindpunten stonden gepland om op 15 juli 2025 te worden uitgeschakeld; gebruikers moeten vóór deze datum migreren naar het GA-eindpunt.

Per juli 2025 is Gemini 2.5 Flash nu publiek beschikbaar en stabiel (geen wijzigingen ten opzichte van gemini-2.5-flash-preview-05-20). Als u gemini-2.5-flash-preview-04-17 gebruikt, blijft de bestaande preview-prijsstelling gelden tot de geplande uitfasering van het model-eindpunt op 15 juli 2025, wanneer het wordt uitgeschakeld. U kunt migreren naar het algemeen beschikbare model "gemini-2.5-flash".

Sneller, goedkoper, slimmer:

  • Ontwerpdoelen: lage latentie + hoge doorvoer + lage kosten;
  • Algehele versnelling in redenering, multimodale verwerking en taken met lange tekst;
  • Tokengebruik is met 20–30% verminderd, wat de kosten van redenering aanzienlijk verlaagt.

Technische specificaties

Contextvenster voor invoer: Tot 1 miljoen tokens, waarmee uitgebreide contextbehoud mogelijk is.

Uitvoertokens: Kan tot 8,192 tokens per antwoord genereren.

Ondersteunde modaliteiten: Tekst, afbeeldingen, audio en video.

Integratieplatforms: Beschikbaar via Google AI Studio en Vertex AI.

Prijsstelling: Concurrerend, op tokens gebaseerd prijsmodel, wat kosteneffectieve implementatie faciliteert.


Technische details

Onder de motorkap is Gemini 2.5 Flash een transformergebaseerd groot taalmodel, getraind op een mix van web-, code-, beeld- en videogegevens. Belangrijke technische specificaties zijn:

Multimodale training: Getraind om meerdere modaliteiten op elkaar af te stemmen; Flash kan naadloos tekst combineren met afbeeldingen, video of audio, nuttig voor taken zoals videosamenvatting of audiobeschrijving.

Dynamisch denkproces: Implementeert een interne redeneringslus waarbij het model plant en complexe prompts opbreekt voordat het de uiteindelijke output geeft.

Configureerbare denkbudgetten: De thinking_budget kan worden ingesteld van 0 (geen redenering) tot 24,576 tokens, waardoor afwegingen tussen latentie en antwoordkwaliteit mogelijk zijn.

Toolintegratie: Ondersteunt Grounding with Google Search, Code Execution, URL Context en Function Calling, waardoor acties in de echte wereld direct vanuit natuurlijke taalprompts mogelijk worden.


Benchmarkprestaties

In rigoureuze evaluaties laat Gemini 2.5 Flash toonaangevende prestaties zien:

  • LMArena Hard Prompts: Scoorde tweede na 2.5 Pro op de veeleisende Hard Prompts-benchmark en toont sterke meerstapsredeneercapaciteiten.
  • MMLU-score van 0.809: Overtreft gemiddelde modelprestaties met een 0.809 MMLU-nauwkeurigheid, wat wijst op brede domeinkennis en redeneringsvermogen.
  • Latentie en doorvoer: Behaalt 271.4 tokens/sec decodersnelheid met een 0.29 s Time-to-First-Token, ideaal voor latentiegevoelige workloads.
  • Leider in prijs-prestatie: Met \$0.26/1 M tokens is Flash goedkoper dan veel concurrenten, terwijl het hen evenaart of overtreft op belangrijke benchmarks.

Deze resultaten duiden op het concurrentievoordeel van Gemini 2.5 Flash in redenering, wetenschappelijk begrip, wiskundig probleemoplossen, coderen, visuele interpretatie en meertalige capaciteiten:


Beperkingen

Hoewel krachtig, kent Gemini 2.5 Flash bepaalde beperkingen:

  • Veiligheidsrisico’s: Het model kan een “preachy” toon aannemen en plausibel klinkende maar onjuiste of bevooroordeelde outputs produceren (hallucinaties), vooral bij randgevallen. Strikte menselijke controle blijft essentieel.
  • Ratelimieten: API-gebruik wordt beperkt door ratelimieten (10 RPM, 250,000 TPM, 250 RPD on default tiers), wat batchverwerking of toepassingen met hoog volume kan beïnvloeden.
  • Intelligentiedrempel: Hoewel uitzonderlijk capabel voor een flash-model, is het minder accuraat dan 2.5 Pro bij de meest veeleisende agent-gestuurde taken zoals geavanceerd coderen of coördinatie tussen meerdere agents.
  • Kostenafwegingen: Hoewel het de beste prijs-prestatie biedt, verhoogt uitgebreid gebruik van de thinking-modus de totale tokenconsumptie, wat de kosten voor diep redenerende prompts verhoogt.

Functies voor Gemini 2.5 Flash

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Gemini 2.5 Flash, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Gemini 2.5 Flash这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Gemini 2.5 Flash, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Gemini 2.5 Flash

Ontdek concurrerende prijzen voor Gemini 2.5 Flash, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Gemini 2.5 Flash uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Voorbeeldcode en API voor Gemini 2.5 Flash

Gemini 2.5 Flash API is het nieuwste multimodale AI-model van Google, ontworpen voor snelle en kostenefficiënte taken, met instelbare redeneercapaciteiten, waardoor ontwikkelaars geavanceerde redeneerfuncties via de Gemini API kunnen in- of uitschakelen.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Versies van Gemini 2.5 Flash

De reden waarom Gemini 2.5 Flash meerdere snapshots heeft, kan mogelijke factoren omvatten zoals variaties in de uitvoer na updates die oudere snapshots vereisen voor consistentie, het bieden van een overgangsperiode voor ontwikkelaars om zich aan te passen en te migreren, en verschillende snapshots die overeenkomen met wereldwijde of regionale eindpunten om de gebruikerservaring te optimaliseren. Voor gedetailleerde verschillen tussen versies, raadpleeg de officiële documentatie.
version
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-thinking
gemini-2.5-flash-all
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-image-preview
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17

Meer modellen

C

Claude Opus 4.7

Invoer:$3/M
Uitvoer:$15/M
Het intelligentste model voor agenten en coderen
A

Claude Sonnet 4.6

Invoer:$2.4/M
Uitvoer:$12/M
Claude Sonnet 4.6 is ons meest capabele Sonnet-model tot nu toe. Het is een volledige upgrade van de vaardigheden van het model op het gebied van coderen, computergebruik, redeneren met lange context, agentplanning, kenniswerk en ontwerp. Sonnet 4.6 biedt daarnaast een contextvenster van 1M tokens in bèta.
O

GPT 5.5 Pro

Invoer:$24/M
Uitvoer:$144/M
Een geavanceerd model, ontworpen voor uiterst complexe logica en professionele vereisten, dat de hoogste standaard op het gebied van diepgaand redeneervermogen en nauwkeurige analytische capaciteiten vertegenwoordigt.
O

GPT 5.5

Invoer:$4/M
Uitvoer:$24/M
Een multimodaal vlaggenschipmodel van de volgende generatie dat uitzonderlijke prestaties combineert met een efficiënte respons, toegewijd aan het leveren van uitgebreide en stabiele algemene AI-diensten.
O

GPT Image 2 ALL

Per Verzoek:$0.04
GPT Image 2 is het state-of-the-art beeldgeneratiemodel van openai voor snelle, hoogwaardige beeldgeneratie en -bewerking. Het ondersteunt flexibele afbeeldingsafmetingen en hogetrouwe beeldinvoer.
O

GPT 5.5 ALL

Invoer:$4/M
Uitvoer:$24/M
GPT-5.5 blinkt uit in het schrijven van code, online onderzoek, data-analyse en tooloverschrijdende operaties. Het model vergroot niet alleen zijn autonomie bij het uitvoeren van complexe meerstapstaken, maar verbetert ook de redeneercapaciteiten en de uitvoeringsefficiëntie aanzienlijk, terwijl het dezelfde latentie behoudt als zijn voorganger, wat een belangrijke stap markeert richting geautomatiseerde kantoorautomatisering binnen AI.

Gerelateerde blogs

Nano Banana 2 Flash Binnenkort beschikbaar – De razendsnelle evolutie van AI-beeldgeneratie
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Binnenkort beschikbaar – De razendsnelle evolutie van AI-beeldgeneratie

Google heeft opnieuw het landschap van generatieve AI opgeschud met de Nano Banana 2 Flash, binnenkort beschikbaar, de nieuwste toevoeging aan zijn alom geprezen "Nano Banana"-familie voor beeldgeneratie. Na het enorme succes van Nano Banana Pro (Gemini 3 Pro Image) eind vorig jaar belooft deze nieuwe iteratie beeldsynthese van professionele kwaliteit te democratiseren door de grensverleggende intelligentie van de Gemini 3-architectuur te combineren met ongekende snelheid en efficiëntie.
Nano Banana-kortingen: echt geld besparen in 2026 voor ontwikkelaars
Dec 25, 2025
nano-banana-pro

Nano Banana-kortingen: echt geld besparen in 2026 voor ontwikkelaars

Kortom: de officiële Nano Banana API biedt geen kortingen voor Kerstmis, Nieuwjaar of andere feestdagen. Dit is een feit dat alle ontwikkelaars die in 2026 van plan zijn Nano Banana (inclusief Nano Banana Pro) te gebruiken voor beeldgeneratie, contentcreatie of productintegratie, moeten begrijpen. Google biedt geen seizoenskortingen voor de Nano Banana API, of het nu om Kerstmis, Black Friday of Nieuwjaar gaat. Het prijssysteem van de officiële API is consequent stabiel en transparant, met vrijwel geen ruimte voor kortingen. Dus de vraag is: als je een ontwikkelaar bent en van plan bent om tijdens Kerstmis of Nieuwjaar grootschalige beeldgeneratie, modeltesten of productiteratie uit te voeren, is er dan een manier om de kosten van het gebruik van Nano Banana te verlagen?
Werkt de gratis Gemini 2.5 Pro-API niet? Wijzigingen in het gratis quotum in 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Werkt de gratis Gemini 2.5 Pro-API niet? Wijzigingen in het gratis quotum in 2025

Google heeft het gratis niveau van de Gemini API fors ingeperkt: Gemini 2.5 Pro is uit het gratis niveau verwijderd en het aantal dagelijkse gratis aanvragen van Gemini 2.5 Flash is drastisch verlaagd (berichten: ~250 → ~20/dag). Dat betekent niet dat het model definitief “dood” is voor experimenten — maar het betekent wel dat de gratis toegang voor veel praktijktoepassingen in feite is uitgehold.
Ultieme gids voor Nano-Banana: hoe te gebruiken en tips voor het beste resultaat
Sep 8, 2025
gemini-2-5-flash-image

Ultieme gids voor Nano-Banana: hoe te gebruiken en tips voor het beste resultaat

De recente release van Gemini 2.5 Flash Image door Google, bijgenaamd “Nano-Banana”, is snel de go-to geworden voor het bewerken van conversatiefoto’s: het behoudt gelijkenissen
Hoe gebruik je Nano Banana via API? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

Hoe gebruik je Nano Banana via API? (Gemini-2-5-flash-image)

Nano Banana is de community-bijnaam (en interne afkorting) voor Google's Gemini 2.5 Flash Image — een multimodale beeldgeneratie van hoge kwaliteit met lage latentie +