ModelleSupportUnternehmenBlog
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Ressourcen
KI-ModelleBlogUnternehmenÄnderungsprotokollÜber uns
2025 CometAPI. Alle Rechte vorbehalten.DatenschutzrichtlinieNutzungsbedingungen
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Eingabe:$0.08/M
Ausgabe:$0.32/M
Kontext:1M
Maximale Ausgabe:65K
Ein optimiertes Gemini 2.5 Flash-Modell für hohe Kosteneffizienz und hohen Durchsatz. Das kleinste und kosteneffizienteste Modell, entwickelt für den Einsatz im großen Maßstab.
Neu
Kommerzielle Nutzung
Playground
Überblick
Funktionen
Preisgestaltung
API
Versionen

Technische Details

  • Adaptives Reasonieren: Gemini 2.5 Flash-Lite unterstützt bedarfsorientiertes Denken, sodass Entwickler Rechenressourcen nur dann zuweisen, wenn tieferes Denken erforderlich ist.
  • Tool-Integrationen: Volle Kompatibilität mit den nativen Tools von Gemini 2.5, darunter Grounding with Google Search, Code Execution, URL Context und Function Calling für nahtlose multimodale Workflows.
  • Model Context Protocol (MCP): Nutzt Googles MCP, um Webdaten in Echtzeit abzurufen, sodass Antworten aktuell und kontextuell relevant sind.
  • Bereitstellungsoptionen: Verfügbar über die CometAPI, Gemini API, Vertex AI und Google AI Studio, mit einem Preview-Track für Early Adopters zum Experimentieren und Feedback geben .

Benchmark-Leistung von Gemini 2.5 Flash-Lite

  • Latenz: Erzielt bis zu 50% niedrigere mediane Antwortzeiten im Vergleich zu Gemini 2.5 Flash, mit typischen unter 100 ms Latenzen auf Standardbenchmarks für Klassifikation und Zusammenfassung.
  • Durchsatz: Optimiert für hochvolumige Workloads und verarbeitet Zehntausende Anfragen pro Minute ohne Leistungsabfall.
  • Preis-Leistung: Weist 25% geringere Kosten pro 1.000 Tokens gegenüber dem Flash-Gegenstück auf und ist damit die Pareto-optimale Wahl für kostensensitive Deployments.
  • Branchenadoption: Frühe Nutzer berichten von nahtloser Integration in Produktions-Pipelines, wobei die Leistungskennzahlen den anfänglichen Prognosen entsprechen oder diese übertreffen .

Gemini 2.5 Flash Lite


Ideale Anwendungsfälle

  • Hochfrequente, gering komplexe Aufgaben: Automatisches Tagging, Sentiment-Analyse und Massenübersetzung
  • Kostensensitive Pipelines: Datenextraktion aus großen Dokumentenkorpora, periodische Batch-Zusammenfassungen
  • Edge- und Mobile-Szenarien: Wenn Latenz kritisch ist, aber Ressourcenbudgets begrenzt sind

Einschränkungen von Gemini 2.5 Flash-Lite

  • Preview-Status: Vor GA sind API-Änderungen möglich; Integrationen sollten mögliche Versionssprünge einkalkulieren.
  • Kein Fine-Tuning on the fly: Benutzerdefinierte Gewichte können nicht hochgeladen werden; es wird auf Prompt Engineering und Systemnachrichten zurückgegriffen.
  • Reduzierte Kreativität: Abgestimmt auf deterministische Aufgaben mit hohem Durchsatz; weniger geeignet für offene Generierung oder „kreatives“ Schreiben.
  • Ressourcengrenze: Skaliert linear nur bis ~16 vCPUs; darüber hinaus nehmen Durchsatzgewinne ab.
  • Multimodale Einschränkungen: Unterstützt Bild-/Audioeingaben, jedoch mit begrenzter Genauigkeit; nicht ideal für umfangreiche Vision- oder Audiotranskriptionsaufgaben.
  • Kontextfenster-Trade-off : Obwohl bis zu 1 M Tokens akzeptiert werden, kann die praktische Inferenz in dieser Größenordnung einen verringerten Durchsatz aufweisen.

Funktionen für Gemini 2.5 Flash Lite

Entdecken Sie die wichtigsten Funktionen von Gemini 2.5 Flash Lite, die darauf ausgelegt sind, Leistung und Benutzerfreundlichkeit zu verbessern. Erfahren Sie, wie diese Fähigkeiten Ihren Projekten zugutekommen und die Benutzererfahrung verbessern können.

Preise für Gemini 2.5 Flash Lite

Entdecken Sie wettbewerbsfähige Preise für Gemini 2.5 Flash Lite, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Gemini 2.5 Flash Lite Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Beispielcode und API für Gemini 2.5 Flash Lite

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Gemini 2.5 Flash Lite zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Gemini 2.5 Flash Lite in Ihren Projekten zu nutzen.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versionen von Gemini 2.5 Flash Lite

Der Grund, warum Gemini 2.5 Flash Lite mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.
version
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite

Weitere Modelle

A

Claude Opus 4.6

Eingabe:$4/M
Ausgabe:$20/M
Claude Opus 4.6 ist das Großsprachmodell der „Opus“-Klasse von Anthropic, veröffentlicht im Februar 2026. Es ist als Arbeitstier für Wissensarbeit und Forschungs-Workflows positioniert — mit Verbesserungen beim langkontextuellen Denken, bei der mehrstufigen Planung, bei der Tool-Nutzung (einschließlich agentenbasierter Software-Workflows) sowie bei computerbezogenen Aufgaben wie der automatisierten Erstellung von Folien und Tabellen.
A

Claude Sonnet 4.6

Eingabe:$2.4/M
Ausgabe:$12/M
Claude Sonnet 4.6 ist unser bisher leistungsfähigstes Sonnet-Modell. Es ist ein umfassendes Upgrade der Fähigkeiten des Modells in den Bereichen Programmierung, Computernutzung, Schlussfolgern mit langem Kontext, Agentenplanung, Wissensarbeit und Design. Sonnet 4.6 bietet außerdem ein 1M-Token-Kontextfenster in Beta.
O

GPT-5.4 nano

Eingabe:$0.16/M
Ausgabe:$1/M
GPT-5.4 nano ist für Aufgaben konzipiert, bei denen Geschwindigkeit und Kosten am wichtigsten sind, wie Klassifizierung, Datenextraktion, Ranking und Sub-Agenten.
O

GPT-5.4 mini

Eingabe:$0.6/M
Ausgabe:$3.6/M
GPT-5.4 mini bringt die Stärken von GPT-5.4 in ein schnelleres, effizienteres Modell, das für hochvolumige Workloads konzipiert ist.
A

Claude Mythos Preview

A

Claude Mythos Preview

Demnächst verfügbar
Eingabe:$60/M
Ausgabe:$240/M
Claude Mythos Preview ist unser bisher leistungsfähigstes Frontier-Modell und zeigt einen bemerkenswerten Sprung bei den Ergebnissen in vielen Evaluations-Benchmarks im Vergleich zu unserem vorherigen Frontier-Modell, Claude Opus 4.6.
X

mimo-v2-pro

Eingabe:$0.8/M
Ausgabe:$2.4/M
MiMo-V2-Pro ist Xiaomis Flaggschiff unter den Foundation-Modellen und verfügt über insgesamt mehr als 1T Parameter sowie eine Kontextlänge von 1M. Es ist umfassend für agentische Szenarien optimiert. Es ist in hohem Maße an allgemeine Agent-Frameworks wie OpenClaw anpassbar. In den Standard-Benchmarks PinchBench und ClawBench zählt es weltweit zur Spitzengruppe, wobei die wahrgenommene Leistung an die von Opus 4.6 heranreicht. MiMo-V2-Pro wurde als Gehirn von Agentensystemen konzipiert, um komplexe Workflows zu orchestrieren, produktionsnahe Engineering-Aufgaben voranzutreiben und zuverlässig Ergebnisse zu liefern.

Verwandte Blogs

Ist die kostenlose Gemini 2.5 Pro API defekt? Änderungen am Freikontingent im Jahr 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Ist die kostenlose Gemini 2.5 Pro API defekt? Änderungen am Freikontingent im Jahr 2025

Google hat die kostenlose Stufe für die Gemini API deutlich verschärft: Gemini 2.5 Pro wurde aus der kostenlosen Stufe entfernt, und die täglichen kostenlosen Anfragen für Gemini 2.5 Flash wurden drastisch gekürzt (Berichte: ~250 → ~20/Tag). Das bedeutet nicht, dass das Modell für Experimente dauerhaft „tot“ ist — aber es bedeutet, dass der kostenlose Zugang für viele reale Anwendungsfälle faktisch ausgehöhlt wurde.