ModellePreiseUnternehmen
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Unternehmen
Über unsUnternehmen
Ressourcen
KI-ModelleBlogÄnderungsprotokollSupport
NutzungsbedingungenDatenschutzrichtlinie
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Eingabe:$0.4/M
Ausgabe:$2.4/M
Kontext:1,048,576
Maximale Ausgabe:65.5k
Gemini 3 Flash ist ein leichtgewichtiges, effizientes, multimodales Großmodell von Google, das für reale Szenarien konzipiert ist, die schnelle Antworten und geringe Latenz erfordern.
Neu
Kommerzielle Nutzung
Playground
Überblick
Funktionen
Preisgestaltung
API
Versionen

Was ist Gemini 3 flash

„Gemini 3 Flash“ ist das Flash/schnelle Mitglied der Gemini-3-Familie: eine leichtere, latenzärmere, kosteneffiziente Variante von Googles Gemini-3-Modellen, die für Anwendungen mit hohem Durchsatz, Echtzeit-Anforderungen und Sensibilität für Skalierung gedacht ist. Eine Variante der Gemini-API-Modellfamilie, mit der Entwickler über die API von CometAPI (gleiche API-Oberfläche wie bei anderen Gemini-Modellen) ein latenzarmes, kostenoptimiertes Gemini-3-Style-Modell aufrufen können. Sie bietet die gleichen multimodalen Eingaben und Werkzeuge für strukturierte Ausgaben, priorisiert jedoch Inferenzgeschwindigkeit und Durchsatz.

Hauptfunktionen:

  • Niedrige Latenz / hoher Durchsatz: abgestimmt auf schnelle Antworten und Kosteneffizienz (Flash-Designziel).
  • Unterstützung multimodaler Eingaben: Text, Bilder, Videoclips und Audio in vielen Flash-Varianten (die API-Modelleinträge listen pro Variante unterstützte Eingabetypen).
  • Function Calling & strukturierte Ausgaben: Erzwingung von JSON/strukturierten Ausgaben zur Integration mit Tools und Agenten.
  • Agent-/Tooling-Unterstützung: Integration mit Google Search Grounding, Function/Tool Calling und Agent-Frameworks im Gemini-Ökosystem.

Wie sich Gemini 3 Flash von anderen Modellen unterscheidet

  • Im Vergleich zu Gemini-3 Pro (gleiche Familie): Flash = auf Geschwindigkeit/Kosten optimiert; Pro = höhere Reasoning-Fähigkeiten, multimodale Treue und Deep Think. Wählen Sie Flash für Echtzeit-UIs; Pro für genauigkeitskritische Aufgaben.
  • Im Vergleich zu vorherigem Gemini (2.5 Flash): Die Gemini-3-Familie verbessert Reasoning und multimodale Leistung; das Flash-Designziel zielt weiterhin auf Preis/Leistung. Wenn Sie derzeit 2.5 Flash verwenden, soll Gemini-3 Fast/Flash bei ähnlicher Latenz/Kosten eine bessere Qualität liefern.

Praktische Anwendungsfälle (wo Flash punktet)

  • Echtzeit-Chatbots & Sprachagenten: niedrige Latenz für konversationelle UIs und Streaming-Audio-Anwendungen.
  • Kundensupport & großvolumige Zusammenfassungen: kosteneffiziente Zusammenfassung langer Transkripte in großem Maßstab.
  • Edge- oder eingebettete Inferenz, bei der die Antwortzeit zählt: Verwenden Sie flash/lite-Style-Varianten für strenge SLAs.
  • Massen-Dokumentenparsing/-Ingestion-Pipelines: Flash für Indexierung und Vorverarbeitung; auf Pro für hochwertige Extraktion/Analyse eskalieren.
  • Echtzeit-Code-Assistenten/IDE-Plugins: schnelle Code-Vervollständigugen mit geringeren Abrechnungskosten (für komplexe Refactorings mit Pro validieren).

Zugriff auf die Gemini 3 flash API

Schritt 1: Für einen API-Schlüssel anmelden

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugangs-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich bei den API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx, und senden Sie ihn ab.

Schritt 2: Anfragen an die Gemini 3 flash API senden

Wählen Sie den „gemini-3-flash“-Endpoint, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Die Anfragemethode und der Request-Body sind unserer Website-API-Dokumentation zu entnehmen. Unsere Website stellt zu Ihrer Bequemlichkeit auch Apifox-Tests bereit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Basis-URLs sind Gemini Generating Content und Chat.

Fügen Sie Ihre Frage oder Anfrage in das content-Feld ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabestatus und den Ausgabedaten.

Siehe auch Gemini 3 Pro Preview API

FAQ

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash ist Googles ausgewogenstes Modell und bietet Schlussfolgerungsfähigkeiten auf Spitzenniveau zu $0.50/$3 pro eine Million Token—ungefähr 4x günstiger als Gemini 3 Pro, bei vergleichbarer Intelligenz für die meisten Aufgaben.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash unterstützt vier Denkstufen: minimal (nahezu ohne Latenz), niedrig, mittel und hoch—und gibt Entwicklern eine feinstufige Kontrolle über die Abwägung zwischen Denktiefe und Geschwindigkeit, die Gemini 3 Pro nicht bietet.

Does Gemini 3 Flash have a free tier in the API?

Ja, Gemini 3 Flash (gemini-3-flash-preview) verfügt in der Gemini API über eine kostenlose Stufe, im Gegensatz zu Gemini 3 Pro, das derzeit für den API-Zugriff eine kostenpflichtige Nutzung erfordert.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures sind verschlüsselte Repräsentationen der internen Schlussfolgerungen des Modells, die in mehrstufigen Gesprächen zurückgespielt werden müssen—selbst auf der minimalen Denkstufe für Gemini 3 Flash erforderlich, um den Denkkontext aufrechtzuerhalten und Funktionsaufrufe zu ermöglichen.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Ja, Gemini 3 Flash unterstützt einzigartig die Kombination strukturierter Ausgaben (JSON-Schema) mit integrierten Tools wie Google Search, URL Context und Code Execution in derselben Anfrage—und ermöglicht damit fundierte, typsichere Antworten.

How does media_resolution affect Gemini 3 Flash performance?

Der Parameter media_resolution steuert den Tokenverbrauch pro Bild-/Videoframe: low (280 Token), medium (560), high (1120) oder ultra_high für Bilder. Bei Videos sind low und medium jeweils auf 70 Token pro Frame begrenzt, um die Kontextnutzung zu optimieren.

What tools does Gemini 3 Flash support?

Gemini 3 Flash unterstützt Google Search, File Search, Code Execution, URL Context und Standard-Funktionsaufrufe. In Gemini-3-Modellen werden Google Maps Grounding und Computer Use jedoch noch nicht unterstützt.

Preise für Gemini 3 Flash

Entdecken Sie wettbewerbsfähige Preise für Gemini 3 Flash, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Gemini 3 Flash Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Beispielcode und API für Gemini 3 Flash

Gemini 3 Flash ist ein reines textbasiertes Large Language Model (LLM), das über die gehostete API von CometAPI bereitgestellt wird (und über Inferenzschichten von Anbietern gespiegelt wird). Die API unterstützt standardmäßige Chat-/Completion-Muster, Streaming-Antworten, Funktions-/Tool-Aufrufe, strukturierte JSON-Ausgabe sowie mehrere „Thinking“-Modi, die für agentenähnliche Workflows konzipiert sind (interleaved / preserved / turn-level thinking).
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [{ text: "Explain how AI works in a few words" }],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

#!/bin/bash

curl "https://api.cometapi.com/v1beta/models/gemini-3-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how AI works in a few words"
          }
        ]
      }
    ]
  }'

Versionen von Gemini 3 Flash

Der Grund, warum Gemini 3 Flash mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.
Model idBeschreibungVerfügbarkeitAnfrage
gemini-3-flash-allDie verwendete Technologie ist inoffiziell und die Generierung ist instabil, aber Direct Internet usw., Chat Format✅Chat Format
gemini-3-flashVerweist automatisch auf das neueste Modell✅Gemini Inhalte generieren
gemini-3-flash-previewOffizielle Vorschau✅Gemini Inhalte generieren