Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Indtast:$0.4/M
Output:$2.4/M
Kontekst:1,048,576
Maks Output:65.5k
Gemini 3 Flash er en letvægts og effektiv multimodal storskalamodel fra Google, skræddersyet til virkelige scenarier, der kræver hurtige svar og lav latenstid.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API
Versioner

Hvad er Gemini 3 Flash

“Gemini 3 Flash” er den Flash/hurtige variant i Gemini-3-familien: en lettere, lavere-latenstid, omkostningseffektiv variant af Googles Gemini-3-modeller, beregnet til høj gennemløb, realtid og skaleringsfølsomme applikationer. En variant af Gemini API-modelfamilien, der lader udviklere kalde en lav-latenstid, omkostningsoptimeret Gemini 3-stil model via CometAPI's API (samme API-overflade som andre Gemini-modeller). Den tilbyder de samme multimodale input og værktøjer til struktureret output, men prioriterer inferenshastighed og gennemløb.

Hovedfunktioner :

  • Lav latenstid / højt gennemløb: tunet til hurtige svar og omkostningseffektivitet (Flash-designpunkt).
  • Understøttelse af multimodale input: tekst, billeder, videoklip og lyd i mange Flash-varianter (API-modelopføringer angiver understøttede inputtyper pr. variant).
  • Funktionskald og strukturerede uddata: håndhævelse af JSON/struktureret uddata til integration med værktøjer og agenter.
  • Understøttelse af agenter/værktøjer: integrerer med Google Search-grounding, funktions-/værktøjskald og agentrammeværk i Gemini-økosystemet.

Hvordan Gemini 3 Flash sammenlignes med andre modeller

  • Sammenlignet med Gemini-3 Pro (samme familie): Flash = optimeret til hastighed/omkostninger; Pro = højere ræsonnering, multimodal fidelitet og Deep Think. Vælg Flash til realtids-UI'er; Pro til opgaver, der er følsomme over for nøjagtighed.
  • Sammenlignet med tidligere Gemini (2.5 Flash): Gemini-3-familien forbedrer ræsonnering og multimodal ydeevne; Flash-designpunktet sigter fortsat mod pris/ydelse. Hvis du i øjeblikket bruger 2.5 Flash, er Gemini-3 Fast/Flash tiltænkt at give bedre kvalitet ved lignende latenstid/omkostning.

Praktiske anvendelser (hvor Flash vinder)

  • Realtids-chatbots og stemmeagenter: lav latenstid til konversations-UI'er og streaming-lydapplikationer.
  • Kundesupport og opsummering i høj volumen: omkostningseffektiv opsummering af lange transskripter i stor skala.
  • Edge- eller indlejret inferens, hvor svartid er vigtig: brug flash/lite-stilvarianter til stramme SLA'er.
  • Massetolkning af dokumenter / indlæsningspipelines: Flash til indeksering og forbehandling; eskaler til Pro for ekstraktion/analyse med høj værdi.
  • Realtids-kodeassistenter / IDE-plugins: hurtige kodefuldførelser med lavere faktureringsomkostning (valider med Pro for komplekse refaktoriseringer).

Sådan får du adgang til Gemini 3 Flash API

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du ikke er bruger endnu, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent API-nøglen til interfacet som adgangslegitimation. Klik på “Add Token” ved API token i det personlige center, hent token-nøglen: sk-xxxxx og indsend.

Trin 2: Send anmodninger til Gemini 3 Flash API

Vælg slutpunktet “gemini-3-flash” for at sende API-anmodningen og angiv anmodningskroppen. Anmodningsmetode og anmodningskrop fås fra vores websteds API-dokumentation. Vores websted tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. basis-URL er Gemini Generating Content og Chat.

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API'et med opgavens status og outputdata.

Se også Gemini 3 Pro Preview API

FAQ

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Funktioner til Gemini 3 Flash

Udforsk de vigtigste funktioner i Gemini 3 Flash, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for Gemini 3 Flash

Udforsk konkurrencedygtige priser for Gemini 3 Flash, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Gemini 3 Flash kan forbedre dine projekter, mens omkostningerne holdes håndterbare.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Eksempelkode og API til Gemini 3 Flash

Gemini 3 Flash er en udelukkende tekstbaseret stor sprogmodel (LLM), som er eksponeret via CometAPI’s hostede API (og spejlet af leverandørers inferenslag). API’et understøtter standard chat-/completion-mønstre, streamede svar, kald af funktioner/værktøjer, struktureret JSON-output samt flere "tænke"-tilstande designet til agent-lignende arbejdsgange (interleaved / preserved / turn-level thinking).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versioner af Gemini 3 Flash

Årsagen til, at Gemini 3 Flash har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.
Model-idBeskrivelseTilgængelighedAnmodning
gemini-3-flash-allDen anvendte teknologi er uofficiel, og genereringen er ustabil, men Direct Internet m.m., Chat format✅Chat format
gemini-3-flashPeger automatisk på den nyeste model✅Gemini Generating Content
gemini-3-flash-previewOfficiel forhåndsvisning✅Gemini Generating Content

Flere modeller