Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Ingresso:$0.4/M
Uscita:$2.4/M
Contesto:1,048,576
Uscita Massima:65.5k
Gemini 3 Flash è un modello multimodale su larga scala, leggero ed efficiente, di Google, progettato per scenari reali che richiedono risposte rapide e bassa latenza.
Nuovo
Uso commerciale
Playground
Panoramica
Caratteristiche
Prezzi
API
Versioni

Che cos'è Gemini 3 Flash

“Gemini 3 Flash” è il membro Flash/fast della famiglia Gemini-3: una variante più leggera, a latenza ridotta e conveniente dei modelli Gemini-3 di Google, pensata per applicazioni ad alto throughput, in tempo reale e sensibili alla scala. Una variante della famiglia di modelli dell'API Gemini che consente agli sviluppatori di invocare, tramite l'API di CometAPI (stessa superficie API degli altri modelli Gemini), un modello in stile Gemini 3 a bassa latenza e ottimizzato per i costi. Espone gli stessi input multimodali e gli stessi strumenti per output strutturati, ma dà priorità alla velocità di inferenza e al throughput.

Caratteristiche principali :

  • Bassa latenza / alto throughput: ottimizzato per risposte rapide ed efficienza dei costi (design point di Flash).
  • Supporto per input multimodali: testo, immagini, frammenti video e audio in molte varianti di Flash (le voci dei modelli API elencano i tipi di input supportati per ciascuna variante).
  • Chiamata di funzioni e output strutturati: garanzia di output JSON/strutturati per l'integrazione con strumenti e agenti.
  • Supporto per agenti/strumenti: si integra con il grounding di Google Search, la chiamata di funzioni/strumenti e i framework di agenti nell'ecosistema Gemini.

Come si confronta Gemini 3 Flash con altri modelli

  • Rispetto a Gemini-3 Pro (stessa famiglia): Flash = ottimizzato per velocità/costo; Pro = maggiore capacità di ragionamento, fedeltà multimodale e Deep Think. Scegli Flash per le interfacce in tempo reale; Pro per attività sensibili all'accuratezza.
  • Rispetto al precedente Gemini (2.5 Flash): la famiglia Gemini-3 migliora il ragionamento e le prestazioni multimodali; il design point di Flash continua a puntare a prezzo/prestazioni. Se attualmente usi 2.5 Flash, Gemini-3 Fast/Flash è pensato per offrire qualità migliore con latenza/costo simili.

Casi d'uso pratici (dove Flash eccelle)

  • Chatbot in tempo reale e agenti vocali: bassa latenza per interfacce conversazionali e applicazioni di audio in streaming.
  • Assistenza clienti e riepilogo ad alto volume: sintesi a costi contenuti di lunghe trascrizioni su larga scala.
  • Inferenza edge o embedded dove il tempo di risposta conta: usa varianti in stile flash/lite per SLA stringenti.
  • Parsing massivo di documenti / pipeline di ingestione: Flash per indicizzazione e pre-elaborazione; passa a Pro per estrazione/analisi di alto valore.
  • Assistenti di codice in tempo reale / plugin IDE: completamenti di codice rapidi con costo di fatturazione inferiore (valida con Pro per refactoring complessi).

Come accedere all'API di Gemini 3 Flash

Passaggio 1: registrati per ottenere la chiave API

Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la chiave API di accesso all'interfaccia. Fai clic su “Add Token” nel token API nel centro personale, ottieni la chiave del token: sk-xxxxx e invia.

Step 2: Send Requests to Gemini 3 flash API

Seleziona l'endpoint “gemini-3-flash” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono disponibili nella documentazione API del nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva dal tuo account. l'URL di base è Gemini Generating Content e Chat.

Inserisci la tua domanda o richiesta nel campo content—è a questo che il modello risponderà. Elabora la risposta dell'API per ottenere l'output generato.

Passaggio 3: recupera e verifica i risultati

Elabora la risposta dell'API per ottenere la risposta generata. Dopo l'elaborazione, l'API risponde con lo stato dell'attività e i dati di output.

Vedi anche Gemini 3 Pro Preview API

FAQ

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Funzionalità per Gemini 3 Flash

Esplora le caratteristiche principali di Gemini 3 Flash, progettato per migliorare le prestazioni e l'usabilità. Scopri come queste funzionalità possono beneficiare i tuoi progetti e migliorare l'esperienza utente.

Prezzi per Gemini 3 Flash

Esplora i prezzi competitivi per Gemini 3 Flash, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come Gemini 3 Flash può migliorare i tuoi progetti mantenendo i costi gestibili.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Codice di esempio e API per Gemini 3 Flash

Gemini 3 Flash è un modello linguistico di grandi dimensioni (LLM) esclusivamente testuale, esposto tramite l’API ospitata di CometAPI (e replicato dai livelli di inferenza dei fornitori). L’API supporta schemi standard di chat/completamento, risposte in streaming, invocazione di funzioni/strumenti, output JSON strutturato e diverse modalità di “ragionamento” progettate per flussi di lavoro in stile agente (ragionamento intercalato / preservato / a livello di turno).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versioni di Gemini 3 Flash

Il motivo per cui Gemini 3 Flash dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.
ID modelloDescrizioneDisponibilitàRichiesta
gemini-3-flash-allLa tecnologia utilizzata non è ufficiale e la generazione è instabile, ma con Direct Internet ecc., Chat formato✅Chat formato
gemini-3-flashPunta automaticamente al modello più recente✅Gemini Generating Content
gemini-3-flash-previewAnteprima ufficiale✅Gemini Generating Content

Altri modelli