ModelliPrezziAzienda
500+ API di Modelli AI, Tutto In Una Sola API. Solo In CometAPI
API dei Modelli
Sviluppatore
Avvio RapidoDocumentazioneDashboard API
Azienda
Chi siamoAzienda
Risorse
Modelli di Intelligenza ArtificialeBlogRegistro delle modificheSupporto
Termini di ServizioInformativa sulla Privacy
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Ingresso:$0.4/M
Uscita:$2.4/M
Contesto:1,048,576
Uscita Massima:65.5k
Gemini 3 Flash è un modello multimodale su larga scala, leggero ed efficiente, di Google, progettato per scenari reali che richiedono risposte rapide e bassa latenza.
Nuovo
Uso commerciale
Playground
Panoramica
Caratteristiche
Prezzi
API
Versioni

Che cos'è Gemini 3 Flash

“Gemini 3 Flash” è il membro Flash/fast della famiglia Gemini-3: una variante più leggera, a latenza più bassa e conveniente dei modelli Gemini-3 di Google, pensata per applicazioni ad alto throughput, in tempo reale e sensibili alla scala. Una variante della famiglia di modelli dell'API Gemini che consente agli sviluppatori di chiamare, tramite l'API di CometAPI (stessa superficie API degli altri modelli Gemini), un modello in stile Gemini 3 a bassa latenza e ottimizzato per i costi. Espone gli stessi input multimodali e gli strumenti per output strutturati, ma dà priorità alla velocità di inferenza e al throughput.

Caratteristiche principali :

  • Bassa latenza / elevato throughput: ottimizzato per risposte rapide ed efficienza dei costi (design point Flash).
  • Supporto input multimodali: testo, immagini, frammenti video e audio in molte varianti Flash (le voci del modello API elencano i tipi di input supportati per variante).
  • Function calling & structured outputs: vincolo di output JSON/strutturati per l'integrazione con strumenti e agenti.
  • Supporto per agenti/strumenti: si integra con Google Search grounding, chiamata di funzioni/strumenti e framework per agenti nell'ecosistema Gemini.

Come si confronta Gemini 3 Flash con altri modelli

  • Rispetto a Gemini-3 Pro (stessa famiglia): Flash = ottimizzato per velocità/costi; Pro = maggiore capacità di ragionamento, fedeltà multimodale e Deep Think. Scegli Flash per UI in tempo reale; Pro per attività sensibili all'accuratezza.
  • Rispetto al precedente Gemini (2.5 Flash): la famiglia Gemini-3 migliora il ragionamento e le prestazioni multimodali; il design point Flash continua a puntare su prezzo/prestazioni. Se attualmente usi 2.5 Flash, Gemini-3 Fast/Flash è pensato per offrire qualità migliore con latenza/costo simili.

Casi d'uso pratici (dove Flash eccelle)

  • Chatbot e agenti vocali in tempo reale: bassa latenza per UI conversazionali e applicazioni audio in streaming.
  • Assistenza clienti e sintesi ad alto volume: sintesi conveniente di trascrizioni lunghe su larga scala.
  • Inferenza edge o embedded dove conta il tempo di risposta: usa varianti in stile flash/lite per SLA stringenti.
  • Parsing massivo di documenti / pipeline di ingestione: Flash per indicizzazione e pre-elaborazione; passa a Pro per estrazione/analisi ad alto valore.
  • Assistenti di codice in tempo reale / plugin IDE: completamenti di codice rapidi con costi di fatturazione inferiori (validare con Pro per refactoring complessi).

Come accedere all'API Gemini 3 Flash

Passaggio 1: Registrati per la chiave API

Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla CometAPI console. Ottieni la chiave API di accesso dell'interfaccia. Fai clic su “Add Token” alla voce API token nel centro personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste all'API Gemini 3 Flash

Seleziona l’endpoint “gemini-3-flash” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono disponibili nella documentazione API del nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva dal tuo account. L'URL di base è Gemini Generating Content e Chat.

Inserisci la tua domanda o richiesta nel campo content — è a questo che il modello risponderà. Elabora la risposta API per ottenere la risposta generata.

Passaggio 3: Recupera e verifica i risultati

Elabora la risposta API per ottenere la risposta generata. Dopo l'elaborazione, l'API risponde con lo stato dell'attività e i dati di output.

Vedi anche Gemini 3 Pro Preview API

FAQ

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash è il modello più equilibrato di Google, offrendo capacità di ragionamento a livello di frontiera a $0.50/$3 per milione di token—circa 4x più economico di Gemini 3 Pro, pur mantenendo un'intelligenza paragonabile per la maggior parte dei compiti.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supporta quattro livelli di pensiero: minimale (latenza quasi pari a zero), basso, medio e alto—offrendo agli sviluppatori un controllo granulare sul compromesso tra profondità di ragionamento e velocità che Gemini 3 Pro non offre.

Does Gemini 3 Flash have a free tier in the API?

Sì, Gemini 3 Flash (gemini-3-flash-preview) ha un livello gratuito nella Gemini API, a differenza di Gemini 3 Pro che attualmente richiede un utilizzo a pagamento per l'accesso all'API.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Le Thought Signatures sono rappresentazioni crittografate del ragionamento interno del modello che devono essere reinviate nelle conversazioni multi-turno—richieste anche al livello di pensiero minimale per consentire a Gemini 3 Flash di mantenere il contesto di ragionamento e abilitare la chiamata di funzioni.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Sì, Gemini 3 Flash supporta in modo esclusivo la combinazione di output strutturati (schema JSON) con strumenti integrati come Google Search, URL Context e Code Execution nella stessa richiesta—abilitando risposte fondate e type-safe.

How does media_resolution affect Gemini 3 Flash performance?

Il parametro media_resolution controlla l'utilizzo di token per fotogramma immagine/video: low (280 token), medium (560), high (1120) o ultra_high per le immagini. Per i video, low e medium sono entrambi limitati a 70 token per fotogramma per ottimizzare l'uso del contesto.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supporta Google Search, File Search, Code Execution, URL Context e la chiamata di funzioni standard. Tuttavia, Google Maps grounding e Computer Use non sono ancora supportati nei modelli Gemini 3.

Prezzi per Gemini 3 Flash

Esplora i prezzi competitivi per Gemini 3 Flash, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come Gemini 3 Flash può migliorare i tuoi progetti mantenendo i costi gestibili.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Codice di esempio e API per Gemini 3 Flash

Gemini 3 Flash è un modello linguistico di grandi dimensioni (LLM) solo testuale, esposto tramite l'API ospitata di CometAPI (e rispecchiata dai livelli di inferenza dei fornitori). L'API supporta i pattern standard di chat/completion, risposte in streaming, invocazione di funzioni/strumenti, output JSON strutturato e diverse modalità di “thinking” progettate per flussi di lavoro in stile agente (interleaved / preserved / turn-level thinking).
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [{ text: "Explain how AI works in a few words" }],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

#!/bin/bash

curl "https://api.cometapi.com/v1beta/models/gemini-3-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how AI works in a few words"
          }
        ]
      }
    ]
  }'

Versioni di Gemini 3 Flash

Il motivo per cui Gemini 3 Flash dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.
ID modelloDescrizioneDisponibilitàRichiesta
gemini-3-flash-allLa tecnologia utilizzata non è ufficiale e la generazione è instabile, ma con Direct Internet ecc.; formato Chat✅Chat
gemini-3-flashPunta automaticamente al modello più recente✅Gemini Generating Content
gemini-3-flash-previewAnteprima ufficiale✅Gemini Generating Content