ModelliSupportoAziendaBlog
500+ API di Modelli AI, Tutto In Una Sola API. Solo In CometAPI
API dei Modelli
Sviluppatore
Avvio RapidoDocumentazioneDashboard API
Risorse
Modelli di Intelligenza ArtificialeBlogAziendaRegistro delle modificheChi siamo
2025 CometAPI. Tutti i diritti riservati.Informativa sulla PrivacyTermini di Servizio
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Ingresso:$0.08/M
Uscita:$0.32/M
Contesto:1M
Uscita Massima:65K
Un modello Gemini 2.5 Flash ottimizzato per un elevato rapporto costo-efficacia e ad alto throughput. Il modello più piccolo e più conveniente in termini di costi, progettato per l'uso su larga scala.
Nuovo
Uso commerciale
Playground
Panoramica
Caratteristiche
Prezzi
API
Versioni

Dettagli tecnici

  • Ragionamento adattivo: Gemini 2.5 Flash-Lite supporta il ragionamento on-demand, consentendo agli sviluppatori di allocare risorse di calcolo solo quando è richiesto un ragionamento più profondo.
  • Integrazioni degli strumenti: Piena compatibilità con gli strumenti nativi di Gemini 2.5, inclusi Grounding with Google Search, Code Execution, URL Context e Function Calling per workflow multimodali senza soluzione di continuità.
  • Model Context Protocol (MCP): Sfrutta l’MCP di Google per recuperare dati web in tempo reale, garantendo risposte aggiornate e contestualmente pertinenti.
  • Opzioni di deployment: Disponibile tramite CometAPI, Gemini API, Vertex AI e Google AI Studio, con una traccia di anteprima per early adopter che desiderano sperimentare e fornire feedback.

Prestazioni benchmark di Gemini 2.5 Flash-Lite

  • Latenza: Ottiene fino al 50% di riduzione dei tempi di risposta mediani rispetto a Gemini 2.5 Flash, con latenze tipiche inferiori a 100 ms su benchmark standard di classificazione e sintesi.
  • Throughput: Ottimizzato per carichi ad alto volume, sostenendo decine di migliaia di richieste al minuto senza degrado delle prestazioni.
  • Prezzo-prestazioni: Dimostra una riduzione del 25% del costo per 1.000 token rispetto alla controparte Flash, rendendolo la scelta Pareto-ottimale per deployment sensibili ai costi.
  • Adozione nel settore: I primi utenti riportano un’integrazione senza attriti nelle pipeline di produzione, con metriche prestazionali in linea con o superiori alle proiezioni iniziali.

Gemini 2.5 Flash Lite


Casi d’uso ideali

  • Attività ad alta frequenza e bassa complessità: etichettatura automatizzata, analisi del sentiment e traduzione in batch
  • Pipeline sensibili ai costi: estrazione di dati da ampi corpora documentali, sintesi periodica in batch
  • Scenari edge e mobile: quando la latenza è critica ma i budget di risorse sono limitati

Limitazioni di Gemini 2.5 Flash-Lite

  • Stato di anteprima: potrebbe subire modifiche all’API prima della GA; le integrazioni dovrebbero tenere conto di possibili incrementi di versione.
  • Nessun fine-tuning al volo: non è possibile caricare pesi personalizzati; fare affidamento su prompt engineering e messaggi di sistema.
  • Creatività ridotta: ottimizzato per attività deterministiche e ad alto throughput; meno adatto alla generazione open-ended o alla scrittura “creativa”.
  • Limite di risorse: scala linearmente solo fino a ~16 vCPUs; oltre questa soglia, i guadagni di throughput diminuiscono.
  • Vincoli multimodali: supporta input immagine/audio ma con fedeltà limitata; non ideale per compiti impegnativi di visione o trascrizione audio.
  • Compromesso sulla finestra di contesto: anche se accetta fino a 1 M token, in pratica l’inferenza a quella scala può presentare un throughput degradato.

Funzionalità per Gemini 2.5 Flash Lite

Esplora le caratteristiche principali di Gemini 2.5 Flash Lite, progettato per migliorare le prestazioni e l'usabilità. Scopri come queste funzionalità possono beneficiare i tuoi progetti e migliorare l'esperienza utente.

Prezzi per Gemini 2.5 Flash Lite

Esplora i prezzi competitivi per Gemini 2.5 Flash Lite, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come Gemini 2.5 Flash Lite può migliorare i tuoi progetti mantenendo i costi gestibili.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Codice di esempio e API per Gemini 2.5 Flash Lite

Accedi a codice di esempio completo e risorse API per Gemini 2.5 Flash Lite per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di Gemini 2.5 Flash Lite nei tuoi progetti.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versioni di Gemini 2.5 Flash Lite

Il motivo per cui Gemini 2.5 Flash Lite dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.
version
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking

Altri modelli

A

Claude Opus 4.6

Ingresso:$4/M
Uscita:$20/M
Claude Opus 4.6 è il modello linguistico di grandi dimensioni di classe “Opus” di Anthropic, rilasciato nel febbraio 2026. È posizionato come un cavallo di battaglia per il lavoro della conoscenza e i flussi di lavoro di ricerca — migliorando il ragionamento con contesti estesi, la pianificazione in più fasi, l’uso di strumenti (inclusi i flussi di lavoro software basati su agenti) e le attività d’uso del computer, come la generazione automatizzata di diapositive e fogli di calcolo.
A

Claude Sonnet 4.6

Ingresso:$2.4/M
Uscita:$12/M
Claude Sonnet 4.6 è il nostro modello Sonnet più capace finora. È un aggiornamento completo delle capacità del modello in ambiti quali programmazione, uso del computer, ragionamento su contesti estesi, pianificazione degli agenti, lavoro basato sulla conoscenza e design. Sonnet 4.6 offre anche una finestra di contesto da 1M token in beta.
O

GPT-5.4 nano

Ingresso:$0.16/M
Uscita:$1/M
GPT-5.4 nano è progettato per attività in cui la velocità e il costo contano maggiormente, come classificazione, estrazione dei dati, ordinamento e sub-agenti.
O

GPT-5.4 mini

Ingresso:$0.6/M
Uscita:$3.6/M
GPT-5.4 mini porta i punti di forza di GPT-5.4 in un modello più veloce ed efficiente, progettato per carichi di lavoro ad alto volume.
A

Claude Mythos Preview

A

Claude Mythos Preview

Prossimamente
Ingresso:$60/M
Uscita:$240/M
Claude Mythos Preview è il nostro modello di frontiera più capace finora e mostra un balzo notevole nei punteggi su molti benchmark di valutazione rispetto al nostro precedente modello di frontiera, Claude Opus 4.6.
X

mimo-v2-pro

Ingresso:$0.8/M
Uscita:$2.4/M
MiMo-V2-Pro è il modello di base di punta di Xiaomi, con oltre 1T di parametri totali e una lunghezza del contesto di 1M, profondamente ottimizzato per scenari agentici. È altamente adattabile a framework per agenti generici come OpenClaw. Si colloca tra i migliori al mondo nei benchmark standard PinchBench e ClawBench, con prestazioni percepite che si avvicinano a quelle di Opus 4.6. MiMo-V2-Pro è progettato per fungere da cervello dei sistemi di agenti, orchestrando flussi di lavoro complessi, guidando attività di ingegneria in produzione e fornendo risultati in modo affidabile.

Blog correlati

L'API gratuita di Gemini 2.5 Pro è fuori uso? Modifiche alla quota gratuita nel 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

L'API gratuita di Gemini 2.5 Pro è fuori uso? Modifiche alla quota gratuita nel 2025

Google ha inasprito nettamente la fascia gratuita dell’API Gemini: Gemini 2.5 Pro è stato rimosso dalla fascia gratuita e le richieste gratuite giornaliere di Gemini 2.5 Flash sono state tagliate drasticamente (report: ~250 → ~20/giorno). Questo non significa che il modello sia permanentemente “morto” per la sperimentazione — ma significa che l’accesso gratuito è stato di fatto ridotto all’osso per molti casi d’uso reali.