. API Flash-Lite di Gemini 2.5 rappresenta l'ultima offerta di Google nella sua famiglia di modelli di ragionamento ibrido, progettati per fornire efficienza dei costi senza pari e al latenza estremamente bassa per applicazioni ad alto volume e sensibili alla latenza.
Informazioni di base e caratteristiche
Annunciato in una versione di anteprima il 17 giugno 2025, Flash-Lite completa la gamma Gemini 2.5, insieme a Flash e Pro, fornendo agli sviluppatori un'opzione ottimizzata per velocità, prezzo-prestazionie pensiero adattivo capacità.
Puoi iniziare a utilizzare Gemini 2.5 Flash-Lite specificando "gemini-2.5-flash-lite" nel tuo codice. Se stai utilizzando una versione di anteprima, puoi passare a "gemini-2.5-flash-lite", che è la stessa della versione di anteprima. Google prevede di rimuovere l'alias di anteprima per Flash-Lite il 25 agosto.
| Stabilità | Modello | Data |
| Stabile (GA) | gemini-2.5-flash-lite | Luglio 22, 2025 |
| Anteprima sperimentale | gemini-2.5-flash-lite-06-17 | Periodo di disponibilità: 17 giugno - 25 agosto 2025 |
| ultima versione | gemini-2.5-flash-lite-preview-09-2025 | 09-2025 |
- Controllo del pensiero: Implementa un budget di pensiero dinamico tramite un parametro API, con il pensiero disabilitato per impostazione predefinita per massimizzare la velocità e ridurre i costi.
- Bassa latenza: Progettato per un tempo rapido per il primo tokenFlash-Lite riduce al minimo i costi di avvio, raggiungendo latenze inferiori a 100 ms sull'infrastruttura standard di Google Cloud.
- Elevata produttività: Con pipeline di decodifica capaci, sostiene centinaia di token al secondo, sbloccando esperienze utente in tempo reale nei chatbot e nelle applicazioni di streaming.
- Supporto multimodale: Sebbene ottimizzato principalmente per il testo, Flash-Lite accetta anche immagini, Audioe video input tramite l'API Gemini, consentendo casi d'uso versatili che vanno dalla sintesi dei documenti alle attività di visione leggera.
Dettagli tecnici
- Ragionamento adattivo:
Gemini 2.5 Flash-Litesupporta su richiesta pensiero, consentendo agli sviluppatori di allocare risorse di elaborazione solo quando è richiesto un ragionamento più approfondito. - Integrazioni degli strumenti: Piena compatibilità con gli strumenti nativi di Gemini 2.5, inclusi Messa a terra con la ricerca Google, Esecuzione del codice, Contesto URLe Chiamata di funzione per flussi di lavoro multimodali senza interruzioni.
- Protocollo del contesto modello (MCP): sfrutta l'MCP di Google per recuperare dati web in tempo reale, garantendo risposte up-to-date e al contestualmente rilevante.
- Opzioni di distribuzione: Disponibile tramite il CometaAPI, API Gemelli, Vertice AIe Studio sull'intelligenza artificiale di Google, con una traccia di anteprima per i primi utilizzatori che desiderano sperimentare e fornire feedback.
Prestazioni di riferimento di Gemini 2.5 Flash-Lite
- Latenza: Raggiunge fino a Tempi di risposta mediani inferiori del 50% rispetto a Gemini 2.5 Flash, con tipico inferiore a 100 ms latenze sui benchmark standard di classificazione e riepilogo.
- Throughput: Ottimizzato per volume alto carichi di lavoro, sostenendo decine di migliaia di richieste al minuto senza degrado delle prestazioni.
- Prezzo-Prestazioni: Dimostra un Riduzione del 25% del costo per 1,000 token rispetto alla sua controparte Flash, rendendolo il Pareto-ottimale scelta ideale per distribuzioni attente ai costi.
- Adozione industriale: I primi utenti segnalano un'integrazione perfetta nei pipeline di produzione, con parametri delle prestazioni in linea o addirittura superiori alle proiezioni iniziali.

Casi d'uso ideali
- Compiti ad alta frequenza e bassa complessità: Tagging automatizzato, analisi del sentiment e traduzione in blocco
- Condotte sensibili ai costi: Estrazione dati da corpora di documenti di grandi dimensioni, riepilogo periodico in batch
- Scenari Edge e Mobile: Quando la latenza è critica ma i budget delle risorse sono limitati
Limitazioni di Gemini 2.5 Flash-Lite
- Stato di anteprima: Potrebbero esserci modifiche all'API prima del rilascio GA; le integrazioni dovrebbero tenere conto di possibili incrementi di versione.
- Nessuna messa a punto al volo: Impossibile caricare pesi personalizzati; fare affidamento sui messaggi di sistema e di ingegneria immediata.
- Creatività ridotta: Adatto a compiti deterministici e ad alto rendimento; meno adatto alla generazione aperta o alla scrittura "creativa".
- Limite delle risorse: Scala in modo lineare solo fino a circa 16 vCPU; oltre questo limite, l'aumento della produttività diminuisce.
- Vincoli multimodali: Supporta input di immagini/audio ma con fedeltà limitata; non è l'ideale per attività di visione o trascrizione audio impegnative.
- Compromesso tra finestra di contesto : Sebbene accetti fino a 1 M di token, l'inferenza pratica a quella scala potrebbe comportare una riduzione della produttività.
Come chiamare Gemini 2.5 Flash-Lite API di CometAPI
Gemini 2.5 Flash Lite Prezzi API in CometAPI: sconto del 20% sul prezzo ufficiale:
- Token di input: $0.08/M token
- Token di output: $0.32/M di token
Passi richiesti
- Accedere cometapi.comSe non sei ancora un nostro utente, registrati prima
- Ottieni la chiave API delle credenziali di accesso dell'interfaccia. Fai clic su "Aggiungi token" nel token API nell'area personale, ottieni la chiave token: sk-xxxxx e invia.
- Ottieni l'URL di questo sito: https://api.cometapi.com/
Metodi di utilizzo
- Selezionare l'opzione "
gemini-2.5-flash-lite"endpoint" per inviare la richiesta API e impostarne il corpo. Il metodo e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito web fornisce anche il test Apifox per vostra comodità. - Sostituire con la tua chiave CometAPI effettiva dal tuo account.
- Inserisci la tua domanda o richiesta nel campo contenuto: il modello risponderà a questa domanda.
- Elaborare la risposta API per ottenere la risposta generata.
CometAPI fornisce un'API REST completamente compatibile, per una migrazione senza interruzioni. Dettagli chiave per Documento API:
- URL di base: https://api.cometapi.com/v1/chat/completions
- Nomi dei modelli: "
gemini-2.5-flash-lite" - Autenticazione:
Bearer YOUR_CometAPI_API_KEYtestata
Vedere anche Gemelli 2.5 Pro
