Gemini 2.5 Flash è progettato per fornire risposte rapide senza compromettere la qualità dell'output. Supporta input multimodali, inclusi testo, immagini, audio e video, rendendolo adatto a diverse applicazioni. Il modello è accessibile tramite piattaforme come Google AI Studio e Vertex AI, offrendo agli sviluppatori gli strumenti necessari per un'integrazione fluida in vari sistemi.
Gemini 2.5 Flash introduce diverse funzionalità di spicco che lo distinguono all'interno della famiglia Gemini 2.5:
Gemini 2.5 Flash è passato attraverso le seguenti versioni chiave:
A luglio 2025, Gemini 2.5 Flash è ora disponibile pubblicamente e stabile (nessuna modifica rispetto a gemini-2.5-flash-preview-05-20 ).Se stai utilizzando gemini-2.5-flash-preview-04-17, il pricing di preview esistente continuerà fino alla dismissione programmata dell'endpoint del modello il 15 luglio 2025, quando verrà chiuso. Puoi migrare al modello generalmente disponibile "gemini-2.5-flash" .
Più veloce, più economico, più intelligente:
Finestra di contesto in input: Fino a 1 milione di token, consentendo un'ampia conservazione del contesto.
Token di output: In grado di generare fino a 8,192 token per risposta.
Modalità supportate: Testo, immagini, audio e video.
Piattaforme di integrazione: Disponibile tramite Google AI Studio e Vertex AI.
Prezzi: Modello di pricing competitivo basato sui token, che facilita un'adozione conveniente.
Sotto il cofano, Gemini 2.5 Flash è un modello di linguaggio di grandi dimensioni basato su transformer addestrato su un mix di dati da web, codice, immagini e video. Le principali specifiche tecniche includono:
Addestramento multimodale: Addestrato per allineare più modalità, Flash può combinare senza soluzione di continuità testo con immagini, video o audio, utile per attività come il riassunto di video o la didascalia audio .
Processo di pensiero dinamico: Implementa un ciclo di ragionamento interno in cui il modello pianifica e scompone prompt complessi prima dell'output finale .
Budget di pensiero configurabili: Il thinking_budget può essere impostato da 0 (nessun ragionamento) fino a 24,576 token, consentendo compromessi tra latenza e qualità della risposta .
Integrazione con strumenti: Supporta Grounding con Google Search, esecuzione di codice, contesto da URL e chiamata di funzioni, abilitando azioni nel mondo reale direttamente da prompt in linguaggio naturale .
In valutazioni rigorose, Gemini 2.5 Flash dimostra prestazioni leader nel settore:
Questi risultati indicano il vantaggio competitivo di Gemini 2.5 Flash nel ragionamento, nella comprensione scientifica, nella risoluzione di problemi matematici, nella programmazione, nell'interpretazione visiva e nelle capacità multilingue:

Sebbene potente, Gemini 2.5 Flash presenta alcune limitazioni:
| Prezzo Comet (USD / M Tokens) | Prezzo Ufficiale (USD / M Tokens) |
|---|---|
Ingresso:$0.24/M Uscita:$2.00/M | Ingresso:$0.30/M Uscita:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)