Gemini 2.5 Flash został zaprojektowany tak, aby dostarczać szybkie odpowiedzi bez kompromisu w jakości wyników. Obsługuje wejścia multimodalne, w tym tekst, obrazy, audio i wideo, dzięki czemu nadaje się do różnorodnych zastosowań. Model jest dostępny na platformach takich jak Google AI Studio i Vertex AI, zapewniając deweloperom narzędzia niezbędne do bezproblemowej integracji z różnymi systemami.
Gemini 2.5 Flash wprowadza kilka wyróżniających się funkcji, które odróżniają go w rodzinie Gemini 2.5:
Gemini 2.5 Flash przeszedł przez następujące kluczowe wersje:
Od lipca 2025 Gemini 2.5 Flash jest publicznie dostępny i stabilny (bez zmian względem gemini-2.5-flash-preview-05-20 ). Jeśli używasz gemini-2.5-flash-preview-04-17, dotychczasowe ceny wersji preview będą obowiązywać do planowanego wycofania endpointu modelu 15 lipca 2025, kiedy zostanie on wyłączony. Możesz przejść na ogólnodostępny model "gemini-2.5-flash" .
Szybszy, tańszy, mądrzejszy:
Okno kontekstu wejściowego: do 1 miliona tokenów, co pozwala na rozbudowaną retencję kontekstu.
Tokeny wyjściowe: możliwość generowania do 8,192 tokenów na odpowiedź.
Obsługiwane modalności: tekst, obrazy, audio i wideo.
Platformy integracji: dostępny przez Google AI Studio i Vertex AI.
Cennik: konkurencyjny model rozliczeń oparty na tokenach, ułatwiający efektywne kosztowo wdrożenia.
Pod maską Gemini 2.5 Flash to duży model językowy oparty na architekturze transformer, trenowany na mieszance danych z sieci, kodu, obrazów i wideo. Kluczowe techniczne specyfikacje obejmują:
Trening multimodalny: Wytrenowany do łączenia wielu modalności, Flash może płynnie zestawiać tekst z obrazami, wideo lub audio, co jest przydatne w zadaniach takich jak podsumowywanie wideo czy opisy audio.
Dynamiczny proces myślenia: Implementuje wewnętrzną pętlę rozumowania, w której model planuje i rozbija złożone polecenia przed finalnym wynikiem.
Konfigurowalne budżety myślenia: thinking_budget można ustawić od 0 (brak rozumowania) do 24,576 tokenów, umożliwiając kompromis między latencją a jakością odpowiedzi.
Integracja narzędzi: Obsługuje Grounding with Google Search, Code Execution, URL Context i Function Calling, umożliwiając wykonywanie działań w świecie rzeczywistym bezpośrednio z poleceń w języku naturalnym.
W rygorystycznych ewaluacjach Gemini 2.5 Flash demonstruje wiodącą w branży wydajność:
Wyniki te wskazują na przewagę konkurencyjną Gemini 2.5 Flash w zakresie rozumowania, rozumienia naukowego, rozwiązywania problemów matematycznych, kodowania, interpretacji wizualnej i wielojęzyczności:

| Cena Comet (USD / M Tokens) | Oficjalna cena (USD / M Tokens) |
|---|---|
Wejście:$0.24/M Wyjście:$2.00/M | Wejście:$0.30/M Wyjście:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)