Gemini 2.5 Flash dirancang untuk memberikan respons cepat tanpa mengorbankan kualitas keluaran. Model ini mendukung masukan multimodal, termasuk teks, gambar, audio, dan video, sehingga cocok untuk beragam aplikasi. Model ini dapat diakses melalui platform seperti Google AI Studio dan Vertex AI, menyediakan alat yang diperlukan bagi pengembang untuk integrasi yang mulus ke berbagai sistem.
Gemini 2.5 Flash menghadirkan sejumlah fitur menonjol yang membedakannya dalam keluarga Gemini 2.5:
Gemini 2.5 Flash telah melalui beberapa versi utama berikut:
Per Juli 2025, Gemini 2.5 Flash kini tersedia untuk publik dan stabil (tanpa perubahan dari gemini-2.5-flash-preview-05-20). Jika Anda menggunakan gemini-2.5-flash-preview-04-17, harga pratinjau yang ada akan berlanjut hingga waktu pensiun terjadwal untuk endpoint model pada 15 Juli 2025, ketika akan dimatikan. Anda dapat bermigrasi ke model yang tersedia secara umum "gemini-2.5-flash".
Lebih cepat, lebih murah, lebih pintar:
Jendela Konteks Masukan: Hingga 1 juta token, memungkinkan retensi konteks yang luas.
Token Keluaran: Mampu menghasilkan hingga 8,192 token per respons.
Modalitas yang Didukung: Teks, gambar, audio, dan video.
Platform Integrasi: Tersedia melalui Google AI Studio dan Vertex AI.
Harga: Model harga berbasis token yang kompetitif, memfasilitasi penerapan yang hemat biaya.
Di balik layar, Gemini 2.5 Flash adalah model bahasa besar berbasis transformer yang dilatih pada campuran data web, kode, gambar, dan video. Spesifikasi teknis utama meliputi:
Pelatihan Multimodal: Dilatih untuk menyelaraskan berbagai modalitas, Flash dapat memadukan teks dengan gambar, video, atau audio secara mulus, berguna untuk tugas seperti peringkasan video atau pembuatan deskripsi audio.
Proses Berpikir Dinamis: Mengimplementasikan loop penalaran internal di mana model merencanakan dan menguraikan prompt kompleks sebelum keluaran akhir.
Anggaran Thinking yang Dapat Dikonfigurasi: thinking_budget dapat diatur dari 0 (tanpa penalaran) hingga 24,576 tokens, memungkinkan kompromi antara latensi dan kualitas jawaban.
Integrasi Alat: Mendukung Grounding with Google Search, Code Execution, URL Context, dan Function Calling, memungkinkan tindakan dunia nyata langsung dari prompt bahasa alami.
Dalam evaluasi yang ketat, Gemini 2.5 Flash menunjukkan performa terdepan di industri:
Hasil ini menunjukkan keunggulan kompetitif Gemini 2.5 Flash dalam penalaran, pemahaman ilmiah, pemecahan masalah matematika, pengodean, interpretasi visual, dan kemampuan multibahasa:

Meski kuat, Gemini 2.5 Flash memiliki beberapa keterbatasan:
| Harga Comet (USD / M Tokens) | Harga Resmi (USD / M Tokens) |
|---|---|
Masukan:$0.24/M Keluaran:$2.00/M | Masukan:$0.30/M Keluaran:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)