Gemini 2.5 Flash, çıktı kalitesinden ödün vermeden hızlı yanıtlar sunmak üzere tasarlanmıştır. Metin, görseller, ses ve video dahil olmak üzere çok modlu girdileri destekler; bu da onu çeşitli uygulamalar için uygun kılar. Model, Google AI Studio ve Vertex AI gibi platformlar üzerinden erişilebilir olup, geliştiricilere çeşitli sistemlere sorunsuz entegrasyon için gerekli araçları sağlar.

Temel Bilgiler (Özellikler)

Gemini 2.5 Flash, Gemini 2.5 ailesi içinde onu öne çıkaran birkaç dikkat çekici özellik sunar:

Hibrit Akıl Yürütme: Geliştiriciler, modelin çıktıyı üretmeden önce içsel akıl yürütmeye ayırdığı token sayısını hassas biçimde kontrol etmek için thinking_budget parametresini ayarlayabilir.
Pareto Sınırı: Optimal maliyet-performans noktasında konumlanan Flash, 2.5 modelleri arasında en iyi fiyat-zekâ oranını sunar.
Çoklu Mod Desteği: Yerel olarak metin, görseller, video ve ses işler; daha zengin sohbet ve analitik yetenekler sağlar.
1 Milyon Token'lık Bağlam: Eşi benzeri olmayan bağlam uzunluğu, tek bir istekte derin analiz ve uzun belgelerin anlaşılmasını mümkün kılar.

Model Sürümleme

Gemini 2.5 Flash aşağıdaki temel sürümlerden geçmiştir:

gemini-2.5-flash-lite-preview-09-2025: Geliştirilmiş araç kullanılabilirliği: Karmaşık, çok adımlı görevlerde iyileştirilmiş performans; SWE-Bench Verified puanlarında %5 artış (48.9%'dan 54%'e). Geliştirilmiş verimlilik: Akıl yürütme etkinleştirildiğinde, daha az token ile daha yüksek kaliteli çıktı elde edilir; bu da gecikmeyi ve maliyetleri azaltır.
Preview 04-17: “Thinking” yeteneğine sahip erken erişim sürümü, gemini-2.5-flash-preview-04-17 aracılığıyla kullanılabilir.
Kararlı Genel Erişilebilirlik (GA): 17 Haziran 2025 itibarıyla, kararlı uç nokta gemini-2.5-flash, önizlemenin yerini alır ve 20 Mayıs önizlemesine göre API değişikliği olmadan üretim düzeyinde güvenilirlik sağlar.
Önizlemenin Kullanımdan Kaldırılması: Önizleme uç noktalarının 15 Temmuz 2025'te kapatılması planlandı; kullanıcıların bu tarihten önce GA uç noktasına geçmeleri gerekir.

Temmuz 2025 itibarıyla, Gemini 2.5 Flash artık genel olarak erişilebilir ve kararlıdır (gemini-2.5-flash-preview-05-20 sürümünden hiçbir değişiklik yoktur). gemini-2.5-flash-preview-04-17 kullanıyorsanız, mevcut önizleme fiyatlandırması, model uç noktasının 15 Temmuz 2025'te planlanan kullanım dışı bırakılmasına kadar devam edecek ve bu tarihte kapatılacaktır. Genel kullanıma açık model "gemini-2.5-flash" sürümüne geçiş yapabilirsiniz.

Daha hızlı, daha ucuz, daha akıllı:

Tasarım hedefleri: düşük gecikme + yüksek aktarım hızı + düşük maliyet;
Akıl yürütme, çok modlu işleme ve uzun metin görevlerinde genel hızlanma;
Token kullanımı %20–30 oranında azaltılır; bu da akıl yürütme maliyetlerini önemli ölçüde düşürür.

Teknik Özellikler

Girdi Bağlam Penceresi: 1 milyon tokene kadar, kapsamlı bağlam tutmayı sağlar.

Çıktı Tokenları: Yanıt başına 8,192 tokene kadar üretebilir.

Desteklenen Modaliteler: Metin, görseller, ses ve video.

Entegrasyon Platformları: Google AI Studio ve Vertex AI üzerinden sunulur.

Fiyatlandırma: Rekabetçi, token tabanlı fiyatlandırma modeli; uygun maliyetli dağıtımı kolaylaştırır.

Teknik Ayrıntılar

Temelde, Gemini 2.5 Flash, web, kod, görsel ve video verilerinin bir karışımı üzerinde eğitilmiş transformer tabanlı bir büyük dil modelidir. Başlıca teknik özellikler şunlardır:

Çoklu Mod Eğitimi: Birden çok modaliteyi hizalayacak şekilde eğitilmiştir; Flash, metni görseller, video veya ses ile sorunsuz biçimde birleştirebilir; bu da video özetleme veya ses betimleme gibi görevlerde faydalıdır.

Dinamik Düşünme Süreci: Modelin, nihai çıktıdan önce planladığı ve karmaşık istemleri parçalara ayırdığı dahili bir akıl yürütme döngüsünü uygular.

Yapılandırılabilir Düşünme Bütçeleri: thinking_budget, 0 (akıl yürütme yok) ile 24,576 token arasında ayarlanabilir; bu da gecikme ile yanıt kalitesi arasında ödünleşimler yapılmasına olanak tanır.

Araç Entegrasyonu: Grounding with Google Search, Code Execution, URL Context ve Function Calling destekler; doğal dil istemlerinden doğrudan gerçek dünyaya yönelik eylemleri mümkün kılar.

Karşılaştırma (Benchmark) Performansı

Sıkı değerlendirmelerde, Gemini 2.5 Flash sektör lideri bir performans sergiler:

LMArena Hard Prompts: Zorlu Hard Prompts ölçütünde, yalnızca 2.5 Pro'nun ardından ikinci sırayı alarak güçlü çok adımlı akıl yürütme yeteneklerini gösterir.
0.809 MMLU Skoru: 0.809 MMLU doğruluğu ile ortalama model performansını aşar; geniş alan bilgisi ve akıl yürütme gücünü yansıtır.
Gecikme ve Throughput: 271.4 token/sn çözümleme hızı ve 0.29 s Time-to-First-Token ile, gecikmeye duyarlı iş yükleri için idealdir.
Fiyat-Performans Lideri: \$0.26/1 M token seviyesinde, Flash birçok rakibi fiyat açısından geride bırakırken, temel ölçütlerde onlara yetişir veya üstün gelir.

Bu sonuçlar, Gemini 2.5 Flash'ın akıl yürütme, bilimsel anlama, matematiksel problem çözme, kodlama, görsel yorumlama ve çok dilli yeteneklerdeki rekabet avantajını gösterir:

Sınırlamalar

Güçlü olmakla birlikte, Gemini 2.5 Flash'ın bazı sınırlamaları vardır:

Güvenlik Riskleri: Model, özellikle uç durum sorgularında, “ahlak dersi veren” bir ton sergileyebilir ve makul görünen ancak yanlış veya taraflı çıktılar (halüsinasyonlar) üretebilir. Sıkı insan denetimi kritik olmaya devam eder.
Oran Sınırları: API kullanımı, varsayılan katmanlarda (10 RPM, 250,000 TPM, 250 RPD) hız sınırlarıyla kısıtlanır; bu da toplu işlemeyi veya yüksek hacimli uygulamaları etkileyebilir.
Zekâ Eşiği: Bir flash model için son derece yetenekli olsa da, gelişmiş kodlama veya çoklu ajan koordinasyonu gibi en zorlu ajan temelli görevlerde 2.5 Pro kadar isabetli değildir.
Maliyet Ödünleşimleri: En iyi fiyat-performansı sunsa da, thinking modunun yoğun kullanımı genel token tüketimini artırır ve derin akıl yürütme gerektiren istemlerin maliyetini yükseltir。

Gemini 2.5 Flash için Fiyatlandırma

Gemini 2.5 Flash için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. Gemini 2.5 Flash'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.

gemini-2.5-flash (same price across variants)

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-2.5-flash	gemini-2.5-flash-thinking	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash-all	$0.24	$2.00
gemini-2.5-flash	gemini-2.5-flash	$0.24	$2.00

Gemini 2.5 Flash için örnek kod ve API

Gemini 2.5 Flash API, Google'ın en yeni çok modlu yapay zeka modelidir; yüksek hızda ve maliyet açısından verimli görevler için tasarlanmış, kontrol edilebilir akıl yürütme yeteneklerine sahiptir ve geliştiricilerin Gemini API aracılığıyla gelişmiş "düşünme" özelliklerini açıp kapatmasına olanak tanır.

Python
JavaScript
Curl

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Gemini 2.5 Flash Sürümleri

Gemini 2.5 Flash'nın birden fazla anlık görüntüye sahip olmasının nedeni; güncellemeler sonrası çıktı varyasyonları nedeniyle tutarlılık için eski anlık görüntülere ihtiyaç duyulması, geliştiricilere uyum ve geçiş için bir geçiş dönemi sağlanması ve kullanıcı deneyimini optimize etmek için küresel veya bölgesel uç noktalara karşılık gelen farklı anlık görüntüler içerebilir. Sürümler arasındaki detaylı farklar için lütfen resmi belgelere başvurun.

version
gemini-2.5-flash-image-preview
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-thinking
gemini-2.5-flash
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-image

Temel Bilgiler (Özellikler)

Gemini 2.5 Flash, Gemini 2.5 ailesi içinde onu öne çıkaran birkaç dikkat çekici özellik sunar:

Hibrit Akıl Yürütme: Geliştiriciler, modelin çıktıyı üretmeden önce içsel akıl yürütmeye ayırdığı token sayısını hassas biçimde kontrol etmek için thinking_budget parametresini ayarlayabilir.
Pareto Sınırı: Optimal maliyet-performans noktasında konumlanan Flash, 2.5 modelleri arasında en iyi fiyat-zekâ oranını sunar.
Çoklu Mod Desteği: Yerel olarak metin, görseller, video ve ses işler; daha zengin sohbet ve analitik yetenekler sağlar.
1 Milyon Token'lık Bağlam: Eşi benzeri olmayan bağlam uzunluğu, tek bir istekte derin analiz ve uzun belgelerin anlaşılmasını mümkün kılar.

Model Sürümleme

Gemini 2.5 Flash aşağıdaki temel sürümlerden geçmiştir:

gemini-2.5-flash-lite-preview-09-2025: Geliştirilmiş araç kullanılabilirliği: Karmaşık, çok adımlı görevlerde iyileştirilmiş performans; SWE-Bench Verified puanlarında %5 artış (48.9%'dan 54%'e). Geliştirilmiş verimlilik: Akıl yürütme etkinleştirildiğinde, daha az token ile daha yüksek kaliteli çıktı elde edilir; bu da gecikmeyi ve maliyetleri azaltır.
Preview 04-17: “Thinking” yeteneğine sahip erken erişim sürümü, gemini-2.5-flash-preview-04-17 aracılığıyla kullanılabilir.
Kararlı Genel Erişilebilirlik (GA): 17 Haziran 2025 itibarıyla, kararlı uç nokta gemini-2.5-flash, önizlemenin yerini alır ve 20 Mayıs önizlemesine göre API değişikliği olmadan üretim düzeyinde güvenilirlik sağlar.
Önizlemenin Kullanımdan Kaldırılması: Önizleme uç noktalarının 15 Temmuz 2025'te kapatılması planlandı; kullanıcıların bu tarihten önce GA uç noktasına geçmeleri gerekir.

Daha hızlı, daha ucuz, daha akıllı:

Tasarım hedefleri: düşük gecikme + yüksek aktarım hızı + düşük maliyet;
Akıl yürütme, çok modlu işleme ve uzun metin görevlerinde genel hızlanma;
Token kullanımı %20–30 oranında azaltılır; bu da akıl yürütme maliyetlerini önemli ölçüde düşürür.

Teknik Özellikler

Girdi Bağlam Penceresi: 1 milyon tokene kadar, kapsamlı bağlam tutmayı sağlar.

Çıktı Tokenları: Yanıt başına 8,192 tokene kadar üretebilir.

Desteklenen Modaliteler: Metin, görseller, ses ve video.

Entegrasyon Platformları: Google AI Studio ve Vertex AI üzerinden sunulur.

Fiyatlandırma: Rekabetçi, token tabanlı fiyatlandırma modeli; uygun maliyetli dağıtımı kolaylaştırır.

Teknik Ayrıntılar

Dinamik Düşünme Süreci: Modelin, nihai çıktıdan önce planladığı ve karmaşık istemleri parçalara ayırdığı dahili bir akıl yürütme döngüsünü uygular.

Karşılaştırma (Benchmark) Performansı

Sıkı değerlendirmelerde, Gemini 2.5 Flash sektör lideri bir performans sergiler:

LMArena Hard Prompts: Zorlu Hard Prompts ölçütünde, yalnızca 2.5 Pro'nun ardından ikinci sırayı alarak güçlü çok adımlı akıl yürütme yeteneklerini gösterir.
0.809 MMLU Skoru: 0.809 MMLU doğruluğu ile ortalama model performansını aşar; geniş alan bilgisi ve akıl yürütme gücünü yansıtır.
Gecikme ve Throughput: 271.4 token/sn çözümleme hızı ve 0.29 s Time-to-First-Token ile, gecikmeye duyarlı iş yükleri için idealdir.
Fiyat-Performans Lideri: \$0.26/1 M token seviyesinde, Flash birçok rakibi fiyat açısından geride bırakırken, temel ölçütlerde onlara yetişir veya üstün gelir.

Bu sonuçlar, Gemini 2.5 Flash'ın akıl yürütme, bilimsel anlama, matematiksel problem çözme, kodlama, görsel yorumlama ve çok dilli yeteneklerdeki rekabet avantajını gösterir:

Sınırlamalar

Güçlü olmakla birlikte, Gemini 2.5 Flash'ın bazı sınırlamaları vardır:

Güvenlik Riskleri: Model, özellikle uç durum sorgularında, “ahlak dersi veren” bir ton sergileyebilir ve makul görünen ancak yanlış veya taraflı çıktılar (halüsinasyonlar) üretebilir. Sıkı insan denetimi kritik olmaya devam eder.
Oran Sınırları: API kullanımı, varsayılan katmanlarda (10 RPM, 250,000 TPM, 250 RPD) hız sınırlarıyla kısıtlanır; bu da toplu işlemeyi veya yüksek hacimli uygulamaları etkileyebilir.
Zekâ Eşiği: Bir flash model için son derece yetenekli olsa da, gelişmiş kodlama veya çoklu ajan koordinasyonu gibi en zorlu ajan temelli görevlerde 2.5 Pro kadar isabetli değildir.
Maliyet Ödünleşimleri: En iyi fiyat-performansı sunsa da, thinking modunun yoğun kullanımı genel token tüketimini artırır ve derin akıl yürütme gerektiren istemlerin maliyetini yükseltir。

Gemini 2.5 Flash

Daha Fazla Model

Claude Opus 4.7

Claude Sonnet 4.6

GPT 5.5 Pro

GPT 5.5

GPT Image 2 ALL

GPT 5.5 ALL

İlgili Blog

Nano Banana 2 Flash Çok yakında – Yapay zekâ görsel üretiminin yüksek hızlı evrimi

Nano Banana indirimleri: Geliştiriciler için 2026'da gerçekten para tasarrufu

Ücretsiz Gemini 2.5 Pro API çöktü mü? 2025'te ücretsiz kota değişiklikleri

Nano-Muz için Nihai Kılavuz: En iyi sonucu elde etmek için nasıl kullanılır ve nasıl yönlendirilirsiniz?

Nano Banana API ile Nasıl Kullanılır?(Gemini-2-5-flash-image)