The Gemini 2.5 Flash-Lite API Google'ın hibrit akıl yürütme modelleri ailesindeki en son ürününü temsil ediyor ve sunmak üzere tasarlandı eşsiz maliyet etkinliği ve ultra düşük gecikme Yüksek hacimli, gecikmeye duyarlı uygulamalar için.
Temel Bilgiler ve Özellikler
17 Haziran 2025'te bir önizleme sürümünde duyurulan Flash-Lite, geliştiricilere Flash ve Pro'nun yanı sıra Gemini 2.5 serisini tamamlıyor ve şu amaçlar için optimize edilmiş bir seçenek sunuyor: hız, Fiyat performansı, ve uyarlanabilir düşünme yetenekler .
Kodunuzda "gemini-2.5-flash-lite" belirterek Gemini 2.5 Flash-Lite'ı kullanmaya başlayabilirsiniz. Önizleme sürümünü kullanıyorsanız, önizleme sürümüyle aynı olan "gemini-2.5-flash-lite"a geçebilirsiniz. Google, Flash-Lite için önizleme takma adını 25 Ağustos'ta kaldırmayı planlıyor.
| istikrar | Model | Tarih |
| Kararlı (GA) | gemini-2.5-flash-lite | Temmuz 22, 2025 |
| Deneysel Önizleme | gemini-2.5-flash-lite-06-17 | Kullanılabilirlik Aralığı: 17 Haziran - 25 Ağustos 2025 |
| en son versiyon | gemini-2.5-flash-lite-preview-09-2025 | 09-2025 |
- Düşünce Kontrolü: Birini uygular dinamik düşünme bütçesi bir API parametresi aracılığıyla, düşünmeyle varsayılan olarak devre dışı hızı en üst düzeye çıkarmak ve maliyeti azaltmak.
- Düşük gecikme süresi: Bir amaç için tasarlanmıştır hızlı zaman-ilk-token'aFlash-Lite, standart Google Cloud altyapısında 100 ms'nin altındaki gecikmelere ulaşarak başlatma yükünü en aza indirir.
- Yüksek Verimlilik:Yetenekli kod çözme boru hatları ile sürdürülür saniyede yüzlerce token, sohbet robotlarında ve yayın uygulamalarında gerçek zamanlı kullanıcı deneyimlerinin kilidini açıyor.
- Çok Modlu Destek: Flash-Lite, öncelikli olarak metin için optimize edilmiş olsa da, şunları da kabul eder: görüntüleri, ses, ve video Gemini API'si üzerinden girdiler, belge özetlemeden ışık görüşü görevlerine kadar çok yönlü kullanım durumlarını mümkün kılar.
Teknik detaylar
- Uyarlanabilir Muhakeme:
Gemini 2.5 Flash-Litetalep üzerine destek düşünmeGeliştiricilerin yalnızca daha derin akıl yürütme gerektiğinde hesaplama kaynaklarını tahsis etmelerine olanak tanır. - Araç Entegrasyonları: Gemini 2.5'in yerel araçlarıyla tam uyumluluk, şunlar dahil: Google Arama ile Topraklama, Kod Yürütme, URL Bağlamı, ve İşlev Çağırma sorunsuz çok modlu iş akışları için.
- Model Bağlam Protokolü (MCP): Gerçek zamanlı web verilerini almak için Google'ın MCP'sinden yararlanır ve yanıtların doğru olduğundan emin olur aktüel ve bağlamsal olarak alakalı.
- Dağıtım Seçenekleri: Şu şekilde mevcuttur: Kuyrukluyıldız API'si, Gemini API'si, Vertex AI, ve Google AI Stüdyosu, erken benimseyenlerin deneyip geri bildirim sağlayabileceği bir önizleme yolu ile.
Performans Karşılaştırması Gemini 2.5 Flash-Lite
- Gecikme: Şu kadar başarır: %50 daha düşük ortalama yanıt süreleri Gemini 2.5 Flash ile karşılaştırıldığında, tipik 100 ms'nin altında Standart sınıflandırma ve özetleme ölçütlerindeki gecikmeler.
- çıktı: İçin optimize edilmiştir yüksek ses iş yüklerini karşılayarak, performansta herhangi bir düşüş olmadan dakikada on binlerce isteği karşılayabilir.
- Fiyat-Performans: Bir şeyi gösterir 25 token başına maliyette %1,000 azalma Flash muadiliyle karşılaştırıldığında, onu Pareto-optimal Maliyet açısından hassas dağıtımlar için tercih.
- Endüstri Kabulü: İlk kullanıcılar, performans ölçümlerinin ilk projeksiyonlarla uyumlu veya onları aşan şekilde üretim hatlarına sorunsuz bir şekilde entegre olduğunu bildiriyor.

İdeal Kullanım Durumları
- Yüksek Frekanslı, Düşük Karmaşıklıktaki Görevler: Otomatik etiketleme, duygu analizi ve toplu çeviri
- Maliyet Duyarlı Boru Hatları: Büyük belge gövdelerinden veri çıkarma, periyodik toplu özetleme
- Edge ve Mobil Senaryolar: Gecikme kritik öneme sahip olduğunda ancak kaynak bütçeleri sınırlı olduğunda
Sınırlamaları Gemini 2.5 Flash-Lite
- Önizleme Durumu: GA'dan önce API değişikliklerine uğrayabilir; entegrasyonlar olası sürüm artışlarını hesaba katmalıdır.
- Anında İnce Ayar Yok: Özel ağırlıklar yüklenemiyor; hızlı mühendislik ve sistem mesajlarına güvenin.
- Azaltılmış Yaratıcılık:Belirleyici, yüksek verimli görevler için ayarlanmıştır; açık uçlu üretim veya "yaratıcı" yazım için daha az uygundur.
- Kaynak Tavanı: Yalnızca ~16 vCPU'ya kadar doğrusal olarak ölçeklenir; bundan sonra, verim kazanımları azalır.
- Çok Modlu Kısıtlamalar: Görüntü/ses girişlerini destekler ancak sınırlı doğrulukla; yoğun görsel veya ses transkripsiyon görevleri için ideal değildir.
- Bağlam-Pencere Takası : 1 milyon token'a kadar kabul etmesine rağmen, bu ölçekte pratik çıkarımlar verimin düşmesine neden olabilir.
Nasıl aranır Gemini 2.5 Flash-Lite CometAPI'den API
Gemini 2.5 Flash-Lite CometAPI'de API Fiyatlandırması, resmi fiyattan %20 indirim:
- Giriş Jetonları: $0.08/M jeton
- Çıktı Tokenları: 0.32$/M token
Gerekli Adımlar
- Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
- Bu sitenin URL'sini alın: https://api.cometapi.com/
Kullanım Yöntemleri
- "Seçin**
gemini-2.5-flash-lite**” API isteğini göndermek ve istek gövdesini ayarlamak için uç nokta. İstek yöntemi ve istek gövdesi web sitemizin API belgesinden elde edilir. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. - Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
- Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
- . Üretilen cevabı almak için API yanıtını işleyin.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar API belgesi:
- Temel URL: https://api.cometapi.com/v1/chat/completions
- Model İsimleri: "
gemini-2.5-flash-lite" - Kimlik doğrulama:
Bearer YOUR_CometAPI_API_KEYbaşlık
Ayrıca bakınız İkizler 2.5 Pro
