Gemini 2.5 Flash Image (diğer adıyla "Nano banana"), Google'ın Gemini 2.5 ailesindeki en yeni yerel görüntü oluşturma ve düzenleme modelidir. Çoklu görüntü birleştirme, hassas doğal dil düzenlemeleri ve hızlı çok modlu iş akışlarına odaklanır.
Modele giriş
Nedir — Gemini 2.5 Flash Görüntüsü Gemini 2.5 ailesi üzerine inşa edilmiş çok modlu bir görüntü oluşturma ve düzenleme modelidir. fotogerçekçi görüntülergerçekleştirmek hedeflenen düzenlemeler (iç boyama, stil transferi, nesne takasları) ve birden fazla kaynak görüntüsünü harmanla Gemini'nin gelişmiş dil muhakemesini kompozisyonu ve semantiği kontrol etmek için kullanırken, tek bir tutarlı çıktıya dönüştürün.
anahtar özellikler
- Yerel görüntü oluşturma ve düzenleme — Doğal dil komutları aracılığıyla görseller oluşturun veya mevcut fotoğrafları düzenleyin. (Oluştur / Düzenle).
- Çoklu görüntü füzyonu — birden fazla giriş görüntüsünü tek bir fotogerçekçi sahnede birleştirin.
- Karakter tutarlılığı — Düzenlemeler ve istemler boyunca aynı konuyu veya karakter görünümünü koruyun. (Tutarlılık).
- SynthID filigranı — tüm çıktılar şunları içerir: görünmez SynthID Yapay zeka tarafından üretilen içeriği tespit etmek için. (Filigran).
Teknik detaylar
- Mimari ve konumlandırma: Gemini 2.5 Flash ailesi üzerine inşa edilmiş - bir düşük gecikme süresi Önceki Flash katmanlarına göre daha güçlü mantığı korurken, çağrı başına çok daha hızlı yanıt ve maliyet verimliliği karşılığında küçük bir model boyutu/veriminden feragat eden "Flash" çeşidi.
- Giriş biçimleri ve sınırlamalar: kabul eder satır içi base64 görüntüleri küçük girdiler için ve dosya yüklemeleri Daha büyük resimler için Dosya API'si aracılığıyla (>20 MB için önerilir). Yaygın MIME türlerini (JPEG, PNG) destekler.
- Operasyon modları: metinden resme dönüştürme, görüntü düzenleme (iç boyama / anlamsal maskeleme), stil aktarımı, çoklu görüntü kompozisyonu ve aralıklı metin+resim yanıtları (resimli talimatlar, tarifler veya karışık içerikler için kullanışlıdır).
- Menşei ve güvenlik mekanizmaları: AI çıktılarında görünür filigranlar artı gizli SynthID işaretleyicileri ve açıkça izin verilmeyen içeriği sınırlamak için politika uygulama katmanları.
Karşılaştırma performansı

Sınırlamalar ve bilinen riskler
- İçerik politikası kısıtlamaları: modeller içerik politikalarını uygular (örneğin, açık cinsel içeriklere ve bazı yasa dışı içeriklere izin vermeme), ancak uygulama mükemmel değildir; bazı senaryolarda kamu figürlerinin veya tartışmalı simgelerin görüntülerini oluşturmak hala mümkün olabilir, bu nedenle politika kontrolleri esastır. )
- Başarısızlık modları: mümkün kimlik kayması aşırı düzenlemelerde, ara sıra semantik uyumsuzluklarda (istemler yeterince belirtilmediğinde) ve çok karmaşık sahnelerde veya aşırı bakış açısı değişikliklerinde eserler.
- Menşei ve kötüye kullanımı: filigranlar ve SynthID mevcut olsa da, bunlar kötüye kullanımı engellemez; tespit ve atıf konusunda yardımcı olurlar ancak hassas iş akışlarında insan incelemesinin yerini tutmazlar.
Tipik kullanım durumları
- Ürün ve e-ticaret: ürünleri yaşam tarzı çekimlerine yerleştirin/kataloglayın çoklu görüntü birleştirme yoluyla.
- Yaratıcı araçlar / tasarım: hızlı yinelemeler tasarım uygulamalarında (Adobe Firefly entegrasyonundan bahsedilmektedir).
- Fotoğraf düzenleme ve rötuşlama: doğal dilden yerelleştirilmiş düzenlemeler (nesneleri kaldır, renk/aydınlatmayı değiştir, yeniden şekillendir).
- Hikaye anlatımı / karakter varlıkları: karakterleri tutarlı tutun paneller ve sahneler arasında.
Nasıl aranır Gemini 2.5 Flash Görüntüsü CometAPI'den API
Gemini 2.5 Flash Image CometAPI'de API Fiyatlandırması, resmi fiyattan %20 indirim:
| Fiyat | $0.3120 |
Gerekli Adımlar
- Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
- Bu sitenin URL'sini alın: https://api.cometapi.com/
Kullanım Yöntemi
- "Seçin
Gemini-2.5 Flash-Image” API isteğini göndermek ve istek gövdesini ayarlamak için uç nokta. İstek yöntemi ve istek gövdesi web sitemizin API belgesinden elde edilir. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. - Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
- Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
- . Üretilen cevabı almak için API yanıtını işleyin.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar API belgesi:
- Son nokta:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Model Parametresi: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
- Kimlik doğrulama:
Bearer YOUR_CometAPI_API_KEY - İçerik türü:
application/json.
Not: API'yi çağırırken “stream” parametresini true olarak ayarlayın.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Ayrıca bakınız GPT-görüntü-1 API'si



