Google'ın Nano Muz Pro (resmi model kimliği gemini-3-pro-image-preview) Gemini 3 Pro'nun görüntü oluşturma/görüntü düzenleme versiyonudur. 2K/4K çıkış, yüksek doğrulukta çoklu görüntü kompozisyonu (en fazla 1080p) ekleyen, önizleme aşamasında profesyonel düzeyde bir görüntü modelidir. 14 referans görseli, karakter tutarlılığı 5 kişiye kadar), daha güçlü metin-görüntü işleme ve gerçek dünya gerçekliğine yönelik arama temeli.
Temel özellikler
- Metin → Resim: güçlü istem uyumu ile tam istem odaklı üretim.
- Resim → Resim (düzenlemeler): birden fazla düzenlemede konu/karakter tutarlılığını koruyan ince, hedefli düzenlemeler.
- Maksimum çıkış çözünürlüğü: kadar 4K (örnekler ve desteklenen kesin piksel boyutları en boy oranına bağlıdır; API 1K/2K/4K ön ayarlarını gösterir)
- Tekrarlı planlama ve kendi kendini düzeltme: Yaygın görsel hataları (perspektif, metin, ince geometri) tespit edip düzelten dahili bir "çok aşamalı" işlem hattı.
- Gelişmiş görüntü içi metin oluşturma: posterler, maketler ve infografikler için uygun, net, okunaklı çok dilli metin (kısa başlıklardan uzun paragraflara kadar).
- 5 karakter ve sadakat 14 nesne/referans görseli tek bir iş akışında.
- Filigranlama / menşei: Oluşturulan tüm görseller bir SynthID filigranı içerir; model bazı ürün entegrasyonlarında menşe için C2PA meta verilerini gömer.
Gemini 3 Pro Görüntü sürümleri ve adlandırma
gemini-3-pro-image-previewgemini-3-pro-image
Teknik detaylar
mimari
- Soy / omurga: Nano Banana Pro, Google'ın gelişen Gemini görüntü yığını üzerine inşa edilecek; özellikle de yeni Gemini 3 Pro Görüntüsü / GEMPIX 2 mimari (daha yüksek kapasiteli çok modlu görüntü+metin çerçevesi). Bu, bir evrimdir Gemini 2.5 Flash Görüntüsü (orijinal “nano-muz”) genişletilmiş görsel-dil muhakeme yeteneklerine sahip doğal olarak çok modlu bir görüntü modeline dönüştürüldü.
- Model davranış: yerel çoklu modalite (görüntü + metin + dünya bilgisi), çoklu görüntü birleştirme için açık kanallar ve tek bir statik örnek üretmek yerine çıktıları birden fazla geçişte iyileştiren dahili aşamalı bir planlayıcı. İlk raporlar, önceki versiyonlara kıyasla daha güçlü geometrik/optik akıl yürütme (cam, kırılma) olduğunu gösteriyor.
- Düşünme / içsel iyileştirme: Model, kompozisyonu iyileştirmek için dahili olarak görünür bir "düşünme" süreci kullanır (API bu davranışı belgelendirir ve bu dahili adımların son görüntü belirteçleri olarak ücretlendirilmediğini belirtir).
- Topraklama ve aletler: Destekler Arama topraklaması (Web verilerini diyagram/infografik oluşturmaya dahil edebilir). Ayrıca daha kesin kontrol için sistem talimatlarını da destekler.
Temel API parametreleri:
thinking_level(düşük / yüksek) gecikme ile muhakeme derinliği arasındaki ticareti yapmak için;media_resolution(düşük/orta/yüksek) görüntü OCR/detay okuma belirteçlerini kontrol etmek için;generationConfig.imageConfigGörüntü çıktılarında en boy oranını/çözünürlüğü kontrol etmek için.
Görüntü sınırları:
- Desteklenen giriş biçimleri: Metin ve görseller (model, görüntü oluşturma girdileri olarak ses veya videoyu kabul etmez).
- Her komut için maksimum resim sayısı: 14 (Gemini 3 Pro Görüntü önizlemesi için).
- Maksimum resim boyutu (yükleme): Giriş resmi başına 7 MB.
- Desteklenen en boy oranları: 1:1, 3:2, 16:9, 9:16, 21:9, vb.
Çıktı görüntüleri / belirteçleri: yüksek limitler, 4K/4096px desteği.
Karşılaştırma performansı
Kısa özet: Şimdiye kadarki genel/ilk kıyaslamaların çoğu nitel/topluluk odaklı olsa da, orijinal nano-muza (Gemini 2.5 Flash Görüntüsü) kıyasla çözünürlük, eser azaltma ve fiziksel doğrulukta önemli iyileştirmeler sürekli olarak bildiriliyor. Belirli adlandırılmış "zorluklar" belirgin görsel kazanımlar gösterdi, ancak Google'ın standart görüntü oluşturma metrikleri genelinde v1 → v2'yi karşılaştıran (genel) standartlaştırılmış sayısal kıyaslama tabloları henüz mevcut değil.
- Nitel topluluk testleri: Daha temiz kenarlar, daha keskin mikro detaylar, daha gerçekçi renkler ve daha sadık anında uyum (daha az halüsinasyonlu aksesuar, daha tutarlı karakterler). Popüler gayriresmi testler arasında, GEMPIX2'nin (Nano Banana Pro) şeffaflık ve kırılmayı önceki sürümlere göre belirgin şekilde daha iyi yönettiği "Şarap Kadehi Testi" ve "Cam Burger Mücadelesi" yer alıyor.
- Metin işleme: Nano Banana Pro, görsellerin içindeki tipografi ve metin yerleşiminde gözle görülür bir iyileşme gösteriyor (birçok görsel modeli için kalıcı bir zayıflık). Topluluk karşılaştırmaları, daha az bozuk işlenmiş glif olduğunu gösteriyor.
- Verim / UX: daha hızlı yineleme hızı ve kullanıcıların ilk geçişte daha güvenilir sonuçlar görmesini sağlayan (manuel yeniden başlatmaları azaltan) arka uçta çok aşamalı iyileştirme gerçekleştiren bir UX.
Sınırlamalar ve riskler
- İçerik filtreleri ve algılama: Modeli entegre eden platformlar (örneğin Whisk/üçüncü taraf uygulamalar) sıkı ünlü veya benzerlik tespitini etkinleştirebilir ve belirli çıktıları engelleyebilir; bu da gerçekçi ünlü benzerliklerine dayanan yaratıcı iş akışlarını etkiler.
- Halüsinasyon / akıl yürütme uç durumları: geliştirilmiş olmasına rağmen, model hala fiziksel olarak gerçekçi olmayan eserler üretebiliyor, özellikle de görsellerin içindeki yoğun sembolik metinler veya oldukça teknik diyagramlar söz konusu olduğunda — ancak NB2'nin bu hataları önceki sürümlere kıyasla azalttığı görülüyor.
- Güvenlik ve yanlış kullanım: Üretken görüntü modelleri, sorunlu veya zararlı içerik oluşturmak için kullanılabilir. Google, menşei belirlemek için kısıtlamalar, içerik filtreleri ve SynthID filigranı uygular; ancak yine de kötüye kullanımlar meydana gelmiştir (siyasi açıdan hassas bir ortamda Nano Banana tarafından oluşturulan bir görüntüyle ilgili yüksek profilli bir tartışma).
Nano Banana Pro diğer modellerle nasıl karşılaştırılır?
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Görüntüsü) — güçlü mobil entegrasyon, çoklu görüntü birleştirme, yinelemeli kendi kendini düzeltme, 2K yerel/4K yükseltme, Google uygulamalarına (Arama, Fotoğraflar, Workspace/Gemini) sıkı bir şekilde entegre. Güvenilir düzenlemeler, süreklilik ve Google hizmetleriyle entegrasyon gerektiren iş akışları için idealdir.
- yolculuk — stilize edilmiş sanatsal çıktılar ve topluluk odaklı hızlı mühendislikte üstündür; genellikle fotoğraf doğruluğunda çoklu görüntü birleştirme veya derin çok modlu düzenleme hatlarını hedeflemez.
- Kararlı Difüzyon / açık ağırlıklar — tamamen açık, son derece özelleştirilebilir ve yerel olarak barındırılabilir; kontrol noktaları ve ince ayar ekosistemi, araştırma ve çevrimdışı kullanım için belirleyici bir avantajdır. Nano Banana Pro'ya kıyasla daha az "tek tıklamayla" mobil entegrasyon ve kullanıma hazır çoklu görüntü düzenleme tutarlılığı daha azdır.
- Seedream 4.0 (ByteDance) — son zamanlarda açıkça Nano Banana'nın rakibi olarak konumlandırıldı; ultra hızlı işleme, 2K çıktı ve çok sayıda referans görüntü desteği (altıya kadar) vurgulandı. Profesyonel/yaratıcı alternatifi olarak konumlandırıldı.
(Bu karşılaştırmalar üst düzeydir; aracı iş akışınıza uydurarak bir kazanan seçin: açıklık/özelleştirilebilirlik → Kararlı Difüzyon; stilize sanat → Midjourney; agresif yinelemeyle entegre, tutarlı mobil düzenleme → Nano Banana Pro/ Gemini 3 Pro görüntü ailesi.)
Gerçek dünya kullanım örnekleri
- Mobil fotoğraf düzenleme ve yaratıcı filtreler (Google Fotoğraflar entegrasyonları — yeniden şekillendirme, arka plan birleştirme, portre yeniden kompozisyonu).
- Pazarlama ve reklam varlıkları — hızlı konsept oluşturma, birden fazla çerçeve/açıda tutarlı marka karakterleri.
- Konsept sanatı ve hikaye panosu — çoklu görüntü birleştirme, paneller arasında karakter sürekliliğinin korunmasına yardımcı olur.
- E-ticaret / ürün maketleri — farklı bağlamlarda/ışık koşullarında tutarlı ürün çekimleri oluşturun.
- AR/VR varlıkları için hızlı prototipleme — sürükleyici kullanımlar için yükseltilebilen yüksek kaliteli 2K/4K çıkışlar.
gemini-3-pro-image nasıl çağrılırNano Muz Pro) API
CometAPI'de Nano Banana API Fiyatlandırması, resmi fiyattan %20 indirim:
| Fiyat | $0.19200 |
Gerekli Adımlar
- Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
- Bu sitenin URL'sini alın: https://api.cometapi.com/
Kullanım Yöntemi
- "Seçin
gemini-3-pro-image” API isteğini göndermek ve istek gövdesini ayarlamak için uç nokta. İstek yöntemi ve istek gövdesi web sitemizin API belgesinden elde edilir. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. - Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
- Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
- . Üretilen cevabı almak için API yanıtını işleyin.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar:
- Temel URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Model İsimleri:
gemini-3-pro-image - Kimlik doğrulama:
Bearer YOUR_CometAPI_API_KEYbaşlık - İçerik türü:
application/json.
Ayrıca bakınız Gemini 2.5 Flash Görüntü API'si (Nano-Muz)



