Temel özellikler
- Metin → Görüntü: tamamen istem odaklı üretim, güçlü istem uyumu.
- Görüntü → Görüntü (düzenlemeler): ince ve hedefli düzenlemeler; birden çok düzenlemede konu/karakter tutarlılığı korunur.
- Maksimum çıktı çözünürlüğü: en fazla 4K (örnekler ve desteklenen kesin piksel boyutları en-boy oranına bağlıdır; API 1K/2K/4K hazır ayarları sunar)
- Yinelemeli planlama ve öz-düzeltme: perspektif, metin, ince geometri gibi yaygın görsel hataları tespit edip düzelten dahili “çok aşamalı” bir hat.
- Görsel içi gelişmiş metin işleme: posterler, maketler ve infografikler için uygun, net ve okunaklı çok dilli metin (kısa altyazılardan uzun paragraflara).
- Tek bir iş akışında 5 karakter ve en fazla 14 nesne/referans görseli için yüksek sadakat.
- Filigranlama / köken: üretilen tüm görseller SynthID filigranı içerir; model bazı ürün entegrasyonlarında köken için C2PA meta verilerini gömer.
Gemini 3 Pro Image sürümleri ve adlandırma
gemini-3-pro-image-previewgemini-3-pro-image
Teknik ayrıntılar
Mimari
- Soy/köken / omurga: Nano Banana Pro, Google’ın gelişen Gemini görsel yığını üzerine — özellikle yeni Gemini 3 Pro Image / GEMPIX 2 mimarisi (daha yüksek kapasiteli çok modlu görüntü+metin çerçevesi) — inşa edilmiştir. Bu, Gemini 2.5 Flash Image’dan (“nano-banana”ın özgün sürümü) genişletilmiş görsel-dil akıl yürütme yeteneklerine sahip, doğal olarak çok modlu bir görsel modele evrildir.
- Model davranışı: doğal çok modluluk (görüntü + metin + dünya bilgisi), çoklu görüntü füzyonu için açık hatlar ve tek bir statik örnek yerine birden çok geçişte çıktıları iyileştiren dahili aşamalı bir planlayıcı. İlk raporlar, önceki sürümlere kıyasla daha güçlü geometrik/optik akıl yürütmeye (cam, kırılma) işaret ediyor.
- Düşünme / dahili iyileştirme: Model, kompozisyonu iyileştirmek için dahili olarak görünür bir “düşünme” süreci kullanır (API bu davranışı belgelendirir ve bu dahili adımların nihai görsel belirteçleri olarak ücretlendirilmediğini belirtir).
- Dayanaklama ve araçlar: Search grounding desteklenir (web olgularını diyagram/infografik üretimine dahil edebilir). Daha deterministik kontrol için sistem talimatlarını da destekler.
Temel API parametreleri:
thinking_level(low / high): gecikme ile akıl yürütme derinliği arasında tercih;media_resolution(low/medium/high): görsel OCR/ayrıntı okuma belirteçlerini kontrol eder;generationConfig.imageConfig: görsel çıktılarda en-boy oranı/çözünürlüğü kontrol eder.
Görsel sınırları:
- Desteklenen giriş kipleri: Metin ve görseller (model, görüntü üretimi için ses veya video kabul etmez).
- Bir istem başına en fazla görsel sayısı: 14 (Gemini 3 Pro Image önizlemesi için).
- Maksimum görsel boyutu (yükleme): Girdi başına 7 MB.
- Desteklenen en-boy oranları: 1:1, 3:2, 16:9, 9:16, 21:9, vb.
Çıktı görselleri / tokenlar: yüksek sınırlar, 4K/4096px desteklenir.
Kıyaslama performansı
Kısa özet: kamuya açık/erken kıyaslamalar çoğunlukla nitel/topluluk odaklıdır; ancak çözünürlük, yapaylıkların azaltılması ve fiziksel sadakatte orijinal nano-banana’ya (Gemini 2.5 Flash Image) kıyasla tutarlı iyileşmeler rapor edilmiştir. Belirli adlandırılmış “meydan okumalar”da açık görsel kazanımlar görülse de Google’dan v1 → v2 karşılaştırmalı, standart görsel üretim metriklerine dair (kamuya açık) sayısal tablolar henüz yoktur.
- Nitel topluluk testleri: Daha temiz kenarlar, daha keskin mikro ayrıntılar, daha doğru renkler ve isteğe daha sadık üretim (daha az uydurma nesne, daha tutarlı karakterler). Popüler gayriresmi testlere, GEMPIX2’nin (Nano Banana Pro) saydamlık ve kırılmayı önceki derlemelere göre belirgin biçimde daha iyi ele aldığı “Wine Glass Test” ve “Glass Burger Challenge” dahildir.
- Metin işleme: Nano Banana Pro, görsellerin içindeki tipografi ve metin yerleşiminde gözle görülür gelişme gösterir (birçok görsel model için kalıcı bir zayıflık). Topluluk karşılaştırmaları, bozulmuş gliflerin azaldığını gösterir.
- Verim / UX: Daha hızlı yineleme hızı ve arka uçta çok aşamalı iyileştirme gerçekleştiren bir UX; böylece kullanıcılar daha güvenilir ilk geçiş sonuçları görür (manuel yeniden denemeleri azaltır).
Sınırlamalar ve riskler
- İçerik filtreleri ve tespit: Modeli entegre eden platformlar (örn. Whisk/üçüncü taraf uygulamalar) katı ünlü veya benzerlik tespiti etkinleştirebilir ve belirli çıktıları engelleyebilir; bu da gerçekçi ünlü benzerliklerine dayanan yaratıcı iş akışlarını etkiler.
- Halüsinasyon / akıl yürütme uç durumları: iyileştirilmiş olsa da model hâlâ fiziksel olarak gerçekçi olmayan yapaylıklar üretebilir, özellikle yoğun sembolik metin içeren görsellerde veya yüksek teknik diyagramlarda — yine de NB2’nin önceki sürümlere kıyasla bu hataları azalttığı görülmektedir.
- Güvenlik ve kötüye kullanım: üretken görsel modeller sorunlu veya zararlı içerik oluşturmak için kullanılabilir. Google, köken için SynthID filigranı ve kısıtlar uygular; buna rağmen kötüye kullanım vakaları görülmüştür (siyasi açıdan hassas bir bağlamda Nano Banana tarafından üretilen bir görselle ilgili yüksek profilli bir tartışma).
Nano Banana Pro’nun diğer modellerle karşılaştırması
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — güçlü mobil entegrasyon, çoklu görsel füzyonu, yinelemeli öz-düzeltme, 2K yerel/4K yükseltme, Google uygulamalarıyla (Search, Photos, Workspace/Gemini) sıkı entegrasyon. Güvenilir düzenleme, süreklilik ve Google hizmetleriyle entegrasyon gerektiren iş akışları için en iyisi.
- Midjourney — stilize sanatsal çıktılarda ustadır ve topluluk odaklı istem mühendisliğinde öne çıkar; foto-gerçek çoklu görsel füzyonu veya derin çok modlu düzenleme hatları hedefi değildir.
- Stable Diffusion / açık ağırlıklar — tamamen açık, yüksek özelleştirilebilir ve yerelde barındırılabilir; denetim noktaları ve ince ayar ekosistemi, araştırma ve çevrimdışı kullanım için belirleyici bir avantajdır. Nano Banana Pro’ya kıyasla tek tıkla mobil entegrasyon daha az ve kutudan çıktığı haliyle çoklu görsel düzenleme tutarlılığı daha düşüktür.
- Seedream 4.0 (ByteDance) — kendini yakın zamanda açıkça bir Nano Banana rakibi olarak konumlandırdı; ultra hızlı oluşturma, 2K çıktı ve çok sayıda referans görsel desteğini (altıya kadar) vurgular. Profesyonel/yaratıcılar için bir alternatif olarak konumlanır.
(Bu karşılaştırmalar üst düzeydedir; kazananı iş akışınıza göre seçin: açıklık/özelleştirilebilirlik → Stable Diffusion; stilize sanat → Midjourney; entegre, tutarlı mobil düzenleme ve agresif yineleme → Nano Banana Pro / Gemini 3 Pro görüntü ailesi.)
Gerçek dünyadaki kullanım alanları
- Mobil foto düzenleme ve yaratıcı filtreler (Google Photos entegrasyonları — yeniden stil verme, arka plan füzyonu, portre yeniden kompozisyon).
- Pazarlama ve reklam varlıkları — hızlı kavram üretimi, birden fazla kare/açıda tutarlı marka karakterleri.
- Konsept sanat ve storyboard — çoklu görsel füzyonu paneller arasında karakter sürekliliğine yardımcı olur.
- E-ticaret / ürün maketleri — farklı bağlam/ışık koşullarında tutarlı ürün çekimleri üretin.
- AR/VR varlıkları için hızlı prototipleme — 2K/4K yüksek kaliteli çıktılar; sürükleyici kullanımlar için yükseltilebilir.
- gemini-3-pro-image(Nano Banana Pro) API’ye nasıl erişilir
Gerekli Adımlar
- cometapi.com’a giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun.
- Arayüzün erişim kimlik bilgisi API anahtarını alın. Kişisel merkezde API token bölümünde “Token Ekle”ye tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
- Bu sitenin URL’sini alın:
https://api.cometapi.com/
Kullanım Yöntemi
- API isteğini göndermek için “
gemini-3-pro-image” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanında bulunur. Kolaylık için web sitemiz Apifox testi de sağlar. - <YOUR_API_KEY> değerini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin.
- Soru veya isteğinizi content alanına ekleyin — modele yanıtlayacağı şey budur.
- API yanıtını işleyerek oluşturulan cevabı alın.
CometAPI sorunsuz geçiş için tamamen uyumlu bir REST API sağlar — kesintisiz geçiş. Temel ayrıntılar :
- Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Model Names:
gemini-3-pro-image - Authentication:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.