Temel özellikler
- Metin → Görsel: güçlü prompt uyumuyla tam prompt odaklı üretim.
- Görsel → Görsel (düzenlemeler): birden çok düzenleme boyunca özne/karakter tutarlılığı korunarak hassas, hedefli düzenlemeler.
- Maksimum çıktı çözünürlüğü: 4K’ya kadar (örnekler ve desteklenen kesin piksel boyutları en-boy oranına bağlıdır; API 1K/2K/4K hazır ayarlarını sunar)
- Yinelemeli planlama ve öz-düzeltme: perspektif, metin, ince geometriler gibi yaygın görsel hataları tespit edip düzelten dahili “çok aşamalı” boru hattı.
- Gelişmiş görsel içi metin işleme: posterler, maketler ve infografikler için uygun, net ve okunaklı çok dilli metin (kısa başlıklardan uzun paragraflara).
- Tek bir iş akışında 5 karakter ve en fazla 14 nesne/referans görseli için sadakat.
- Filigran / orijin: üretilen tüm görseller SynthID filigranı içerir; model bazı ürün entegrasyonlarında orijin için C2PA meta verilerini gömer.
Gemini 3 Pro Image sürümleri ve adlandırma
gemini-3-pro-image-previewgemini-3-pro-image
Teknik ayrıntılar
Mimari
- Soy/omurga: Nano Banana Pro, Google’ın gelişen Gemini görsel yığını üzerine kuruludur — özellikle yeni Gemini 3 Pro Image / GEMPIX 2 mimarisi (daha yüksek kapasiteli görsel+metin çok modlu çerçeve). Bu, Gemini 2.5 Flash Image’dan (orijinal “nano-banana”) yerel olarak çok modlu, genişletilmiş görsel-dil akıl yürütme yeteneklerine sahip bir görsel modele evrimdir.
- Model davranışı: yerel çok kipli (görsel + metin + dünya bilgisi), çoklu görsel füzyonu için açık işlem hatları ve tek bir statik örnek üretmek yerine çıktıları birden çok geçişte rafine eden dahili aşamalı bir planlayıcı. İlk raporlar, önceki sürümlere kıyasla daha güçlü geometrik/optik akıl yürütmeyi (cam, kırılma) gösteriyor.
- Düşünme / dahili rafine etme: model, kompozisyonu rafine etmek için dahili olarak görünür bir “thinking” süreci kullanır (API bu davranışı belgeliyor ve bu dahili adımların nihai görsel belirteçleri olarak ücretlendirilmediğini belirtir).
- Dayandırma ve araçlar: Search grounding desteklenir (web gerçekleri diyagram/infografik üretimine dahil edilebilir). Daha deterministik kontrol için sistem talimatlarını da destekler.
Temel API parametreleri:
thinking_level(low / high): gecikme ile akıl yürütme derinliği arasında denge kurar;media_resolution(low/medium/high): görsel OCR/ayrıntı okuma belirteçlerini kontrol eder;generationConfig.imageConfig: görsel çıktılarda en-boy oranı/çözünürlüğü kontrol eder.
Görsel sınırları:
- Desteklenen giriş kipleri: Metin ve görseller (model, görsel üretimi için ses veya videoyu kabul etmez).
- Prompt başına en fazla görsel: 14 (Gemini 3 Pro Image preview için).
- Maksimum görsel boyutu (yükleme): giriş görseli başına 7 MB.
- Desteklenen en-boy oranları: 1:1, 3:2, 16:9, 9:16, 21:9, vb.
Çıktı görselleri / belirteçler: yüksek sınırlar; 4K/4096px desteklenir.
Kıyaslama performansı
Kısa özet: kamuya açık/erken kıyaslamalar çoğunlukla niteliksel / topluluk odaklıdır, ancak orijinal nano-banana’ya (Gemini 2.5 Flash Image) kıyasla çözünürlük, artefakt azaltma ve fiziksel sadakatte tutarlı iyileştirmeler bildirilmektedir. Belirli adlandırılmış “meydan okumalar” net görsel kazanımlar göstermiştir; yine de Google’dan v1 → v2 karşılaştırmalarını içeren standart görsel üretim metriklerine dair (kamuya açık) sayısal tablo yoktur.
- Niteliksel topluluk testleri: Daha temiz kenarlar, daha keskin mikro ayrıntılar, daha doğru renkler ve prompt’a daha sadık çıktı (daha az hayali nesne, daha tutarlı karakterler). Popüler gayriresmi testler arasında “Wine Glass Test” ve “Glass Burger Challenge” bulunur; GEMPIX2 (Nano Banana Pro) şeffaflık ve kırılmayı önceki sürümlere göre belirgin biçimde daha iyi ele alır.
- Metin işleme: Nano Banana Pro görseller içindeki tipografi ve metin yerleştirmede gözle görülür iyileşme gösterir (birçok görsel model için kalıcı bir zayıflık alanı). Topluluk karşılaştırmaları, bozulmuş karakter/glyphelerin azaldığını işaret eder.
- Verim / UX: daha hızlı yineleme hızı ve arka planda çok aşamalı rafine etme gerçekleştiren bir UX; kullanıcılar daha güvenilir ilk geçiş sonuçları görür (manuel yeniden üretim ihtiyacını azaltır).
Sınırlamalar ve riskler
- İçerik filtreleri ve tespit: modeli entegre eden platformlar (ör. Whisk/üçüncü taraf uygulamalar) katı ünlü veya benzerlik tespiti etkinleştirip belirli çıktıları engelleyebilir; bu da gerçekçi ünlü benzerliklerine dayanan yaratıcı iş akışlarını etkiler.
- Halüsinasyon / akıl yürütme uç durumları: iyileştirilmiş olsa da model hâlâ fiziksel olarak gerçekçi olmayan artefaktlar üretebilir; özellikle görseller içinde yoğun sembolik metin veya yüksek derecede teknik diyagramlar söz konusu olduğunda — yine de NB2, önceki sürümlere kıyasla bu hataları azaltıyor gibi görünmektedir.
- Güvenlik ve kötüye kullanım: üretici görsel modeller sorunlu veya zararlı içerik üretmek için kullanılabilir. Google, orijin için SynthID filigranı ve kısıtlamalar/filtreler uygular; yine de kötüye kullanım vakaları yaşanmıştır (politik açıdan hassas bir bağlamda Nano Banana tarafından üretilen bir görselle ilişkili yüksek profilli tartışma).
Nano Banana Pro’nun diğer modellerle karşılaştırması
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — güçlü mobil entegrasyon, çoklu görsel füzyon, yinelemeli öz-düzeltme, 2K yerel/4K yükseltme, Google uygulamalarına (Search, Photos, Workspace/Gemini) sıkı entegrasyon. Güvenilir düzenlemeler, süreklilik ve Google hizmetleriyle entegrasyon gerektiren iş akışları için en iyisi.
- Midjourney — stilize sanatsal çıktılarda ve topluluk odaklı prompt mühendisliğinde öne çıkar; tipik olarak foto-Doğru çoklu görsel füzyonu veya derin çok modlu düzenleme hatlarına odaklanmaz.
- Stable Diffusion / açık ağırlıklar — tamamen açık, yüksek düzeyde özelleştirilebilir ve yerel olarak barındırılabilir; denetim noktaları ve ince ayar ekosistemi araştırma ve çevrimdışı kullanım için belirleyici bir avantajdır. Nano Banana Pro’ya kıyasla kutudan çıktığı haliyle daha az “tek tıkla” mobil entegrasyon ve daha az tutarlı çoklu görsel düzenleme uyumu.
- Seedream 4.0 (ByteDance) — yakın zamanda açıkça bir Nano Banana rakibi olarak konumlandırıldı; ultra hızlı oluşturma, 2K çıktı ve çok sayıda referans görsel desteğini (altıya kadar) vurgular. Profesyonel/yaratıcılar için bir alternatif olarak konumlanır.
(Bu karşılaştırmalar üst düzeydedir; kazananı iş akışınıza göre seçin: açıklık/özelleştirilebilirlik → Stable Diffusion; stilize sanat → Midjourney; entegre, tutarlı mobil düzenleme ve agresif yineleme → Nano Banana Pro / Gemini 3 Pro Image ailesi.)
Gerçek dünya kullanım senaryoları
- Mobil foto düzenleme ve yaratıcı filtreler (Google Photos entegrasyonları — yeniden stillendirme, arka plan füzyonu, portre yeniden kompozisyon).
- Pazarlama ve reklam varlıkları — hızlı konsept üretimi, birden çok kare/açıda tutarlı marka karakterleri.
- Konsept sanat ve storyboard — çoklu görsel füzyonu, paneller arasında karakter sürekliliğini korur.
- E-ticaret / ürün maketleri — farklı bağlam/ışık koşullarında tutarlı ürün çekimleri üretin.
- AR/VR varlıkları için hızlı prototipleme — sürükleyici kullanımlar için yükseltilebilen yüksek kaliteli 2K/4K çıktılar.
- gemini-3-pro-image (Nano Banana Pro) API’ye nasıl erişilir
Gerekli Adımlar
- cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun.
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını edinin: sk-xxxxx ve gönderin.
- Bu sitenin url’sini edinin: https://api.cometapi.com/
Kullanım Yöntemi
- API isteği göndermek için “
gemini-3-pro-image” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Kolaylığınız için web sitemiz Apifox testi de sunar. - <YOUR_API_KEY> ifadesini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin.
- İçerik alanına sorunuzu veya isteğinizi ekleyin — modele yanıtlayacağı şey budur.
- . API yanıtını işleyin ve oluşturulan cevabı alın.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Ana detaylar :
- Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Model Names:
gemini-3-pro-image - Authentication:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.