Nano Banana Pro — resmen Gemini 3 Pro Görüntüsü — Google/DeepMind'ın gelişmiş çok modlu akıl yürütme, yüksek kaliteli metin oluşturma, çoklu görüntü kompozisyonu ve stüdyo düzeyinde yaratıcı kontrolleri bir araya getiren yeni stüdyo düzeyinde görüntü oluşturma ve düzenleme modelidir.
Nano Banana Pro nedir ve neden önemsemelisiniz?
Nano Banana Pro, Google'ın en yeni görüntü oluşturma ve düzenleme modeli olan "Gemini 3 Pro Image" sürümüdür ve 4K'ya kadar stüdyo kalitesinde yüksek kaliteli, bağlam farkında görüntüler ve görüntü üzerinde metinler üretmek üzere tasarlanmıştır. Daha önceki Nano Banana modellerinin (Gemini 2.5 Flash Image / "Nano Banana") halefi olan bu model, geliştirilmiş mantık, arama temeli (gerçek dünya verileri), daha güçlü metin işleme ve daha güçlü yerel düzenleme kontrolleriyle öne çıkar. Model, etkileşimli kullanıcılar için Gemini uygulaması içinde mevcuttur ve Nano Banana Pro'ya standart Gemini API'si aracılığıyla erişebilirsiniz, ancak belirli model tanımlayıcısını (gemini-3-pro-image-preview veya onun istikrarlı halefi). programatik erişim için.
Bunun önemi: Nano Banana Pro yalnızca güzel görüntüler oluşturmak için değil, aynı zamanda bilgileri görselleştirmek — infografikler, veri odaklı anlık görüntüler (hava durumu, spor), metin ağırlıklı posterler, ürün taslakları ve çoklu görsel birleştirmeleri (en fazla 14 giriş görseli ve 5 kişiye kadar karakter tutarlılığının korunması). Tasarımcılar, ürün ekipleri ve geliştiriciler için bu doğruluk, görsel üzerindeki metin ve programatik erişim kombinasyonu, daha önce otomatikleştirilmesi zor olan üretim iş akışlarını açar.
API aracılığıyla hangi işlevler kullanıma sunuluyor?
Geliştiricilere sunulan tipik API yetenekleri şunlardır:
- Metin → Görüntü oluşturma (tek adımlı veya çok adımlı “düşünme” kompozisyon akışları).
- Resim düzenleme (yerel maskeler, iç boyama, stil ayarlamaları).
- Çoklu görüntü füzyonu (referans görselleri birleştirin).
- Gelişmiş istek kontrolleri: çözünürlük, en boy oranı, son işlem adımları ve önizleme modlarında hata ayıklama/incelenebilirlik için "kompozisyon düşüncesi" izleri.
Nano Banana Pro'nun Temel Yenilikleri ve İşlevleri
Daha akıllı içerik muhakemesi
Karmaşık, çok adımlı görsel talimatları (örneğin, "bu veri kümesinden 5 adımlı bir infografik oluştur ve iki dilli bir başlık ekle") yorumlamak için Gemini 3 Pro'nun muhakeme yığınını kullanır. API, nihai çıktıyı iyileştirmek için ara kompozisyon testleri üretebilen bir "Düşünme" mekanizması sunar.
Neden önemlidir: İstemi piksele eşleyen tek bir geçiş yerine, model, kompozisyonu iyileştiren ve gerçeklere dayalı temellendirme (örneğin, doğru diyagram etiketleri veya yerel olarak doğru tabelalar) için harici araçları (örneğin, Google Arama) çağırabilen dahili bir "düşünme" süreci gerçekleştirir. Bu, infografikler, diyagramlar veya ürün maketleri gibi görevler için yalnızca daha güzel değil, aynı zamanda anlamsal olarak daha doğru görseller üretir.
Nasıl başarılabilir: Nano Banana Pro'nun "Düşünme" özelliği, modelin nihai görüntüyü oluşturmadan önce ara görseller ve akıl yürütme izleri ürettiği kontrollü bir dahili akıl yürütme/kompozisyon geçişidir. API, modelin iki ara kareye kadar oluşturabileceğini ve nihai görüntünün bu zincirin son aşaması olduğunu gösterir. Bu, üretimde kompozisyon, metin yerleşimi ve düzen kararlarına yardımcı olur.
Daha doğru metin oluşturma
Görsellerin (menüler, posterler, diyagramlar) içindeki okunabilir ve yerelleştirilmiş metinler önemli ölçüde iyileştirildi. Nano Banana Pro, görsel metin oluşturmada yeni zirvelere ulaşıyor:
- Resimlerdeki metinler açık, okunaklı ve doğru yazılmıştır;
- Çok dilli üretimi destekler (Çince, Japonca, Korece, Arapça vb. dahil);
- Kullanıcıların uzun paragraflar veya çok satırlı açıklayıcı metinleri doğrudan resimlere yazmasına olanak tanır;
- Otomatik çeviri ve yerelleştirme mevcuttur.
Neden önemlidir: Geleneksel olarak görüntü modelleri okunabilir ve iyi hizalanmış metinler oluşturmakta zorlanır. Nano Banana Pro, güvenilir metin oluşturma ve yerelleştirme (örneğin, düzeni çevirme ve koruma) için özel olarak optimize edilmiştir; bu da posterler, ambalajlar veya çok dilli reklamlar gibi gerçek yaratıcı kullanım alanlarının kilidini açar.
Nasıl başarılabilir: Metin oluşturma iyileştirmeleri, temeldeki çok modlu mimariden ve metin-görüntü örneklerine odaklanan veri kümeleri üzerinde gerçekleştirilen eğitimden ve hedeflenen değerlendirme kümeleriyle (insan değerlendirmeleri ve regresyon kümeleri) birlikteliğinden kaynaklanmaktadır. Model, görsellerin içinde okunaklı ve yerelleştirilmiş metinler üretmek için glif şekillerini, yazı tiplerini ve düzen kısıtlamalarını hizalamayı öğrenir; ancak küçük metinler ve aşırı yoğun paragraflar yine de hataya açık olabilir.
Daha güçlü görsel tutarlılık ve sadakat
Stüdyo kontrolleri (aydınlatma, odaklama, kamera açısı, renk derecelendirme) ve çoklu görüntü kompozisyonu (birden fazla insan öznesi için özel izinlerle 14'e kadar referans görüntü), karakter tutarlılığını (düzenlemeler arasında aynı kişi/karakteri koruyun) ve oluşturulan varlıklarda marka kimliğini korumaya yardımcı olur. Model, yerel 1K/2K/4K çıkışları destekler.
Neden önemlidir: Pazarlama ve eğlence iş akışları, çekimler ve düzenlemeler boyunca tutarlı karakterler gerektirir. Model, benzerliğini en fazla 10 saniye boyunca koruyabilir. beş insanlar ve uyum sağlamak 14 Sketch → 3D Render üretirken referans görsellerini tek bir kompozisyonda birleştirin. Bu, reklam kreatifleri, paketleme veya çoklu çekim hikaye anlatımı için kullanışlıdır.
Nasıl başarılabilir: Model girdileri, açık rol atamalarına sahip birden fazla görüntüyü kabul eder (örneğin, "Görüntü A: poz", "Görüntü B: yüz referansı", "Görüntü C: arka plan dokusu"). Mimari, dönüşümleri (aydınlatma, kamera) uygularken kimliği/pozu/stili korumak için üretimi bu görüntülere göre koşullandırır.
Nano Banana Pro'nun Performans Ölçütleri
Nano Banana Pro (Gemini 3 Pro Image), "Metin→Görüntü Yapay Zekası kıyaslamalarında mükemmel performans gösteriyor" ve önceki Nano Banana modellerine kıyasla gelişmiş akıl yürütme ve bağlamsal temellendirme sunuyor. Önceki sürümlere kıyasla daha yüksek doğruluk ve iyileştirilmiş metin işlemeyi vurguluyor.

Pratik performans rehberliği
Beklemek daha yüksek gecikme 2K/4K yüksek kaliteli render'ların maliyeti, 1K veya hız için optimize edilmiş "Flash" modellerinden daha düşüktür. Verim/gecikme kritik önem taşıyorsa, yüksek hacimli işler için Flash versiyonunu (örneğin, Gemini 2.5 Flash / Nano Banana) kullanın; kaliteli ve karmaşık mantık gerektiren işler için Nano Banana Pro / gemini-3-pro-image kullanın.
Geliştiriciler Nano Banana Pro'ya Nasıl Erişebilir?
Hangi uç noktalar ve modeller seçilmeli?
Model tanımlayıcı (önizleme / pro): gemini-3-pro-image-preview (önizleme) — Nano Banana Pro özelliklerinden yararlanmak istediğinizde bunu kullanın. Daha hızlı ve daha düşük maliyetli çalışma için, gemini-2.5-flash-image (Nano Banana) hala mevcut.
Kullanılacak yüzeyler
- Gemini API (üretken dil uç noktası): xx'e erişmek için bir CometAPI anahtarı kullanabilirsiniz. CometAPI, aynı API'yi resmi web sitesinden daha uygun bir fiyata sunar. Doğrudan HTTP/SDK çağrıları
generateContentgörüntü oluşturma için (aşağıdaki örnekler). - Google AI Stüdyosu: Hızlı denemeler ve demo uygulamalarının yeniden düzenlenmesi için web yüzeyi.
- Vertex AI (kurumsal): Büyük ölçekli üretim için sağlanan verimlilik, faturalandırma seçenekleri (kullandıkça öde / kurumsal katmanlar) ve güvenlik filtreleri. Büyük veri hatlarına veya toplu işleme işlerine entegrasyon yaparken Vertex'i kullanın.
Ücretsiz katmanın sınırlı bir kullanım sınırı vardır; sınırı aşan Nano Banana'ya geri döner. Plus/Pro/Ultra katmanları daha yüksek sınırlar ve filigransız çıktı sunar, ancak Ultra katmanları Flow video araçlarında ve Antigravity IDE'de 4K modunda kullanılabilir.
Nano Banana Pro ile nasıl görüntü oluşturabilirim (adım adım)?
1) Gemini uygulamasını kullanarak hızlı ve etkileşimli bir tarif
- Gemini'yi açın → Araçlar → Resimler oluşturun.
- Seç Düşünme (Nano Banana Pro) model olarak.
- Bir komut girin: Konuyu, eylemi, ruh halini, aydınlatmayı, kamerayı, en boy oranını ve görüntüde görünecek herhangi bir metni açıklayın. Örnek:
“Bir robotik atölyesinin 4K posterini yaratın: Bir masanın etrafında çeşitli bir ekip, plan kaplaması, sans serif formatında kalın 'Robotlar Harekete Geçiyor' başlığı, sıcak tungsten ışık, sığ alan derinliği, sinematik 16:9.” - (İsteğe bağlı) Birleştirmek veya referans olarak kullanmak üzere en fazla 14 resim yükleyin. Alanları yerel olarak düzenlemek için seçim/maske aracını kullanın.
- Oluşturun, doğal dille yineleyin (örneğin, "başlığı mavi yapın ve üst orta hizalayın; taslaktaki kontrastı artırın"), ardından dışa aktarın
2) Gemini görüntü uç noktasına göndermek için HTTP kullanın
Anahtarı almak için CometAPI'ye giriş yapmanız gerekiyor.
# save your API key to $CometAPI_API_KEY securely before running
curl -s -X POST \
"https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
-H "x-goog-api-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"role": "user",
"parts": [{
"text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
}]
}],
"generationConfig": {
"imageConfig": {
"resolution": "4096x4096",
"aspectRatio": "1:1"
}
}
}' \
| jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
| base64 --decode > nano_banana_pro_4k.png
Bu örnek, base64 görüntü yükünü bir PNG dosyasına yazar. generationConfig.imageConfig.resolution parametre istekleri 4K çıkış (3 Pro Image modeli için mevcuttur)
3) Doğrudan SDK çağrıları generateContent görüntü oluşturma için
Google SDK'nın kurulmasını ve Google kimlik doğrulamasının alınmasını gerektirir. Python örneği (metin + referans görseller + temellendirme):
# pip install google-genai pillow
from google import genai
from PIL import Image
import base64
client = genai.Client() # reads credentials from env / config per SDK docs
# Read a reference image and set inline_data
with open("ref1.png", "rb") as f:
ref1_b64 = base64.b64encode(f.read()).decode("utf-8")
prompt_parts = [
{"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
{"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=,
generation_config={
"imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
# tools can be provided to ground facts, e.g. "google_search"
"tools":
}
)
for part in response.candidates.content.parts:
if part.inline_data:
image = part.as_image()
image.save("product_ad.png")
Bu örnek, satır içi bir referans görüntüsünün yüklenmesini ve etkinleştirilirken 4K kompozisyonun talep edilmesini gösterir google_search bir araç olarak. Python SDK, düşük seviyeli REST ayrıntılarını işleyecektir.
Çoklu görüntü birleştirme ve karakter tutarlılığı
Sahneler arasında aynı kişiyi koruyan bir kompozit üretmek için, çoklu inline_data (Fotoğraf setinizden seçilen) parçaları seçin ve modelin “çıktılarda kimliğini koruması” gerektiği yönündeki yaratıcı talimatı belirtin.
Kısa pratik örnek — gerçek bir istem ve beklenen akış
istemi:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."
Beklenen boru hattı: uygulama → istem şablonu + CSV verileri → istemdeki yer tutucuları değiştir → API çağrısı image_size=2048x1152 → base64 PNG al → varlığı + köken meta verilerini kaydet → gerekirse, kompozitör aracılığıyla tam yazı tipini isteğe bağlı olarak üst üste koy.
Üretim hattını nasıl tasarlamalı ve güvenlik/menşei nasıl ele almalıyım?
Önerilen üretim mimarisi
- İstem + taslak geçiş (hızlı model): Kullanım
gemini-2.5-flash-image(Nano Banana) ile çok sayıda küçük çözünürlüklü varyasyonu ucuza üretmek. - Seçim ve iyileştirme: en iyi adayları seçin, istemleri iyileştirin, hassasiyet için boyama/maske düzenlemeleri uygulayın.
- Yüksek doğrulukta son render: çağrı
gemini-3-pro-image-preview(Nano Banana Pro) son 2K/4K renderlar ve post-işleme (yukarı örnekleme, renk derecelendirmesi) için. - Menşei ve meta veriler: Varlık meta veri deponuzdaki depolama istemini, model sürümünü, zaman damgalarını ve SynthID bilgilerini saklayın; model bir SynthID filigranı ekler ve çıktılar uyumluluk ve içerik denetimi için geriye doğru izlenebilir.
Güvenlik, haklar ve ölçülülük
- Telif hakkı ve hakların temizlenmesi: Hak ihlal eden içerik yüklemeyin veya oluşturmayın. Kullanıcı tarafından sağlanan ve tanınabilir benzerlikler oluşturabilecek görseller veya istemler için açık kullanıcı onayları kullanın. Google'ın Yasaklanmış Kullanım Politikası ve model güvenlik filtrelerine uyulmalıdır.
- Filtreleme ve otomatik kontroller: Üretilen görselleri tüketime sunulmadan veya kamuya açık olarak görüntülenmeden önce dahili içerik denetleme hattından (NSFW, nefret sembolleri, politik/bağlayıcı içerik tespiti) geçirin.
Resim düzenleme (iç boyama), çoklu resim kompozisyonu ve metin oluşturma nasıl yapılır?
Nano Banana Pro, çok modlu düzenleme iş akışlarını destekler: bir veya daha fazla giriş görüntüsü ve düzenlemeleri açıklayan metinsel bir talimat sağlayın (bir nesneyi kaldırma, gökyüzünü değiştirme, metin ekleme). API, aynı istekte görüntü ve metin kabul eder; model, yanıt olarak iç içe geçmiş metin ve görüntüler üretebilir. Örnek desenler arasında maskeli düzenlemeler ve çoklu görüntü karışımları (stil aktarımı/kompozisyonu) bulunur. Belgelere bakın. contents metin kümelerini ve ikili görüntüleri birleştiren diziler.
Örnek: Düzenle (Python sözde akışı)
from google import genai
from PIL import Image
client = genai.Client()
prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"
# contents can include Image objects or binary data per SDK; see doc for exact call
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=, # order matters: image + instruction
)
# Save result as before
Bu konuşma tabanlı düzenleme, üretime hazır bir varlığa ulaşana kadar sonuçları yinelemeli olarak ayarlamanıza olanak tanır.
Node.js örneği — maske ve birden fazla referansla görüntü düzenleme
// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');
const auth = new GoogleAuth({ scopes: });
async function runEdit() {
const client = await auth.getClient();
const token = await client.getAccessToken();
const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
const MODEL = "gemini-3-pro-image";
// Attach binary image content or URLs depending on API.
const payload = {
model: MODEL,
prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
inputs: {
referenceImages: [
{ uri: "gs://my-bucket/photo_subject.jpg" },
{ uri: "gs://my-bucket/target_studio.jpg" }
],
mask: { uri: "gs://my-bucket/mask.png" },
imageConfig: { resolution: "2048x2048", format: "png" }
},
options: { preserveIdentity: true }
};
const res = await fetch(API_URL, {
method: 'POST',
headers: {
'Authorization': `Bearer ${token.token}`,
'Content-Type': 'application/json'
},
body: JSON.stringify(payload)
});
const out = await res.json();
console.log(JSON.stringify(out, null, 2));
}
runEdit();
(API'ler bazen Cloud Storage URI'lerini veya base64 görüntü yüklerini kabul eder; kesin giriş biçimleri için Gemini API belgelerini kontrol edin.)
CometAPI'yi kullanarak görüntü oluşturma ve düzenleme hakkında bilgi için lütfen şuraya bakın: gemini-3-pro-image'i arama kılavuzu .
Sonuç
Nano Banana Pro (Gemini 3 Pro Image), görüntü oluşturmada üretim düzeyinde bir atılımdır: verileri görselleştirmek, yerelleştirilmiş düzenlemeler üretmek ve geliştirici iş akışlarını güçlendirmek için bir araçtır. Hızlı prototipleme için Gemini uygulamasını, üretim entegrasyonu için API'yi kullanın ve maliyeti kontrol etmek, güvenliği sağlamak ve marka kalitesini korumak için yukarıdaki önerileri izleyin. Şeffaflık ve denetim ihtiyaçlarını karşılamak için her zaman gerçek kullanıcı iş akışlarını test edin ve kaynak meta verilerini saklayın.
İhtiyacınız olduğunda Nano Banana Pro'yu kullanın stüdyo kalitesinde varlıklar, kompozisyon üzerinde hassas kontrol, görsellerin içinde geliştirilmiş metin oluşturma ve birden fazla referansı tek bir tutarlı çıktıda birleştirme yeteneği.
Geliştiriciler erişebilir Gemini 3 Pro Image (Nano Banana Pro) API'si CometAPI aracılığıyla. Başlamak için, model yeteneklerini keşfedinKuyrukluyıldız API'si içinde Oyun Alanı Ayrıntılı talimatlar için API kılavuzuna bakın. Erişim sağlamadan önce lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını aldığınızdan emin olun. IleetAPI Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.
Gitmeye hazır mısınız?→ Bugün CometAPI'ye kaydolun !
Yapay zeka hakkında daha fazla ipucu, kılavuz ve haber öğrenmek istiyorsanız bizi takip edin VK, X ve Katılın!



