Nano Banana Pro(Gemini 3 Pro Image) API Nasıl Kullanılır?

CometAPI
AnnaNov 20, 2025
Nano Banana Pro(Gemini 3 Pro Image) API Nasıl Kullanılır?

Nano Banana Pro — resmî adıyla Gemini 3 Pro Image — Google/DeepMind’in gelişmiş çok modlu akıl yürütmeyi, yüksek doğrulukta metin oluşturmayı, çoklu görsel birleştirmeyi ve stüdyo düzeyinde yaratıcı kontrolleri bir araya getiren yeni stüdyo kalitesinde görsel üretme ve düzenleme modelidir.

Nano Banana Pro nedir ve neden önemsemelisiniz?

Nano Banana Pro, Google’ın en yeni görsel üretme ve görsel düzenleme modelidir — “Gemini 3 Pro Image” sürümü — 4K’ya kadar stüdyo kalitesinde, yüksek doğrulukta ve bağlama duyarlı görseller ile görsel üzeri metin üretmek için tasarlanmıştır. Önceki Nano Banana modellerinin (Gemini 2.5 Flash Image / “Nano Banana”) halefidir ve geliştirilmiş akıl yürütme, Search grounding (gerçek dünya bilgileri), daha güçlü metin oluşturma ve daha güçlü yerel düzenleme kontrolleri sunar. Model, etkileşimli kullanıcılar için Gemini uygulaması içinde kullanılabilir ve programatik erişim için standart Gemini API üzerinden Nano Banana Pro’ya erişebilirsiniz, ancak belirli model tanımlayıcısını (gemini-3-pro-image-preview veya onun kararlı halefini) seçmeniz gerekir.

Bunun önemi şu: Nano Banana Pro yalnızca güzel görseller üretmek için değil, aynı zamanda bilgiyi görselleştirmek için tasarlanmıştır — infografikler, veriye dayalı anlık görseller (hava durumu, spor), metin ağırlıklı posterler, ürün mockup’ları ve çoklu görsel füzyonları (14’e kadar giriş görseli ve 5 kişiye kadar karakter tutarlılığını koruma). Tasarımcılar, ürün ekipleri ve geliştiriciler için bu doğruluk, görsel üzeri metin ve programatik erişim birleşimi, daha önce otomatikleştirilmesi zor olan üretim iş akışlarının önünü açar.

API üzerinden hangi işlevler sunuluyor?

Geliştiricilere tipik olarak sunulan API yetenekleri şunlardır:

  • Metin → Görsel üretimi (tek adımlı veya çok adımlı “thinking” kompozisyon akışları).
  • Görsel düzenleme (yerel maskeler, inpainting, stil ayarlamaları).
  • Çoklu görsel füzyonu (referans görselleri birleştirme).
  • Gelişmiş istek kontrolleri: çözünürlük, en-boy oranı, son işleme adımları ve önizleme modlarında hata ayıklama/inceleme için “composition thought” izleri.

Nano Banana Pro’nun Temel Yenilikleri ve İşlevleri

Daha akıllı içerik akıl yürütme

Gemini 3 Pro’nun akıl yürütme yığınını kullanarak karmaşık, çok adımlı görsel talimatları yorumlar (ör. “bu veri kümesinden 5 adımlı bir infografik oluştur ve iki dilli bir açıklama ekle”). API, nihai çıktıyı iyileştirmek için ara kompozisyon denemeleri üretebilen bir “Thinking” mekanizması sunar.

Neden önemlidir: Tek geçişli bir prompt → piksel eşlemesi yerine model, kompozisyonu iyileştiren ve olgusal dayanak için harici araçları (ör. Google Search) çağırabilen dahili bir “thinking” süreci yürütür (ör. doğru diyagram etiketleri veya yerel ayara uygun tabelalar). Bu da infografikler, diyagramlar veya ürün mockup’ları gibi görevlerde yalnızca daha güzel değil, aynı zamanda anlamsal olarak daha doğru görseller sağlar.

Nasıl elde edilir: Nano Banana Pro’nun “Thinking” özelliği, modelin nihai görseli üretmeden önce ara görseller ve akıl yürütme izleri oluşturduğu kontrollü bir dahili akıl yürütme/kompozisyon geçişidir. API, modelin en fazla iki ara kare oluşturabileceğini ve nihai görselin bu zincirin son aşaması olduğunu ortaya koyar. Üretimde bu, kompozisyon, metin yerleşimi ve düzen kararlarına yardımcı olur.

Daha doğru metin oluşturma

Görsellerin içindeki okunabilir ve yerelleştirilmiş metin üretimi (menüler, posterler, diyagramlar) belirgin şekilde iyileştirilmiştir. Nano Banana Pro, görsel içi metin oluşturmada yeni seviyelere ulaşır:

  • Görsellerdeki metin net, okunabilir ve doğru yazılmıştır;
  • Çok dilli üretimi destekler (Çince, Japonca, Korece, Arapça vb. dahil);
  • Kullanıcıların uzun paragrafları veya çok satırlı açıklayıcı metinleri doğrudan görsellere yazmasına olanak tanır;
  • Otomatik çeviri ve yerelleştirme mevcuttur.

Neden önemlidir: Geleneksel olarak görsel modeller okunabilir ve iyi hizalanmış metin üretmekte zorlanır. Nano Banana Pro, güvenilir metin oluşturma ve yerelleştirme için açıkça optimize edilmiştir (ör. düzeni koruyarak çeviri yapma); bu da posterler, ambalajlar veya çok dilli reklamlar gibi gerçek yaratıcı kullanım senaryolarının önünü açar.

Nasıl elde edilir: Metin oluşturmadaki iyileştirmeler, metin içeren görsel örneklerine ağırlık veren veri kümeleri üzerinde eğitimle birlikte temel çok modlu mimariden ve hedeflenmiş değerlendirme setlerinden (insan değerlendirmeleri ve regresyon setleri) gelir. Model, okunabilir ve yerelleştirilmiş görsel içi metin üretmek için glif şekillerini, yazı tiplerini ve düzen kısıtlarını hizalamayı öğrenir — ancak küçük metinler ve aşırı yoğun paragraflar hâlâ hataya açık olabilir.

Daha güçlü görsel tutarlılık ve doğruluk

Stüdyo kontrolleri (aydınlatma, odak, kamera açısı, renk düzenleme) ve çoklu görsel kompozisyonu (14’e kadar referans görseli, birden çok insan öznesi için özel olanaklarla) karakter tutarlılığını (düzenlemeler arasında aynı kişi/karakteri koruma) ve marka kimliğini üretilen varlıklar boyunca korumaya yardımcı olur. Model yerel olarak 1K/2K/4K çıktıları destekler.

Neden önemlidir: Pazarlama ve eğlence iş akışları, çekimler ve düzenlemeler arasında tutarlı karakterler gerektirir. Model, beş kişiye kadar benzerliği koruyabilir ve Sketch → 3D Render üretirken 14 referans görselini tek bir kompozisyonda birleştirebilir. Bu, reklam kreatifleri, ambalajlar veya çok sahneli hikâye anlatımı için faydalıdır.

Nasıl elde edilir: Model girdileri, açık rol atamalarıyla birden fazla görsel kabul eder (ör. “Görsel A: poz”, “Görsel B: yüz referansı”, “Görsel C: arka plan dokusu”). Mimari, aydınlatma ve kamera gibi dönüşümleri uygularken kimlik/poz/stili korumak için üretimi bu görseller üzerinden koşullandırır.

Nano Banana Pro’nun Performans Karşılaştırmaları

Nano Banana Pro’nun (Gemini 3 Pro Image) “Metin→Görsel AI kıyaslamalarında öne çıktığı” ve önceki Nano Banana modellerine kıyasla daha iyi akıl yürütme ve bağlamsal dayanak sunduğu belirtiliyor. Ayrıca önceki sürümlere göre daha yüksek doğruluk ve gelişmiş metin oluşturma vurgulanıyor.

Nano Banana Pro(Gemini 3 Pro Image) API Nasıl Kullanılır?

Pratik performans rehberi

2K/4K yüksek doğruluklu render’larda, 1K veya hız için optimize edilmiş “Flash” modellere kıyasla daha yüksek gecikme ve maliyet bekleyin. Eğer throughput/gecikme kritikse, yüksek hacim için flash varyantını (ör. Gemini 2.5 Flash / Nano Banana) kullanın; kalite ve karmaşık akıl yürütme görevleri için Nano Banana Pro / gemini-3-pro-image kullanın.

Geliştiriciler Nano Banana Pro’ya Nasıl Erişebilir?

Hangi endpoint’ler ve modeller seçilmeli?

Model tanımlayıcısı (preview / pro): gemini-3-pro-image-preview (preview) — Nano Banana Pro yeteneklerini istediğinizde bunu kullanın. Daha hızlı ve düşük maliyetli işler için gemini-2.5-flash-image (Nano Banana) kullanılmaya devam etmektedir.

Kullanılabilecek yüzeyler

  • Gemini API (generativelanguage endpoint): xx’e erişmek için bir CometAPI anahtarı kullanabilirsiniz. CometAPI, aynı API’yi resmî web sitesine göre daha avantajlı bir fiyatla sunar. Görsel üretimi için generateContent endpoint’ine doğrudan HTTP / SDK çağrıları yapabilirsiniz (örnekler aşağıda).
  • Google AI Studio: Hızlı denemeler yapmak ve demo uygulamalarını remixlemek için web arayüzü.
  • Vertex AI (kurumsal): Büyük ölçekli üretim için ayrılmış throughput, faturalandırma seçenekleri (kullandıkça öde / kurumsal katmanlar) ve güvenlik filtreleri. Büyük iş akışlarına veya toplu render işlerine entegre ederken Vertex kullanın.

Ücretsiz katmanın sınırlı bir kullanım limiti vardır; limit aşıldığında Nano Banana’ya geri dönülür. Plus/Pro/Ultra katmanları daha yüksek limitler ve filigransız çıktı sunar, ancak Ultra, Flow video araçlarında ve Antigravity IDE’de 4K modunda kullanılabilir.

Nano Banana Pro ile nasıl görsel üretebilirim (adım adım)?

1) Gemini uygulamasını kullanmak için hızlı etkileşimli tarif

  1. Gemini → Araçlar → Create images bölümünü açın.
  2. Model olarak Thinking (Nano Banana Pro) seçin.
  3. Bir prompt girin: konu, eylem, duygu, aydınlatma, kamera, en-boy oranı ve görselde görünmesi gereken metni açıklayın. Örnek:
    “Bir robotik atölyesinin 4K posterini oluştur: masa etrafında çeşitli bir ekip, blueprint kaplaması, sans serif ile kalın ‘Robots in Action’ başlığı, sıcak tungsten ışık, sığ alan derinliği, sinematik 16:9.”
  4. (İsteğe bağlı) Birleştirmek veya referans olarak kullanmak üzere en fazla 14 görsel yükleyin. Alanları yerel olarak düzenlemek için seçim/maske aracını kullanın.
  5. Üretin, doğal dille yineleme yapın (ör. “başlığı mavi yap ve üst ortaya hizala; blueprint üzerindeki kontrastı artır”), ardından dışa aktarın.

2) Gemini görsel endpoint’ine HTTP ile gönderim yapın

Anahtarı almak için CometAPI’ye giriş yapmanız gerekir.

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

Bu örnek, base64 görsel yükünü bir PNG dosyasına yazar. generationConfig.imageConfig.resolution parametresi 4K çıktı ister (3 Pro Image modeli için kullanılabilir).

3) Görsel üretimi için generateContent endpoint’ine doğrudan SDK çağrıları

Google SDK’nın yüklenmesini ve Google kimlik doğrulamasının alınmasını gerektirir. Python örneği (metin + referans görseller + grounding):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

Bu örnek, satır içi bir referans görseli yüklemeyi ve google_search aracını etkinleştirirken 4K bir kompozisyon istemeyi gösterir. Python SDK, düşük seviyeli REST ayrıntılarını yönetecektir.

Çoklu görsel füzyonu ve karakter tutarlılığı

Aynı kişiyi farklı sahnelerde koruyan bir kompozisyon üretmek için birden fazla inline_data bölümü geçin (fotoğraf setinizden seçilmiş) ve modelin “çıktılar arasında kimliği koruması” gerektiğini belirten yaratıcı talimatı ekleyin.

Kısa pratik örnek — gerçek bir prompt ve beklenen akış

Prompt:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

Beklenen işlem hattı: uygulama → prompt şablonu + CSV verisi → prompt içindeki yer tutucuları değiştir → image_size=2048x1152 ile API çağrısı → base64 PNG al → varlığı + provenance metadata’yı kaydet → gerekirse kompozitör ile tam yazı tipini üstüne ekle.

Bir üretim hattını nasıl tasarlamalı ve güvenlik / provenance nasıl ele alınmalıdır?

Önerilen üretim mimarisi

  1. Prompt + taslak geçişi (hızlı model): Çok sayıda düşük çözünürlüklü varyasyonu ucuza üretmek için gemini-2.5-flash-image (Nano Banana) kullanın.
  2. Seçim ve iyileştirme: En iyi adayları seçin, prompt’ları iyileştirin, hassasiyet için inpainting/maske düzenlemeleri uygulayın.
  3. Yüksek doğruluklu nihai render: Nihai 2K/4K render’lar ve son işleme (upsampling, renk düzenleme) için gemini-3-pro-image-preview (Nano Banana Pro) çağrısı yapın.
  4. Provenance ve metadata: Prompt’u, model sürümünü, zaman damgalarını ve SynthID bilgilerini varlık metadata deponuzda saklayın — model bir SynthID filigranı ekler ve çıktılar uyumluluk ve içerik denetimi için geriye doğru izlenebilir.

Güvenlik, haklar ve moderasyon

  • Telif hakkı ve hak izni: Hak ihlali oluşturan içerik yüklemeyin veya üretmeyin. Tanınabilir benzerlikler oluşturabilecek kullanıcı görselleri veya prompt’ları için açık kullanıcı onayı alın. Google’ın Prohibited Use Policy’sine ve model güvenlik filtrelerine uyulmalıdır.
  • Filtreleme ve otomatik kontroller: Sonraki kullanımdan veya herkese açık gösterimden önce üretilen görselleri dahili bir içerik moderasyon hattından geçirin (NSFW, nefret sembolleri, siyasi/bağlayıcı içerik tespiti).

Görsel düzenleme (inpainting), çoklu görsel kompozisyonu ve metin oluşturmayı nasıl yaparım?

Nano Banana Pro çok modlu düzenleme iş akışlarını destekler: bir veya daha fazla giriş görseli ve düzenlemeleri açıklayan metinsel bir talimat sağlayın (bir nesneyi kaldır, gökyüzünü değiştir, metin ekle). API aynı istekte görsel + metin kabul eder; model yanıt olarak iç içe geçmiş metin ve görseller üretebilir. Örnek kalıplar arasında maskeli düzenlemeler ve çoklu görsel harmanlamaları (stil aktarımı / kompozisyon) bulunur. Metin bloklarını ve ikili görselleri birleştiren contents dizileri için belgelere bakın.

Örnek: Düzenleme (Python sözde akış)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

Bu konuşmalı düzenleme, üretime hazır bir varlığa ulaşana kadar sonuçları yinelemeli olarak ayarlamanıza olanak tanır.

Node.js örneği — maske ve çoklu referanslarla görsel düzenleme

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(API’ler bazen Cloud Storage URI’lerini veya base64 görsel yüklerini kabul eder; tam giriş formatları için Gemini API belgelerini kontrol edin.)

CometAPI kullanarak görsel oluşturma ve düzenleme hakkında bilgi için lütfen Guide to calling gemini-3-pro-image sayfasına bakın.

Sonuç

Nano Banana Pro (Gemini 3 Pro Image), görsel üretiminde üretim düzeyinde büyük bir sıçramadır: veriyi görselleştirmek, yerelleştirilmiş düzenlemeler üretmek ve geliştirici iş akışlarını desteklemek için bir araçtır. Hızlı prototipleme için Gemini uygulamasını, üretim entegrasyonu için API’yi kullanın ve maliyeti kontrol etmek, güvenliği sağlamak ve marka kalitesini korumak için yukarıdaki önerileri izleyin. Şeffaflık ve denetim ihtiyaçlarını karşılamak için her zaman gerçek kullanıcı iş akışlarını test edin ve provenance metadata’yı saklayın.

Görseller içinde stüdyo kalitesinde varlıklara, kompozisyon üzerinde hassas kontrole, geliştirilmiş metin oluşturmaya ve birden fazla referansı tek bir tutarlı çıktıda birleştirme yeteneğine ihtiyaç duyduğunuzda Nano Banana Pro’yu kullanın.

Geliştiriciler, CometAPI üzerinden Gemini 3 Pro Image( Nano Banana Pro) API erişebilir. Başlamak için, Playground içinde CometAPI model yeteneklerini keşfedin ve ayrıntılı talimatlar için API rehberine başvurun. Erişmeden önce, lütfen CometAPI’ye giriş yaptığınızdan ve API anahtarını aldığınızdan emin olun. CometAPI, entegrasyonunuza yardımcı olmak için resmî fiyattan çok daha düşük bir fiyat sunar.

Gitmeye hazır mısınız?→ Bugün CometAPI’ye kaydolun !

AI ile ilgili daha fazla ipucu, rehber ve haber almak istiyorsanız bizi VKX ve Discord üzerinden takip edin!

En İyi Modellere Düşük Maliyetle Erişim

Devamını Oku