Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Giriş:$1.5616/M
Çıktı:$9.3696/M
Nano Banana Pro, metin odaklı iş akışlarında genel amaçlı yardım için tasarlanmış bir yapay zeka modelidir. Kontrol edilebilir yapıda içerik üretmek, dönüştürmek ve analiz etmek için talimat tabanlı istemlere uygundur. Tipik kullanım alanları arasında sohbet asistanları, belge özetleme, bilgiye dayalı Soru-Cevap (QA) ve iş akışı otomasyonu yer alır. Kamuya açık teknik ayrıntılar sınırlıdır; entegrasyonu, yapılandırılmış çıktılar, bilgi alma destekli istemler ve araç veya işlev çağırma gibi yaygın yapay zeka asistanı kalıplarıyla uyumludur.
Yeni
Ticari kullanım
Playground
Genel Bakış
Özellikler
Fiyatlandırma
API
Sürümler

Temel özellikler

  • Metin → Görsel: güçlü prompt uyumuyla tam prompt odaklı üretim.
  • Görsel → Görsel (düzenlemeler): birden çok düzenleme boyunca özne/karakter tutarlılığı korunarak hassas, hedefli düzenlemeler.
  • Maksimum çıktı çözünürlüğü: 4K’ya kadar (örnekler ve desteklenen kesin piksel boyutları en-boy oranına bağlıdır; API 1K/2K/4K hazır ayarlarını sunar)
  • Yinelemeli planlama ve öz-düzeltme: perspektif, metin, ince geometriler gibi yaygın görsel hataları tespit edip düzelten dahili “çok aşamalı” boru hattı.
  • Gelişmiş görsel içi metin işleme: posterler, maketler ve infografikler için uygun, net ve okunaklı çok dilli metin (kısa başlıklardan uzun paragraflara).
  • Tek bir iş akışında 5 karakter ve en fazla 14 nesne/referans görseli için sadakat.
  • Filigran / orijin: üretilen tüm görseller SynthID filigranı içerir; model bazı ürün entegrasyonlarında orijin için C2PA meta verilerini gömer.

Gemini 3 Pro Image sürümleri ve adlandırma

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Teknik ayrıntılar

Mimari

  • Soy/omurga: Nano Banana Pro, Google’ın gelişen Gemini görsel yığını üzerine kuruludur — özellikle yeni Gemini 3 Pro Image / GEMPIX 2 mimarisi (daha yüksek kapasiteli görsel+metin çok modlu çerçeve). Bu, Gemini 2.5 Flash Image’dan (orijinal “nano-banana”) yerel olarak çok modlu, genişletilmiş görsel-dil akıl yürütme yeteneklerine sahip bir görsel modele evrimdir.
  • Model davranışı: yerel çok kipli (görsel + metin + dünya bilgisi), çoklu görsel füzyonu için açık işlem hatları ve tek bir statik örnek üretmek yerine çıktıları birden çok geçişte rafine eden dahili aşamalı bir planlayıcı. İlk raporlar, önceki sürümlere kıyasla daha güçlü geometrik/optik akıl yürütmeyi (cam, kırılma) gösteriyor.
  • Düşünme / dahili rafine etme: model, kompozisyonu rafine etmek için dahili olarak görünür bir “thinking” süreci kullanır (API bu davranışı belgeliyor ve bu dahili adımların nihai görsel belirteçleri olarak ücretlendirilmediğini belirtir).
  • Dayandırma ve araçlar: Search grounding desteklenir (web gerçekleri diyagram/infografik üretimine dahil edilebilir). Daha deterministik kontrol için sistem talimatlarını da destekler.

Temel API parametreleri:

  • thinking_level (low / high): gecikme ile akıl yürütme derinliği arasında denge kurar;
  • media_resolution (low/medium/high): görsel OCR/ayrıntı okuma belirteçlerini kontrol eder;
  • generationConfig.imageConfig: görsel çıktılarda en-boy oranı/çözünürlüğü kontrol eder.

Görsel sınırları:

  • Desteklenen giriş kipleri: Metin ve görseller (model, görsel üretimi için ses veya videoyu kabul etmez).
  • Prompt başına en fazla görsel: 14 (Gemini 3 Pro Image preview için).
  • Maksimum görsel boyutu (yükleme): giriş görseli başına 7 MB.
  • Desteklenen en-boy oranları: 1:1, 3:2, 16:9, 9:16, 21:9, vb.

Çıktı görselleri / belirteçler: yüksek sınırlar; 4K/4096px desteklenir.

Kıyaslama performansı

Kısa özet: kamuya açık/erken kıyaslamalar çoğunlukla niteliksel / topluluk odaklıdır, ancak orijinal nano-banana’ya (Gemini 2.5 Flash Image) kıyasla çözünürlük, artefakt azaltma ve fiziksel sadakatte tutarlı iyileştirmeler bildirilmektedir. Belirli adlandırılmış “meydan okumalar” net görsel kazanımlar göstermiştir; yine de Google’dan v1 → v2 karşılaştırmalarını içeren standart görsel üretim metriklerine dair (kamuya açık) sayısal tablo yoktur.

  • Niteliksel topluluk testleri: Daha temiz kenarlar, daha keskin mikro ayrıntılar, daha doğru renkler ve prompt’a daha sadık çıktı (daha az hayali nesne, daha tutarlı karakterler). Popüler gayriresmi testler arasında “Wine Glass Test” ve “Glass Burger Challenge” bulunur; GEMPIX2 (Nano Banana Pro) şeffaflık ve kırılmayı önceki sürümlere göre belirgin biçimde daha iyi ele alır.
  • Metin işleme: Nano Banana Pro görseller içindeki tipografi ve metin yerleştirmede gözle görülür iyileşme gösterir (birçok görsel model için kalıcı bir zayıflık alanı). Topluluk karşılaştırmaları, bozulmuş karakter/glyphelerin azaldığını işaret eder.
  • Verim / UX: daha hızlı yineleme hızı ve arka planda çok aşamalı rafine etme gerçekleştiren bir UX; kullanıcılar daha güvenilir ilk geçiş sonuçları görür (manuel yeniden üretim ihtiyacını azaltır).

Sınırlamalar ve riskler

  • İçerik filtreleri ve tespit: modeli entegre eden platformlar (ör. Whisk/üçüncü taraf uygulamalar) katı ünlü veya benzerlik tespiti etkinleştirip belirli çıktıları engelleyebilir; bu da gerçekçi ünlü benzerliklerine dayanan yaratıcı iş akışlarını etkiler.
  • Halüsinasyon / akıl yürütme uç durumları: iyileştirilmiş olsa da model hâlâ fiziksel olarak gerçekçi olmayan artefaktlar üretebilir; özellikle görseller içinde yoğun sembolik metin veya yüksek derecede teknik diyagramlar söz konusu olduğunda — yine de NB2, önceki sürümlere kıyasla bu hataları azaltıyor gibi görünmektedir.
  • Güvenlik ve kötüye kullanım: üretici görsel modeller sorunlu veya zararlı içerik üretmek için kullanılabilir. Google, orijin için SynthID filigranı ve kısıtlamalar/filtreler uygular; yine de kötüye kullanım vakaları yaşanmıştır (politik açıdan hassas bir bağlamda Nano Banana tarafından üretilen bir görselle ilişkili yüksek profilli tartışma).

Nano Banana Pro’nun diğer modellerle karşılaştırması

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — güçlü mobil entegrasyon, çoklu görsel füzyon, yinelemeli öz-düzeltme, 2K yerel/4K yükseltme, Google uygulamalarına (Search, Photos, Workspace/Gemini) sıkı entegrasyon. Güvenilir düzenlemeler, süreklilik ve Google hizmetleriyle entegrasyon gerektiren iş akışları için en iyisi.
  • Midjourney — stilize sanatsal çıktılarda ve topluluk odaklı prompt mühendisliğinde öne çıkar; tipik olarak foto-Doğru çoklu görsel füzyonu veya derin çok modlu düzenleme hatlarına odaklanmaz.
  • Stable Diffusion / açık ağırlıklar — tamamen açık, yüksek düzeyde özelleştirilebilir ve yerel olarak barındırılabilir; denetim noktaları ve ince ayar ekosistemi araştırma ve çevrimdışı kullanım için belirleyici bir avantajdır. Nano Banana Pro’ya kıyasla kutudan çıktığı haliyle daha az “tek tıkla” mobil entegrasyon ve daha az tutarlı çoklu görsel düzenleme uyumu.
  • Seedream 4.0 (ByteDance) — yakın zamanda açıkça bir Nano Banana rakibi olarak konumlandırıldı; ultra hızlı oluşturma, 2K çıktı ve çok sayıda referans görsel desteğini (altıya kadar) vurgular. Profesyonel/yaratıcılar için bir alternatif olarak konumlanır.

(Bu karşılaştırmalar üst düzeydedir; kazananı iş akışınıza göre seçin: açıklık/özelleştirilebilirlik → Stable Diffusion; stilize sanat → Midjourney; entegre, tutarlı mobil düzenleme ve agresif yineleme → Nano Banana Pro / Gemini 3 Pro Image ailesi.)

Gerçek dünya kullanım senaryoları

  • Mobil foto düzenleme ve yaratıcı filtreler (Google Photos entegrasyonları — yeniden stillendirme, arka plan füzyonu, portre yeniden kompozisyon).
  • Pazarlama ve reklam varlıkları — hızlı konsept üretimi, birden çok kare/açıda tutarlı marka karakterleri.
  • Konsept sanat ve storyboard — çoklu görsel füzyonu, paneller arasında karakter sürekliliğini korur.
  • E-ticaret / ürün maketleri — farklı bağlam/ışık koşullarında tutarlı ürün çekimleri üretin.
  • AR/VR varlıkları için hızlı prototipleme — sürükleyici kullanımlar için yükseltilebilen yüksek kaliteli 2K/4K çıktılar.
  • gemini-3-pro-image (Nano Banana Pro) API’ye nasıl erişilir

Gerekli Adımlar

  • cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun.
  • Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını edinin: sk-xxxxx ve gönderin.
  • Bu sitenin url’sini edinin: https://api.cometapi.com/

Kullanım Yöntemi

  1. API isteği göndermek için “gemini-3-pro-image” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Kolaylığınız için web sitemiz Apifox testi de sunar.
  2. <YOUR_API_KEY> ifadesini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin.
  3. İçerik alanına sorunuzu veya isteğinizi ekleyin — modele yanıtlayacağı şey budur.
  4. . API yanıtını işleyin ve oluşturulan cevabı alın.

CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Ana detaylar :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

SSS

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

Nano Banana Pro için Özellikler

Nano Banana Pro'in performansı ve kullanılabilirliği artırmak için tasarlanmış temel özelliklerini keşfedin. Bu yeteneklerin projelerinize nasıl fayda sağlayabileceğini ve kullanıcı deneyimini nasıl geliştirebileceğini öğrenin.

Nano Banana Pro için Fiyatlandırma

Nano Banana Pro için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. Nano Banana Pro'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana Pro için örnek kod ve API

Nano Banana Pro için kapsamlı örnek kodlara ve API kaynaklarına erişerek entegrasyon sürecinizi kolaylaştırın. Ayrıntılı dokümantasyonumuz adım adım rehberlik sağlayarak projelerinizde Nano Banana Pro'in tüm potansiyelinden yararlanmanıza yardımcı olur.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Pro Sürümleri

Nano Banana Pro'nın birden fazla anlık görüntüye sahip olmasının nedeni; güncellemeler sonrası çıktı varyasyonları nedeniyle tutarlılık için eski anlık görüntülere ihtiyaç duyulması, geliştiricilere uyum ve geçiş için bir geçiş dönemi sağlanması ve kullanıcı deneyimini optimize etmek için küresel veya bölgesel uç noktalara karşılık gelen farklı anlık görüntüler içerebilir. Sürümler arasındaki detaylı farklar için lütfen resmi belgelere başvurun.
Model kimliğiAçıklamaKullanılabilirlikİstek
nano-banana-pro-allKullanılan teknoloji resmi değildir ve üretim kararsızdır vb., Sohbet biçimi✅Sohbet biçimi
gemini-3-pro-imageÖnerilir, en yeni modele işaret eder✅Gemini görüntü oluşturma
gemini-3-pro-image-previewResmi Önizleme✅Gemini görüntü oluşturma

Daha Fazla Model