Nano Banana Google'ın topluluk takma adıdır (ve dahili kısaltmasıdır) Gemini 2.5 Flash Görüntüsü — yüksek kaliteli, düşük gecikmeli, çok modlu bir görüntü oluşturma ve düzenleme modeli. Bu uzun kılavuz (kod, desenler, dağıtım adımları ve CometAPI örnekleriyle birlikte), üretimde kullanabileceğiniz üç pratik çağrı yöntemini göstermektedir: (1) OpenAI uyumlu bir Sohbet arayüzü (metin→görüntü), (2) Google'ın resmi generateContent metin→görüntü arayüzü ve (3) Google'ın resmi generateContent Base64 giriş/çıkış kullanan görüntü→görüntü arayüzü. Bu süreçte adım adım dağıtım/dağıtım tavsiyeleri, ortam kurulumu, CometAPI'den API işlemlerinin nasıl alınacağı, fiyatlandırma ve filigran notları ve güvenilir, uygun maliyetli sonuçlar için en iyi ipuçlarını alacaksınız.
Nano Banana (Gemini 2.5 Flash Görüntüsü) Nedir?
Nano Banana, Google'ın Gemini ailesindeki en yeni görüntü modeli olan Gemini 2.5 Flash Image'a verilen gayriresmi isimdir. Hem fotogerçekçi görüntü oluşturma hem de hassas görüntü düzenleme (yerel düzenlemeler, çoklu görüntü birleştirme, düzenlemeler arasında tutarlı karakter koruması) için tasarlanmıştır ve Google'ın Gemini API'si, Google AI Studio ve Vertex AI aracılığıyla kullanılabilir. Model, kökenini belirtmek için görünmez bir SynthID filigranıyla birlikte gelir.
Geliştiriciler için bunun önemi: Nano Banana size şunları işleyebilen tek, yüksek kaliteli, çok modlu bir model sunar:
- Metin → Resim (metin istemlerinden yeni resimler oluşturun)
- Resim → Resim (sağlanan bir fotoğrafı düzenleyin/dönüştürün)
- Çoklu görüntü karıştırma (birden fazla resmi tek bir kompozisyonda birleştirin)
Tüm bunlara Google'ın resmi web sitesi üzerinden erişilebilir.generateContentuç noktalar (Vertex AI / Gemini API) veya CometAPI ve OpenRouter gibi üçüncü taraf API ağ geçitleri tarafından sunulan OpenAI uyumlu uç noktalar aracılığıyla. Bu, Gemini 2.5 Flash Image'ı mevcut OpenAI uyumlu kod tabanlarına entegre edebileceğiniz veya Google'ın resmi SDK'larını doğrudan çağırabileceğiniz anlamına gelir.
Nelerde üstündür?
- Hedef odaklı, yerel düzenlemeler (gömlek rengini değiştirme, nesneleri kaldırma, pozları ayarlama).
- Yeniden düzenlemelerde konu/karakter tutarlılığını korumak.
- Birden fazla görüntünün tutarlı bir kompozisyon halinde harmanlanması/birleştirilmesi.
- Daha ağır araştırma modellerine kıyasla düşük gecikme süresi ve maliyet açısından verimli çıkarım (Google, “Flash” modellerini yüksek verimli seçenekler olarak konumlandırıyor).
Nano Banana'yı API üzerinden çağırmak için geliştirme ortamımı nasıl ayarlamalıyım?
Aşağıda, daha sonra açıklanacak üç çağrı yönteminden herhangi biri için temel oluşturabilecek adım adım bir kontrol listesi bulunmaktadır.
Önkoşullar (hesaplar, anahtarlar, kota)
- Google hesabı + Bulut projesi — Gemini'yi doğrudan Google (Gemini API / Vertex AI) üzerinden aramayı planlıyorsanız, bir Google Cloud projesi oluşturun ve Vertex AI / Gemini API'lerini etkinleştirin. Faturalandırma ve uygun rollere (örneğin,
Vertex AI AdminorService Account(çıkarım haklarıyla birlikte). - Gemini API erişimi — Bazı Gemini görüntü modelleri önizleme/sınırlı kullanılabilirliğe sahiptir; hesabınıza bağlı olarak Google AI Studio veya Vertex AI üzerinden erişim talep etmeniz veya modeli kullanmanız gerekebilir.
- CometAPI (isteğe bağlı ağ geçidi) — Farklı modelleri (Gemini dahil) proxy'leyebilen tek bir satıcıdan bağımsız API tercih ediyorsanız, bir API anahtarı almak ve model listelerini incelemek için CometAPI'ye kaydolun (Gemini 2.5 Flash varyantlarını ve OpenAI uyumlu bir uç noktayı kullanıma sunarlar). CometAPI, geliştirmeyi basitleştirebilir ve uygulama kodunuzu değiştirmeden sağlayıcı değiştirmenize olanak tanır.
Yerel takımlar
- Dil çalışma zamanları: Node.js 18+, Python 3.10+ önerilir.
- HTTP istemcisi:
fetch/axiosJS için;requests/httpxPython (veya resmi SDK'lar) için. - Görüntü yardımcıları:
Pillow(Python) veyasharp(Düğüm) yeniden boyutlandırma, biçim dönüştürme ve Base64 kodlama/kod çözme için. - Güvenlik: Anahtarları ortam değişkenlerinde veya bir sır kasasında (HashiCorp Vault, AWS Secrets Manager, Google Secret Manager) saklayın. API anahtarlarını asla teslim etmeyin.
Google/uyumlu SDK'yı yükleyin (isteğe bağlı)
Google SDK'lar sağlar ve openai Kütüphane uyumluluk ayarları — Birkaç satırı (temel URL + API anahtarı) değiştirerek OpenAI istemci kütüphanelerini Gemini'ye karşı kullanabilirsiniz, ancak tam çok modlu özellikler için yerel Gemini/Google istemcisi önerilir. CometAPI veya OpenAI uyumlu bir ağ geçidi kullanıyorsanız, OpenAI istemcisini kullanmak geliştirmeyi hızlandırabilir. Örnekler:
Resmi Google yolu (Python):
python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai # official Google GenAI SDK
pip install Pillow requests jq # for local image handling in examples
CometAPI / OpenAI uyumlu istemci (Python):
pip install openai requests
Nano Banana için üç çağrı yönteminden birini nasıl seçerim?
Çağrı yöntemi seçimi, mimarinize, gecikme/maliyet gereksinimlerinize ve Google'ın resmi uç noktasına mı yoksa üçüncü taraf bir OpenAI uyumlu ağ geçidine mi güvenmek istediğinize bağlıdır. Üç yaygın model şunlardır:
1) OpenAI uyumlu Sohbet arayüzü (metinden resme)
Zaten OpenAI tarzı kodunuz veya SDK'larınız varsa ve modelleri minimum değişiklikle değiştirmek istiyorsanız bunu kullanın. Birçok ağ geçidi (CometAPI, OpenRouter), Gemini modellerini OpenAI uyumlu bir REST yüzeyi altında kullanıma sunar, böylece mevcut chat or completions aramalar sadece farklı bir şekilde çalışır base_url ve model adı. Google Cloud kimlik doğrulamasını yönetmek istemiyorsanız, bu genellikle üretime giden en hızlı yoldur.
2) İkizler resmi generateContent — metinden resme
Google'ın resmi generateContent ile genai Resmi, tam destekli SDK'yı ve en yeni özelliklere (ayrıntılı üretim parametreleri, akış, büyük varlıklar için dosya API'si) ve Google Cloud faturalandırma/izlemeyi istiyorsanız (Google) istemcisi veya Vertex AI. Bu, üretim desteğine ve kurumsal düzeyde kontrollere ihtiyaç duyduğunuzda önerilir.
3) İkizler resmi generateContent — görüntüden görüntüye (Base64 giriş/çıkış)
İkili görüntüleri satır içi (Base64) göndermeniz gerektiğinde veya görüntü düzenleme / görüntüden görüntüye işlem hatları istediğinizde bunu kullanın. Google'ın generateContent Daha büyük veya yeniden kullanılabilir varlıklar için satır içi (base64) görüntüleri ve bir Dosya API'sini destekler. Oluşturulan/düzenlenen görüntülere verilen yanıtlar genellikle kodunu çözüp kaydettiğiniz Base64 dizeleri olarak döndürülür. Bu, en açık çok modlu kontrolü sağlar.
Nano Banana'yı OpenAI uyumlu bir Sohbet arayüzü (metin-görüntü) üzerinden nasıl arayabilirim?
OpenAI uyumlu bir sohbet uç noktası bir diziyi kabul eder {role, content} Mesajlar; bir kullanıcı mesajında istediğiniz görseli tanımlarsınız ve ağ geçidi (CometAPI veya OpenAI uyumlu bir shim) bunu temeldeki Gemini modeline bir çağrıya dönüştürür. Uygulamanız zaten sohbet akışları kullanıyorsa veya metin oluşturma ve görsel oluşturmayı tek bir alışverişte birleştirmek istiyorsanız bu kullanışlıdır.
Adımlar
1.CometAPI'ye kaydolun ve bir API anahtarı edinin: CometAPI'ye kaydolun, bir proje oluşturun, API anahtarınızı kopyalayın. CometAPI, tek bir uygulamanın arkasında birçok modeli ortaya çıkarır base_url. ()
-
OpenAI uyumlu bir istemci yükleyin: Python:
pip install openaiveya daha yenisini kullanınopenai/OpenAIBirçok ağ geçidi tarafından kullanılan SDK sarmalayıcısı. -
SDK'yı CometAPI'ye yönlendirin ve sohbet tamamlama uç noktasını çağırın:
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMET_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2-5-flash-image-preview",
"stream": true,
"messages": [{"role": "user",
"content": "Generate a cute kitten sitting on a cloud, in a cartoon style"}]
}'
Notlar:
-
akış doğru olmalıdır; yanıt bir akış olarak döndürülecektir;
-
Yanıt yapısı OpenAI uyumluluğu için CometAPI ile sarılmıştır.
-
Yanıt bir Base64 görüntüsü içerir; gerektiğinde bunu çözümleyin ve istemciye kaydedin:
Gemini resmi uygulamasını kullanarak Nano Banana'yı nasıl arayabilirim? generateContent metin-görüntü arayüzü?
Google, bir Gemini Geliştirici API'si (Gemini API) ve ayrıca Gemini modellerini şu şekilde ortaya çıkarır: Vertex AIGemini 2.5 Flash Image'a (Nano Banana) desteklenen bir şekilde programlı erişim için resmi generateContent yöntem, yalnızca metin veya çok modlu üretim için standart giriş noktasıdır. Google'ın GenAI SDK (Python: google-genai) veya doğrudan REST uç noktasını çağırın. Modelin parametrelerine ve modalitelerine doğrudan erişim sağlar ve Google'ın uç noktalarını çağırırken gelişmiş özellikleri (hassas düzenleme, çoklu görüntü birleştirme) kullanmanın önerilen yoludur.
1.Google'ın GenAI SDK (Python: google-genai)
Dağıtım / çağrı adımları (genel bakış):
- Bir API anahtarı alın Google AI Studio'dan veya bir Vertex AI servis hesabı oluşturun (platforma bağlı olarak).
- SDK'yi yükle (
pip install --upgrade google-genai) ve kimlik doğrulaması yapın (API anahtarı veya Google Uygulama Varsayılan Kimlik Bilgileri). - Klinik modeli:
gemini-2.5-flash-imageveya dokümanlarda gösterilen önizleme kısaltması (tam kısaltma GA/önizleme durumuna bağlıdır). - Çağrı
client.models.generate_content(...)düz metin istemiyle (metinden resme). - decode döndürülen görüntüleri (eğer Base64 döndürüldüyse) kaydedin/depolayın.
Python (resmi istemci) örneği — metin→resim:
from google import genai
from base64 import b64decode, b64encode
client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
"content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
"mime_type": "text/plain"
}
# request generateContent for image output
result = client.generate_content(
model="gemini-2-5-flash-image-preview",
prompt=prompt,
response_modalities=,
image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)
(Not: Tam parametre adları için resmi istemci API'sini kontrol edin; yukarıdaki örnekler Google dokümanlarındaki kalıpları takip eder.)
2. Telefon etmek Nano Banan REST uç noktası üzerinden
EST uç noktası (metinden resme örnek): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.
Kimlik doğrulama seçenekleri: başlık sağlayın x-goog-api-key: $CometAPI_API_KEY(CometAPI'de bir anahtar oluşturun.)
Bu, bir metin istemi gönderir ve döndürülen base64 görüntüsünü kaydeder:
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{ "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
]
}]
}' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png
Notlar: Görüntü ikili dosyası base64 olarak döndürülür
candidates.content.parts.inline_data.dataYukarıdaki örnek şunu kullanır:jqSatır içi verileri seçip kodunu çözmek için kullanılır. Resmi belgeler de aynı akışı göstermektedir.
Gemini resmi uygulamasını kullanarak Nano Banana'yı nasıl arayabilirim? generateContent görüntü-görüntü arayüzü (Base64 giriş/çıkış)?
Resimden resme (base64 giriş/çıkış) ne zaman kullanılmalıdır?
İhtiyacınız olduğunda görüntüden görüntüye yöntemini kullanın:
- Mevcut bir fotoğrafı düzenleyin (iç boyama, stil transferi, nesne değiştirme).
- Birden fazla kaynak görseli tek bir kompozisyonda birleştirin.
- Bir konunun kimliğini düzenlemeler boyunca koruyun (Nano Banana'nın güçlü yanlarından biri).
İkizler generateContent Base64 (veya dosya URI'leri) aracılığıyla satır içi görüntü verilerini destekler ve oluşturulan veya düzenlenen görüntüleri Base64 dizeleri olarak döndürür. Belgeler, sağlamak için açık örnekler sunar. inline_data ile mime_type ve data.
Dağıtım / çağrı adımları (görüntüden görüntüye)
- Hazırlamak giriş görüntüsü(leri): dosya baytlarını oku, Base64 kodla veya SDK yardımcısı aracılığıyla ham baytları geçir.
- Kurmak a
contentsbir kısmı satır içi görüntü olan dizi (ilemimeTypevedata) ve sonraki kısımlarda metin düzenleme talimatları yer almaktadır. - POST için
generateContent(resmi SDK veya REST). - Teslim almak yanıt: API, Base64 dizeleri olarak kodlanmış oluşturulan/düzenlenen görüntüleri döndürür. Bunları çözün ve yerel olarak kaydedin.
Örnek — Python (GenAI SDK aracılığıyla satır içi baytlar kullanılarak görüntüden görüntüye)
# pip install google-genai
from google import genai
from google.genai import types
import base64
client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")
# Read local image
with open("input_photo.jpg", "rb") as f:
img_bytes = f.read()
# Using SDK helper to attach bytes as a part
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[
types.Part.from_bytes(
data=img_bytes,
mime_type="image/jpeg"
),
"Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
],
)
# The returned image will typically be in response.candidates[].content.parts with base64-encoded data
# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data # example path
with open("edited.jpg","wb") as out:
out.write(base64.b64decode(b64_out))
Python örneği: Base64 kullanarak dinlenme noktası üzerinden görüntü→görüntü
import base64, json, requests
API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"
# read and base64-encode image
with open("input.jpg","rb") as f:
b64 = base64.b64encode(f.read()).decode("utf-8")
payload = {
"model": "gemini-2-5-flash-image-preview",
"input": [
{"mime_type": "image/jpeg", "bytes_base64": b64},
{"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
],
"response_modalities":
}
resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save
out_b64 = data
with open("edited.png","wb") as out:
out.write(base64.b64decode(out_b64))
CometAPI rest portunu kullanarak erişmek istiyorsanız:
curl
--location
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^
--header "Authorization: sk-" ^
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^
--header "Content-Type: application/json" ^
--header "Accept: */*" ^
--header "Host: api.CometAPI.com" ^
--header "Connection: keep-alive" ^
--data-raw "{ \"contents\": } ], \"generationConfig\": { \"responseModalities\": }}"
Satır içi için: Görüntüyü okuyun ve base64 ile kodlayın. Tekrarlanan kullanım veya 20 MB'tan büyük dosyalar için, Dosya API'si aracılığıyla yükleyin ve dosya tanıtıcısına başvurun.
generateContent.Giriş görsellerine ve metinsel düzenleme talimatlarına ihtiyaç duyan hassas düzenlemeler ve iş akışları için idealdir.
Nano Banana ile çalışırken en iyi ipuçları nelerdir?
Hızlı mühendislik ve kontrol
- açık ol: İstenilen en boy oranını, stil referanslarını (izin verilirse yalnızca sanatçı adları), kamera lensini, aydınlatmayı ve kompozisyonu ekleyin. Örneğin, “Fotogerçekçi, 3:2, sığ alan derinliği, altın saat, Nikon 50mm lens.”
- Ardışık düzenlemeyi kullanın: Büyük tek çekimlik komutlar yerine, birden fazla geçişte daha küçük, yerel düzenlemeleri tercih edin; bu, konu tutarlılığını korur. Nano Banana'nın güçlü yanı, yinelemeli düzenlemedir.
Görüntü hijyeni
- Ön işleme girdileri: renk alanını normalleştirin, gizlilik gerekiyorsa gömülü EXIF'i kaldırın, belirteçleri korumak için makul çözünürlüklere ölçekleyin.
- Son işlem çıktıları: Yüz algılamayı çalıştırın, kullanıcılara geri göndermeden önce hafif filtreler (Yastık / keskin) aracılığıyla küçük eserleri temizleyin.
Güvenlik, uyumluluk ve içerik politikaları
- Görüntüleri depolamadan/sunmadan önce otomatik bir içerik güvenliği kontrolü (Görüntü denetleme modelleri veya kara liste kontrolleri) uygulayın.
- Kişilerin fotoğraflarını yüklerseniz, geçerli gizlilik yasalarına (GDPR/CCPA) uyun ve gerekli izinleri alın.
- Telif hakkıyla korunan karakterler veya mevcut sanat eserleri için istemde bulunurken model kullanım politikalarına ve telif hakkı kurallarına uyun.
Kapanış notları
Nano Banana (Gemini 2.5 Flash Görüntü), çok modlu görüntü oluşturma ve düzenleme için pragmatik, yüksek doğruluklu bir adımı temsil eder: düzenlemeler arasında tutarlılık ve daha zengin çok modlu akıl yürütme için tasarlanmıştır. Nano Banana (Gemini 2.5 Flash Görüntü), görüntü oluşturma/düzenlemede önemli bir adımdır; çok adımlı düzenlemeler ve birden fazla entegrasyon yüzeyi (CometAPI ve Google'ın OpenAI uyumlu ağ geçitleri gibi) için yüksek tutarlılık sunar generateContent API'ler). Benimseme hızı için CometAPI gibi ağ geçitleri, OpenAI tarzı kodu yeniden kullanmanıza olanak tanır. Yanıtları her zaman akılcı bir şekilde kontrol edin, içerik politikasına ve kaynak özelliklerine (SynthID) saygı gösterin ve yineleme sırasında maliyetleri izleyin.
Başlamak
CometAPI, OpenAI'nin GPT serisi, Google'ın Gemini, Anthropic'in Claude, Midjourney, Suno ve daha fazlası gibi önde gelen sağlayıcılardan 500'den fazla AI modelini tek bir geliştirici dostu arayüzde toplayan birleşik bir API platformudur. Tutarlı kimlik doğrulama, istek biçimlendirme ve yanıt işleme sunarak CometAPI, AI yeteneklerinin uygulamalarınıza entegrasyonunu önemli ölçüde basitleştirir. İster sohbet robotları, görüntü oluşturucular, müzik bestecileri veya veri odaklı analiz hatları oluşturuyor olun, CometAPI daha hızlı yineleme yapmanızı, maliyetleri kontrol etmenizi ve satıcıdan bağımsız kalmanızı sağlar; tüm bunları yaparken AI ekosistemindeki en son atılımlardan yararlanırsınız.
Geliştiriciler erişebilir Gemini 2.5 Flash Görüntüsü(Nano Banana CometAPI listesi gemini-2.5-flash-image-preview/gemini-2.5-flash-image (kataloglarındaki stil girişleri) CometAPI aracılığıyla, listelenen en son model sürümleri makalenin yayınlandığı tarih itibarıyla geçerlidir. Başlamak için, modelin yeteneklerini keşfedin. Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Kuyrukluyıldız API'si Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.



