Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

CometAPI
AnnaAug 29, 2025
Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

Bir yapay zeka yaratıcısı olarak, size şunu tanıtmaktan heyecan duyuyorum: Nano Muz — için kullanılan eğlenceli takma ad Gemini 2.5 Flash Görüntüsü — Google'ın en yeni, yüksek kaliteli görüntü oluşturma ve düzenleme modeli. Bu derinlemesine incelemede, ne olduğunu, nasıl kullanılacağını (uygulama ve API), nasıl etkili bir şekilde başlatılacağını, somut örnekler vereceğini, çalışmaya hazır kod ekleyeceğini ve adım adım açıklayacağım. yedi yaratıcı, pratik kullanım Bugün başvurmaya başlayabilirsiniz.

Gemini 2.5 Flash Image (Nano Banana) Nedir?

Gemini 2.5 Flash Image, Gemini ailesindeki yeni bir görüntü oluşturma ve düzenleme modelidir. Gemini 2.5 Flash ailesini, yalnızca metin değil, görüntü oluşturma ve düzenleme için genişletir ve Gemini'nin çok modlu akıl yürütmesini, dünya bilgisini ve metin ve/veya görüntü girdilerinden görüntü oluşturma veya değiştirmeye yönelik komut istemi odaklı kontrollerini birleştirir. Ekip ve geliştirici belgeleri, buna açıkça "Gemini 2.5 Flash Image" adını veriyor ve dahili takma adını belirtiyor. nano-muz.

Duyuruda Gemini 2.5 Flash Image katmanı için yayınlanan fiyatlandırma şu şekildeydi: $30 her 1 milyon çıktı jetonu için, görüntü başına maliyet örneğinin şu şekilde bildirilmesiyle 1290 çıktı belirteci ≈ $0.039 görüntü başınaModel önizlemede sunulmaktadır (geliştirici/önizleme kimlikleri gibi) gemini-2.5-flash-image-preview) ve halihazırda seçili ortaklar (CometAPI) ve Google'ın kendi geliştirici platformları aracılığıyla kullanıma sunulmuştur.

Gemini 2.5 Flash Image'ın öne çıkan özellikleri nelerdir?

Düzenlemeler arasında karakter ve stil tutarlılığı

Merkezi iyileştirmelerden biri karakter tutarlılığı: Model, bir öznenin (bir kişi, evcil hayvan veya ürün) görsel olarak birden fazla düzenleme ve farklı bağlamlarda tutarlı kalmasını sağlayacak şekilde özel olarak ayarlanmıştır; bu, önceki görüntü modellerinin uzun süredir devam eden bir zayıflığıdır. Bu, tutarlı marka varlıkları, hikaye anlatımında tekrar eden karakterler veya otomatik olarak oluşturulan çoklu çekimli ürün fotoğrafları gerektiren iş akışlarını iyileştirir.

İstem tabanlı, yerelleştirilmiş düzenleme

"Gömleğin üzerindeki lekeyi çıkar", "kıyafeti mavi bir ceketle değiştir" veya "arka planı bulanıklaştır ve öznenin parlaklığını artır" gibi doğal dil talimatlarıyla birlikte bir görsel sağladığınızda, model çoğu durumda manuel maskelere ihtiyaç duymadan hedefli, yerel düzenlemeler gerçekleştirir. Bu, onu yinelemeli, konuşma tarzında düzenlemeler için pratik hale getirir.

Çoklu görüntü birleştirme ve stil aktarımı

Gemini 2.5 Flash Image, birden fazla görüntü alabilir ve oluşturmak Bunları tek bir sahneye dönüştürebilir veya stil/dokuyu bir görüntüden diğerine aktarabilirsiniz. Bu sayede ürün maketleri (bir ürünü bir sahneye yerleştirme), mobilya düzenlemeleri veya pazarlama ve e-ticaret için birleştirilmiş görseller oluşturulabilir.

Yerli dünya bilgisi

Gemini ailesi üzerine kurulu olduğundan, model dünya bilgisinden yararlanır; örneğin, sahne malzemelerini, ortamları veya bağlamsal olarak doğru nesne ilişkilerini anlamak gibi; bu da gerçekçi sahne inşasına ve anlamsal olarak tutarlı düzenlemelere (sadece estetik açıdan makul çıktılar değil) yardımcı olur.

Düşük gecikme süresi ve maliyet verimliliği

Gemini'nin "Flash" ailesi, daha büyük mantıksal katmanlara kıyasla düşük gecikme süresi ve uygun maliyetli kullanım hedefliyor. Geliştirici duyurusu, birçok gerçek dünya kullanım senaryosu için hızı ve uygun fiyat/kalite dengesini vurguluyor.

Yerleşik kaynak: SynthID filigranı

Modelle oluşturulan/düzenlenen tüm görseller şunları içerir: görünmez SynthID dijital filigranı Böylece görsellerin daha sonra yapay zeka tarafından oluşturulduğu veya düzenlendiği doğrulanabilir. Bu, Google'ın kötüye kullanım ve kaynak takibine yönelik ürün düzeyindeki önlemlerinin bir parçasıdır.

1) Uzun süredir devam eden bir çizgi roman veya marka kampanyası için tutarlı bir karakter nasıl yaratabilirim?

Bu neden işe yarıyor

Nano Banana, düzenlemeler ve yeni bağlamlar boyunca aynı karakter görünümünü koruyacak şekilde özel olarak eğitildi. Bu, bölümlerde, küçük resimlerde veya kahraman görsellerinde aynı yüz, kıyafet veya maskotun görünmesi gerektiğinde kullanışlıdır. Geliştiriciler buna "karakter tutarlılığı" adını veriyor.

Nasıl istemde bulunulur

  • Kimlik özelliklerini (yaş aralığı, yüz özellikleri, ayırt edici işaretler, kıyafet unsurları) yakalayan tanımlayıcı bir blokla başlayın.
  • "Tüm çıktılarda aynı karakteri kullanın; tanımlama işaretlerini değiştirmeyin." gibi bir "tutarlılık belirteci" talimatı ekleyin.
  • Çoklu görüntü çıktıları için, benzerliği kilitlemek amacıyla giriş olarak bir veya daha fazla referans görüntüsü sağlayın.

Tutarlı düzenlemeler için nasıl istemde bulunulur?

  • Öncelikle korunmasını istediğiniz temel kimlik özelliklerini tanımlayın: yaş, saç rengi, ayırt edici özellikler (örneğin, "sol yanağında küçük bir beni var") ve giyim tarzı.
  • Düzenleme yaparken iki parçalı bir komut kullanın: önce ne olduğunu açıklayın , eğer mülteci statüleri sona erdirilmemişse Amerika'ya geldikten bir yıl sonra aynı kalırsa, o zaman tanımlayın değişiklik İstediğin gibi. Örnek: "Koruma: 28 yaşında, kısa siyah saçlı, küçük sol yanak beni olan Doğu Asyalı bir kadın. Değiştirme: Onu 1970'lerden kalma bir lokantaya, kırmızı deri ceketli, gülümseyen ve sıcak tungsten aydınlatmalı bir yere koy."
  • Çok adımlı düzenlemeler yaparken, istemde “(KEEP_ID: A)” gibi küçük bir referans belirteci ekleyin ve aynı konuyu istemler arasında belirtmek için bunu yeniden kullanın.

Örnek bilgi istemi

"Fotoğraf gerçekçiliğinde bir portre yaratın Amina, kısa asimetrik saç kesimi, sol yanağında hilal şeklinde bir beni, sıcak kahverengi gözleri ve yeşil deri ceketi olan 28 yaşında bir çizgi roman yazarı. Aşağıdaki 6 sahnede Amina'nın tanımlayıcı özelliklerini koruyun: 'Amina sabah kahvesinde', 'Amina parkta çizim yapıyor', … . Her sahnede aynı karakter benzerliğini kullanın."

Kod parçacığı (Python, birden fazla resim oluşturma)

Bu örnekte Google'ın belgelerinde gösterilen Gemini API istemcisi kullanılıyor; açıklayıcı komut isteminizi ve döngü sahnesi varyantlarınızı iletin.

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()
base_description = (
    "Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
    "crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)

scenes = [
    "Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
    "Amina sketching in the park, windy afternoon, soft bokeh background.",
    # add more scenes...

]

for i, scene in enumerate(scenes, start=1):
    prompt = f"{base_description} Scene: {scene}"
    response = client.models.generate_content(
        model="gemini-2.5-flash-image-preview",
        contents=,
    )
    parts = response.candidates.content.parts
    for part in parts:
        if part.inline_data:
            img = Image.open(BytesIO(part.inline_data.data))
            img.save(f"amina_scene_{i}.png")

2)Nano Banana e-ticaret ürün fotoğrafçılığı ve A/B görselleştirmeyi nasıl hızlandırabilir?

Bu neden yaratıcı ve yararlı?

Ürün ekipleri, birden fazla çekim, ışıklandırma kurulumu ve varyasyonlar (renkler, arka planlar) için büyük kaynaklar harcıyor. Nano Banana'nın çoklu görüntü füzyonu ve hassas hızlı düzenleme, katalog çekimleri, yaşam tarzı sahneleri ve sosyal varlıklar için tutarlı ürün varyantları ve yaşam tarzı kompozisyonlarını hızlı bir şekilde oluşturmanıza olanak tanır; yineleme süresini ve üretim maliyetlerini azaltır.

Ürün varyantları için nasıl istekte bulunulur?

  • Kısa bir ürün özelliği (boyutlar, malzemeler, renk paleti) ve fotoğraf stilini (örneğin, "stüdyo beyaz arka plan, 45° açı, yumuşak gölge") belirtin.
  • Varyantlar için: “Bu Bluetooth kulaklığın 4 farklı versiyonunu yapın: siyah, pembe, turuncu kulaklıklı gri ve mavi parıltılı gri – hepsi aynı ışıklandırma, aynı kamera açısı ve beyaz bir odada.”.”
  • Ürünü farklı sahnelere yerleştirmek için çoklu görüntü birleştirmeyi kullanın: "Bu sırt çantasını sığ alan derinliğiyle altın saatte bir piknik örtüsünün üzerine yerleştirin."

Örnek istem (ürün)

“Resim A (ürün referansı): birinci sınıf deri sırt çantası. Beyaz arka planlı (orman yeşili, ten rengi, kömür karası) üç katalog çeşidi oluşturun; 45° açıyla çekilmiş, doğal yumuşak gölgeli, ISO hissi 100.”

Kod parçacığı: hızlı Python oluşturma (katalog varyantı)

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client(api_key="YOUR_API_KEY")

product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=,
)

# Save images from response parts (example)

for i, part in enumerate(response.candidates.content.parts):
    if part.inline_data:
        img = Image.open(BytesIO(part.inline_data.data))
        img.save(f"backpack_variant_{i}.png")

Bu kod parçası Google'ın belgelenmiş kullanım modelini yansıtıyor ve ürün varyantı oluşturmayı otomatikleştirmek için iyi bir başlangıç ​​noktasıdır.

Çıktı görüntüsü:

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

3) Fotoğraf ve diyagramları bir araya getiren eğitimsel illüstrasyonları nasıl oluşturabilirim?

Bu neden işe yarıyor

Nano Banana entegre olur dünya bilgisi (Gemini'nin çok modlu akıl yürütmesi) böylece elle çizilmiş diyagramları yorumlayabilir, görsellere açıklama ekleyebilir veya fotoğraf ve metin talimatlarının bir karışımından açıklayıcı görseller oluşturabilir; e-öğrenme, teknik belgeler ve etkileşimli eğitmenler için kullanışlıdır.

Nasıl istemde bulunulur

  • Görseller (örneğin, fiziksel bir deneyin fotoğrafı) ve "Bu görseli, temel bileşenleri açıklayan etiketler ve oklarla açıklayın ve sistemi kesit halinde gösteren ikinci bir görsel oluşturun" gibi bir komut verin.

Örnek bilgi istemi

Dört bilgi parçası resimli açıklamasını oluşturun: İNSAN BEYNİNİN SİNİR AĞLARI, HÜCRE ONARIMI, ATP ÜRETİMİ, DNA ÇİFT SARMALININ GENETİK KODU, KLOROLPAST'IN BİTKİ FOTOSİTLERİ

Çıktı görüntüsü:

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

4) Gerçek fotoğrafları markaya uygun pazarlama varyasyonlarına (kıyafet, ışıklandırma, arka plan) nasıl dönüştürebilirim?

Bu neden işe yarıyor

Model şunları destekler: hedeflenen dönüşüm ve doğal dil aracılığıyla ifade edilen yerel düzenlemeler: bir kıyafeti değiştirmek, ışığı ayarlamak, arka planı değiştirmek veya nesneleri kaldırmak gibi - ve öznenin kimliğini ve genel gerçekçiliğini korumaya çalışır. Bu, hızlı pazarlama varyasyonlarına (mevsimsel kıyafetler, yerelleştirilmiş sahneler) olanak tanır.

Nasıl istemde bulunulur

  • Giriş olarak orijinal fotoğrafı sağlayın.
  • Isteyin hedeflenen düzenlemeler örneğin, "Ceketi kırmızı yün paltoyla değiştir, arka planı alacakaranlıkta şehir sokağına çevir, janta sıcak ışık ekle." gibi açık talimatlarla.

Örnek bilgi istemi

“Yüklenen fotoğraftan başlayarak, mavi kot ceketi kırmızı yünlü bir paltoyla değiştirin, arka planı hafif bokehli bir akşam vakti şehir sokağına ayarlayın ve konuyu arka plandan ayırmak için yumuşak bir kenar aydınlatması ekleyin.”

İpuçları

  • Tekrarlı kontrole ihtiyacınız varsa, çoklu tur düzenlemeleri yapın: önce düzenleme isteyin, sonra iyileştirin ("şapkayı çıkarın", "şimdi renk sıcaklığını ısıtın").

5) Animasyon yaratıcıları ve ön görselleştirme ekipleri sahneleri ve hikaye tahtalarını nasıl prototipleyebilir?

Neden faydalıdır?

Yönetmenler ve görüntü yönetmenleri, ışıklandırma düzeneklerini, kostümleri ve kamera kadrajlarını hızla prototipleyebilir. Nano Banana, tutarlı karakterler içeren senaryo panoları üretebilir, bu da planlama ve ön görselleştirmeye yardımcı olur. ()

H3: Örnek istem

There is a tree house in the forest at night with colorful lights hanging on the trees

Çıktı görüntüsü:

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

6)Nano Banana konsept sanatı, oyun varlıkları ve tutarlı oyun içi karakterler için nasıl kullanılabilir?

Oyun stüdyoları ve bağımsız geliştiricilerin neden önemsemesi gerektiği

Sanatsal öğeler oluşturmak ve karakter görünümleri üzerinde değişiklik yapmak, sanatçıların genellikle karakterleri tekrar tekrar yeniden işlemesini gerektirir. Nano Banana'nın karakter tutarlılığı, tek bir karakter kimliğine sadık kalan çok sayıda poz, kıyafet ve ışıklandırma düzeni oluşturmayı pratik hale getirir; bu da ön prodüksiyon ve hızlı prototiplemede büyük bir zaman tasarrufu sağlar.

Oyun varlıkları için nasıl istekte bulunulur

  • Metinde "kanonik" karakter sayfasını tanımlayın: boy, vücut tipi, temel özellikler, gardırop temel özellikleri.
  • Birden fazla çıktı isteyin: "Aynı yüz özelliklerine sahip, her biri önden, profilden ve ¾ pozda gösterilen üç savaş zırhı çeşidi oluşturun."
  • Çevre sanatı için çoklu görüntü birleştirmeyi kullanın: Karakterin ve çevrenin birer görüntüsünü verin ve bunları birleştirmesini isteyin.

Örnek istem (oyun varlıkları)

"'Rüzgar Bekçisi Kael' için üç zırhlı model oluşturun: yüz hatlarını koruyun (dar çene, sağ kaşın üstünde yara izi). Zırh A: deri + turkuaz kumaş; Zırh B: pul + pirinç; Zırh C: gizlilik mat siyah. Tam gövde ön, profil, ¾ çıktısı alın."

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

Zırh C: Gizli Mat Siyah

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

Zırh B: Pul + Pirinç

Gemini 7 Flash Görüntüsünün (Nano Muz) 2.5 Yaratıcı Kullanımı

Zırh A: Deri + Turkuaz Kumaş

7) Konuşmalı çoklu tur düzenleme ile fotoğraf rötuş iş akışlarını nasıl otomatikleştirebilirim?

Bu neden işe yarıyor

Nano Banana, sohbet tabanlı çoklu geçişli görüntü düzenlemeyi destekler: Düzenleme isteyebilir, sonucu inceleyebilir ve doğal dilde daha fazla talimat verebilirsiniz. Bu, bir editörün modeli birden fazla geçişte yönlendirdiği, döngüde insan olan bir rötuş hattı oluşturmak için mükemmeldir.

İş akışı nasıl uygulanır?

  • İlk fotoğrafınızı yükleyin ve temel rötuş (aydınlatma, leke giderme) talebinde bulunun.
  • Her turda, yeni düzenlenen görüntüyü bir sonraki talimatla ("vurguları azalt, gölgeleri ortaya çıkar, 4:5'e kırp") modele geri gönderin.
  • Her adımı kaydedin, böylece aynı geçişi geri alabilir veya bir toplu işleme uygulayabilirsiniz.

Mini iş akışı kesiti (Python)

# 1) Initial retouch

prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png

# 2) Follow-up tweak

prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png

En iyi sonuçları almak için Nano Banana'yı nasıl çalıştırabilirim?

Hangi yönlendirme prensiplerini izlemeliyim?

Nano Banana en iyi şekilde yanıt verir betimleyici, anlatı tarzı istemler Sahneyi, perspektifi, aydınlatmayı ve ruh halini açıklayan -sadece bir anahtar kelime listesi değil- bir kılavuz. Resmi kılavuz, fotogerçekçilik için kamera, lens, aydınlatma ve stilistik ipuçlarının veya illüstrasyonlar için stil ve palet ipuçlarının sağlanmasını öneriyor. Ayrıca kısıtlamaları (en boy oranı, arka plan, metin gereksinimleri) açıkça belirtin.

Güçlü bir istemi nasıl yapılandırabilirim?

İşte kısa ve tekrar kullanılabilir şablonlar:

  • Fotogerçekçi şablon:
    A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: .
  • Stil aktarımı / kompozisyon şablonu:
    Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style: .

Hızlı mühendislik ipuçları (hızlı liste)

  • Kullanım tek bir net anlatım cümlesi birçok bağlantısız etiket yerine.
  • Ekle kamera ayrıntıları fotogerçekçilik için (örneğin, “85mm, sığ alan derinliği”).
  • Düzenlemeler arasında tutarlı karakterler için önceki görüntüye ve korumak istediğiniz niteliğe başvurun (örneğin, "konunun çillerini ve mavi atkısını koru, saç stilini şu şekilde değiştir...").
  • Düzenleme yaparken kaynak görseli yükleyin ve Hangi bölgelerin veya unsurların değiştirileceğini tam olarak açıklayın.
  • Küçük görsel ayrıntıları iyileştirmek için yinelemeli, çok turlu düzenlemeler kullanın (Nano Banana konuşma düzeyinde iyileştirmeyi destekler).

Son not

Nano Banana (Gemini 2.5 Flash Image), yaratıcı bir sıçramadır: Yaratıcıların karakter ve ürün sürekliliğini korurken, cesur yeni düzenlemelere, birden fazla görselin birleştirilmesine ve hızlı yinelemeye olanak tanır. Hikaye anlatımını hızlandırmak, üretimdeki sürtüşmeleri azaltmak ve görsellerin prototiplerini hızla oluşturmak için kullanın; ancak bu kazanımları titiz bir inceleme ve etik kurallarla birleştirin.

Başlamak

CometAPI, OpenAI'nin GPT serisi, Google'ın Gemini, Anthropic'in Claude, Midjourney, Suno ve daha fazlası gibi önde gelen sağlayıcılardan 500'den fazla AI modelini tek bir geliştirici dostu arayüzde toplayan birleşik bir API platformudur. Tutarlı kimlik doğrulama, istek biçimlendirme ve yanıt işleme sunarak CometAPI, AI yeteneklerinin uygulamalarınıza entegrasyonunu önemli ölçüde basitleştirir. İster sohbet robotları, görüntü oluşturucular, müzik bestecileri veya veri odaklı analiz hatları oluşturuyor olun, CometAPI daha hızlı yineleme yapmanızı, maliyetleri kontrol etmenizi ve satıcıdan bağımsız kalmanızı sağlar; tüm bunları yaparken AI ekosistemindeki en son atılımlardan yararlanırsınız.

Geliştiriciler erişebilir Gemini 2.5 Flash Görüntüsü(Nano Banana CometAPI listesi gemini-2.5-flash-image-preview/gemini-2.5-flash-image (kataloglarındaki stil girişleri) CometAPI aracılığıyla, listelenen en son model sürümleri makalenin yayınlandığı tarih itibarıyla geçerlidir. Başlamak için, modelin yeteneklerini keşfedin. Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Kuyrukluyıldız API'si Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.

Devamını Oku

500+ Model Tek Bir API'de

%20'ye Varan İndirim