Sebagai pencipta AI, saya teruja untuk memperkenalkan anda Pisang Nano — nama panggilan main-main untuk Imej Flash Gemini 2.5 — Model penjanaan imej dan penyuntingan imej yang terbaharu, ketelitian tinggi Google. Dalam penyelaman mendalam ini, saya akan menerangkan apa itu, cara menggunakannya (apl dan API), cara menggesanya dengan berkesan, memberi contoh konkrit, sertakan kod sedia untuk dijalankan dan berjalan melalui tujuh kegunaan kreatif dan praktikal anda boleh mula memohon hari ini.
Apakah Imej Kilat Gemini 2.5 (Pisang Nano)?
Gemini 2.5 Flash Image ialah penjanaan imej baharu dan model penyuntingan imej dalam keluarga Gemini. Ia memanjangkan keluarga Gemini 2.5 Flash untuk menghasilkan dan mengedit imej (bukan hanya teks), menggabungkan penaakulan pelbagai mod Gemini, pengetahuan dunia dan kawalan terdorong segera untuk mencipta atau mengubah imej daripada teks dan/atau input imej. Pasukan dan dokumen pembangun secara eksplisit memanggilnya "Gemini 2.5 Flash Image" dan perhatikan nama panggilan dalaman pisang nano.
Pada pengumuman harga yang diterbitkan untuk peringkat Gemini 2.5 Flash Image ialah $30 setiap token keluaran 1M, dengan contoh kos setiap imej yang dilaporkan sebagai 1290 token keluaran ≈ $0.039 setiap imej. Model ini ditawarkan dalam pratonton (ID pembangun/pratonton seperti gemini-2.5-flash-image-preview) dan sudah tersedia melalui rakan kongsi terpilih (CometAPI) dan platform pembangun Google sendiri.
Apakah ciri menonjol Gemini 2.5 Flash Image?
Kekonsistenan watak dan gaya merentas suntingan
Salah satu penambahbaikan pusat ialah konsistensi watak: model ditala secara eksplisit untuk memastikan subjek (seseorang, haiwan peliharaan atau produk) koheren secara visual merentas berbilang suntingan dan konteks yang berbeza — kelemahan yang telah lama wujud bagi model imej terdahulu. Ini menambah baik aliran kerja yang memerlukan aset jenama yang konsisten, watak berulang dalam penceritaan atau fotografi produk berbilang syot yang dijana secara automatik.
Berasaskan segera, pengeditan setempat
Anda boleh membekalkan imej serta arahan bahasa semula jadi seperti "buang kotoran pada baju", "tukar pakaian kepada jaket biru", atau "kaburkan latar belakang dan tingkatkan kecerahan pada subjek" dan model melakukan pengeditan tempatan yang disasarkan tanpa memerlukan topeng manual dalam banyak kes. Ini menjadikannya praktikal untuk penyuntingan berulang, perbualan.
Gabungan berbilang imej & pemindahan gaya
Imej Flash Gemini 2.5 boleh mengambil beberapa imej dan mengarang mereka ke dalam satu adegan atau memindahkan gaya/tekstur dari satu imej ke imej yang lain. Itu membolehkan mockup produk (meletakkan produk ke dalam adegan), pementasan perabot atau gabungan imejan untuk pemasaran dan e-dagang.
Pengetahuan dunia asli
Oleh kerana ia dibina berdasarkan keluarga Gemini, model itu memanfaatkan pengetahuan dunia — cth, memahami prop, persekitaran atau hubungan objek yang betul secara kontekstual — yang membantu dengan pembinaan pemandangan yang realistik dan suntingan yang koheren dari segi semantik (bukan sekadar output yang munasabah dari segi estetika).
Latensi rendah dan kecekapan kos
Keluarga "Flash" Gemini menyasarkan kependaman rendah dan penggunaan yang cekap kos berbanding dengan peringkat penaakulan yang lebih besar. Pengumuman pembangun menekankan kelajuan dan pertukaran harga/kualiti yang menggalakkan untuk banyak kes penggunaan dunia sebenar.
Asal terbina dalam: tera air SynthID
Semua imej yang dibuat/diedit dengan model termasuk tera air digital SynthID yang tidak kelihatan jadi imej kemudiannya boleh disahkan sebagai dijana AI atau diedit AI. Ini adalah sebahagian daripada mitigasi peringkat produk Google untuk penyalahgunaan dan penjejakan asal.
1) Bagaimanakah saya boleh mencipta watak yang konsisten untuk komik atau kempen jenama yang telah lama dijalankan?
Mengapa ini berfungsi
Nano Banana telah dilatih secara eksplisit untuk mengekalkan penampilan watak yang sama merentas suntingan dan konteks baharu — berguna apabila anda memerlukan wajah, pakaian atau maskot yang sama untuk muncul merentas episod, lakaran kecil atau imej wira. Pembangun memanggil ini "konsistensi watak."
Bagaimana untuk menggesa
- Mulakan dengan blok deskriptif yang menangkap ciri identiti (julat umur, ciri muka, tanda tersendiri, elemen pakaian).
- Tambah arahan "token ketekalan" seperti "Gunakan aksara yang sama merentas semua output — jangan tukar tanda pengenalpastian."
- Untuk output berbilang imej, sediakan satu atau lebih imej rujukan sebagai input untuk mengunci rupa.
Cara menggesa untuk pengeditan yang konsisten
- Mulakan dengan menerangkan sifat identiti teras yang anda mahu dipelihara: umur, warna rambut, ciri yang membezakan (cth, "mempunyai tahi lalat kecil di pipi kiri"), dan gaya pakaian.
- Gunakan gesaan dua bahagian semasa mengedit: mula-mula terangkan apa kemestian kekal sama, kemudian huraikan menukar awak nak. Contoh: "Pelihara: Wanita Asia Timur berusia 28 tahun, bob hitam pendek, tahi lalat pipi kiri kecil. Tukar: letakkan dia di kedai makan tahun 1970-an memakai jaket kulit merah, tersenyum, lampu tungsten hangat."
- Apabila melakukan pengeditan berbilang langkah, sertakan token rujukan kecil seperti "(KEEP_ID: A)" dalam gesaan dan gunakannya semula untuk menandakan subjek yang sama merentas gesaan.
Contoh gesaan
“Buat potret fotorealistik bagi Amina, seorang novelis grafik berusia 28 tahun dengan potongan rambut pendek asimetri, tahi lalat bulan sabit di pipi kirinya, mata coklat hangat dan jaket kulit hijau. Kekalkan ciri pengenalan Amina merentas 6 gesaan adegan berikut: 'Amina di kedai kopi pagi', 'Amina melakar di taman', … . Gunakan persamaan watak yang sama untuk setiap adegan.”
Coretan kod (Python, jana berbilang imej)
Contoh ini menggunakan klien API Gemini yang ditunjukkan dalam dokumen Google — luluskan gesaan deskriptif dan varian adegan gelung anda.
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client()
base_description = (
"Photorealistic portrait of Amina: 28yo graphic novelist, short asymmetrical haircut, "
"crescent mole on left cheek, warm brown eyes, green leather jacket. Keep likeness identical across scenes."
)
scenes = [
"Amina at a morning coffee shop, reading a sketchbook, warm golden hour light.",
"Amina sketching in the park, windy afternoon, soft bokeh background.",
# add more scenes...
]
for i, scene in enumerate(scenes, start=1):
prompt = f"{base_description} Scene: {scene}"
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
parts = response.candidates.content.parts
for part in parts:
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"amina_scene_{i}.png")
2)Bagaimanakah Nano Banana mempercepatkan fotografi produk e-dagang dan imejan A/B?
Mengapa ini kreatif dan berguna
Pasukan produk membelanjakan sumber yang besar untuk berbilang tangkapan, persediaan pencahayaan dan variasi (warna, latar belakang). Nano Banana's gabungan pelbagai imej dan pengeditan segera yang tepat membolehkan anda menjana varian produk yang konsisten dan komposit gaya hidup dengan pantas — untuk tangkapan katalog, adegan gaya hidup dan aset sosial — mengurangkan masa lelaran dan kos pengeluaran.
Cara meminta varian produk
- Sediakan spesifikasi produk ringkas (dimensi, bahan, palet warna) dan gaya fotografi (cth, "latar belakang putih studio, sudut 45°, bayang lembut").
- Untuk varian: ""Buat 4 variasi set kepala Bluetooth ini: hitam, merah jambu, kelabu dengan penutup telinga oren dan kelabu dengan kilauan biru - semuanya dengan pencahayaan yang sama, sudut kamera yang sama dan dalam bilik putih."
- Gunakan gabungan berbilang imej untuk menjatuhkan produk ke dalam pemandangan yang berbeza: "Letakkan beg galas ini pada selimut berkelah pada waktu emas dengan kedalaman medan yang cetek."
Contoh gesaan (produk)
"Imej A (rujukan produk): beg galas kulit premium. Cipta tiga varian katalog dengan latar belakang putih — hijau hutan, tan, arang — tangkapan pada sudut 45°, bayang lembut semula jadi, rasa ISO 100."
Coretan kod: jana Python pantas (varian katalog)
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client(api_key="YOUR_API_KEY")
product_image = open("backpack_ref.png","rb").read()
prompt = ("Make 4 variations of this Bluetooth headset: black, pink, gray with orange ear caps, and gray with blue glint – all with the same lighting, same camera angle, and in a white room.")
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=,
)
# Save images from response parts (example)
for i, part in enumerate(response.candidates.content.parts):
if part.inline_data:
img = Image.open(BytesIO(part.inline_data.data))
img.save(f"backpack_variant_{i}.png")
Coretan ini menggambarkan corak penggunaan Google yang didokumenkan dan merupakan titik permulaan yang baik untuk mengautomasikan penciptaan varian produk.
Imej keluaran:

3) Bagaimanakah saya boleh mencipta ilustrasi pendidikan yang menggabungkan foto dan gambar rajah?
Mengapa ini berfungsi
Nano Banana sepadu pengetahuan dunia (penaakulan multimodal Gemini) supaya ia boleh mentafsir gambar rajah yang dilukis tangan, menganotasi imej atau mencipta visual penjelasan daripada gabungan foto dan arahan teks — berguna untuk e-pembelajaran, dokumen teknikal dan tutor interaktif.
Bagaimana untuk menggesa
- Sediakan imej (cth, foto percubaan fizikal) dan gesaan seperti "Anotasi imej ini dengan label dan anak panah yang menerangkan komponen utama dan buat imej kedua yang menunjukkan sistem dalam keratan rentas".
Contoh gesaan
Hasilkan empat keping penerangan gambar pengetahuan: RANGKAIAN SARAF OTAK MANUSIA, PENGELUARAN sATP RESPARASI SELULER, KOD GENETIK DNA DOUBLE HELIX, PHOTOSTHHYSSS TUMBUHAN CHLOROLPAST
Imej keluaran:

4) Bagaimanakah saya boleh menukar foto sebenar kepada variasi pemasaran atas jenama (pakaian, pencahayaan, latar belakang)?
Mengapa ini berfungsi
Model menyokong transformasi yang disasarkan dan suntingan setempat yang dinyatakan melalui bahasa semula jadi: menukar pakaian, melaraskan pencahayaan, menggantikan latar belakang atau mengalih keluar objek — dan ia cuba mengekalkan identiti subjek dan realisme keseluruhan. Ini membolehkan varian pemasaran pantas (pakaian bermusim, adegan setempat).
Bagaimana untuk menggesa
- Berikan foto asal sebagai input.
- Bertanya untuk suntingan yang disasarkan dengan arahan yang jelas, cth, "Ganti jaket dengan bulu peacoat merah, tukar latar belakang ke jalan bandar pada waktu senja, tambahkan lampu rim yang hangat."
Contoh gesaan
"Bermula dari foto yang dimuat naik, gantikan jaket denim biru dengan bulu peacoat merah yang disesuaikan, tetapkan latar belakang ke jalan bandar awal petang dengan bokeh terang, dan tambahkan pencahayaan rim lembut untuk memisahkan subjek dari latar belakang."
Petua
- Jika anda memerlukan kawalan berulang, lakukan suntingan berbilang pusingan: minta suntingan pertama, kemudian perhalusi ("tanggalkan topi", "kini panaskan suhu warna").
5) Bagaimanakah pencipta Animasi dan pasukan pravisualisasi boleh membuat prototaip adegan dan papan cerita?
Mengapa ia berguna
Pengarah dan DP boleh membuat prototaip persediaan pencahayaan, almari pakaian dan pembingkaian kamera dengan cepat. Nano Banana boleh mengeluarkan papan cerita dengan watak yang konsisten, yang membantu perancangan dan pra-vis. ()
H3: Contoh gesaan
There is a tree house in the forest at night with colorful lights hanging on the trees
Imej keluaran:

6) Bagaimanakah Nano Banana boleh digunakan untuk seni konsep, aset permainan dan watak dalam permainan yang konsisten?
Mengapa studio permainan dan pembangun indie perlu mengambil berat
Mencipta aset seni dan mengulang penampilan watak biasanya memerlukan artis mengolah semula watak berulang kali. Konsistensi watak Nano Banana menjadikannya praktikal untuk menjana banyak pose, pakaian dan persediaan pencahayaan yang kekal setia kepada satu identiti watak — penjimat masa yang besar dalam pra-pengeluaran dan prototaip pantas.
Cara meminta aset permainan
- Tentukan helaian aksara "kanonik" dalam teks: ketinggian, jenis badan, ciri utama, staple almari pakaian.
- Minta berbilang output: "Jana tiga varian perisai tempur dengan ciri wajah yang sama, setiap satu ditunjukkan di hadapan, profil dan ¾ pose."
- Untuk seni persekitaran, gunakan gabungan berbilang imej: berikan satu imej watak dan salah satu persekitaran dan gesa untuk menggabungkannya.
Contoh gesaan (aset permainan)
"Buat tiga varian perisai untuk 'Kael, renjer angin': kekalkan ciri muka (rahang sempit, parut di atas kening kanan). Perisai A: kulit + kain teal; Perisai B: skala + loyang; Perisai C: hitam matte stealth. Output bahagian depan badan penuh, profil, ¾."

Armor C: Stealth Matte Black

Perisai B: Skala + Loyang

Perisai A: Kulit + Kain Teal
7) Bagaimanakah saya boleh mengautomasikan aliran kerja ubah suai foto dengan pengeditan berbilang pusingan perbualan?
Mengapa ini berfungsi
Nano Banana menyokong pengeditan imej berbilang pusingan perbualan: anda boleh meminta pengeditan, memeriksa hasilnya dan membuat susulan dengan lebih banyak arahan dalam bahasa semula jadi. Itu sesuai untuk membina saluran paip ubah suai manusia-dalam-gelung di mana editor menyenggol model merentasi berbilang laluan.
Bagaimana untuk melaksanakan aliran kerja
- Muat naik foto awal dan minta ubah suai garis dasar (pencahayaan, penyingkiran cela).
- Dalam setiap giliran, hantar semula imej yang baru diedit kepada model dengan arahan seterusnya (“kurangkan sorotan, timbulkan bayang-bayang, pangkas kepada 4:5”).
- Log setiap langkah supaya anda boleh kembali atau menggunakan pas yang sama pada satu kelompok.
Coretan aliran kerja mini (Python)
# 1) Initial retouch
prompt1 = "Remove small blemishes, even skin tone, slightly warm color grade"
response1 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response1 -> edited_v1.png
# 2) Follow-up tweak
prompt2 = "Crop to 4:5, increase local contrast on eyes, desaturate background slightly"
response2 = client.models.generate_content(model="gemini-2.5-flash-image-preview", contents=)
# save response2 -> edited_v2.png
Bagaimanakah cara saya menggesa Nano Banana untuk mendapatkan hasil yang terbaik?
Apakah prinsip dorongan yang harus saya ikuti?
Nano Banana bertindak balas terbaik kepada deskriptif, gesaan gaya naratif yang menerangkan pemandangan, perspektif, pencahayaan dan mood — bukan sekadar senarai kata kunci. Panduan rasmi mengesyorkan membekalkan isyarat kamera, kanta, pencahayaan dan gaya untuk fotorealisme, atau isyarat gaya dan palet untuk ilustrasi. Bekalkan juga kekangan (nisbah aspek, latar belakang, keperluan teks) secara eksplisit.
Bagaimanakah cara saya menyusun gesaan yang kuat?
Berikut ialah templat pendek yang boleh diguna semula:
- Templat fotorealistik:
A photorealistic of , , in , illuminated by , captured with , emphasizing . Aspect ratio: . - Pemindahan gaya / templat gubahan:
Combine Image A (style) with Image B (subject). Transfer the color palette of A, keep subject proportions of B. Final style:.
Petua kejuruteraan segera (senarai cepat)
- Penggunaan satu ayat naratif yang jelas bukannya banyak tag terputus-putus.
- Tambah butiran kamera untuk fotorealisme (cth, "85mm, kedalaman medan cetek").
- Untuk aksara yang konsisten merentas suntingan, rujuk imej terdahulu dan atribut yang anda ingin simpan (cth, “simpan jeragat dan selendang biru subjek, tukar gaya rambut kepada…”).
- Semasa mengedit, muat naik imej sumber and terangkan dengan tepat kawasan atau unsur yang hendak diubah.
- Gunakan suntingan berulang, berbilang pusingan untuk memperhalusi butiran visual yang kecil (Nano Banana menyokong penghalusan perbualan).
Nota akhir
Nano Banana (Gemini 2.5 Flash Image) ialah lonjakan kreatif: ia membolehkan pencipta mengekalkan watak dan kesinambungan produk sambil mendayakan suntingan baharu yang berani, gabungan berbilang imej dan lelaran pantas. Gunakannya untuk mempercepatkan penceritaan, mengurangkan geseran pengeluaran dan visual prototaip dengan pantas — tetapi gandingkan keuntungan tersebut dengan semakan yang ketat dan pagar beretika.
Bermula
CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.
Pembangun boleh mengakses Imej Flash Gemini 2.5(senarai Nano Banana CometAPI gemini-2.5-flash-image-preview/gemini-2.5-flash-image entri gaya dalam katalog mereka.) melalui CometAPI, versi model terkini yang disenaraikan adalah pada tarikh penerbitan artikel. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.
