Keluaran Google baru-baru ini Imej Flash Gemini 2.5 — digelar "Nano-Banana" telah menjadi pilihan untuk pengeditan imej perbualan dengan cepat: ia mengekalkan keserupaan yang konsisten merentas suntingan, menggabungkan berbilang imej dengan bersih dan menyokong suntingan tempatan berasaskan segera yang sangat semula jadi. Di bawah ini saya akan melihat apa itu Nano Banana, cara menggunakannya kedua-duanya melalui Gemini Google dan melalui akses pihak ketiga (cth, CometAPI), berikan contoh dan kod segera konkrit yang anda boleh masukkan ke dalam projek dan kongsi petua pembangun untuk pengeditan berbilang pusingan, peningkatan dan gesaan lanjutan. Saya menulis ini sebagai pembangun yang menggunakan model imej setiap hari — anggap ini buku permainan yang praktikal dan sedikit berpandangan.
Apakah Nano-Banana?
Apakah maksud "Imej Kilat Gemini 2.5 / Nano-Banana" sebenarnya?
Nano-Pisang ialah nama panggilan / nama kod komuniti untuk Imej Flash Gemini 2.5, model penjanaan & penyuntingan imej terbaharu Google DeepMind. Ia direka untuk segera-dahulu penyuntingan (anda memberikan arahan bahasa semula jadi) dengan tumpuan khusus pada konsistensi watak (memastikan orang/haiwan peliharaan/objek yang sama melihat tepat pada suntingan), gabungan pelbagai imej (menggabungkan objek merentas foto sumber) dan penggunaan interaktif kependaman rendah dalam apl seperti Gemini dan Google AI Studio. Model ini tersedia melalui API Gemini Google, AI Studio dan sudah pun dipaparkan dalam CometAPI.
Sebagai pembangun, fikirkan Nano-Banana bukan terutamanya sebagai penjana imej "dari calar" tulen, tetapi sebagai penjana yang berkebolehan tinggi pembantu penyuntingan foto dan gubahan: ia memahami kandungan imej anda, mengingati subjek merentas suntingan dan bertindak balas kepada arahan bahasa semula jadi dengan cara yang sesuai dengan gelung reka bentuk berulang cepat. Itu menjadikannya amat berguna untuk mockup produk, tangkapan watak yang konsisten, lelaran konsep pantas dan permainan kreatif sosial.
ringkasan yang dihadapi oleh pembangun
- Nama Model: gemini-2.5-flash-image-preview / Gemini-2.5-flash-image.
- Ketekalan & kesinambungan: Nano-Banana memegang butiran watak merentas suntingan dengan lebih dipercayai berbanding kebanyakan saingan, menjadikannya lebih disukai untuk suntingan dan penceritaan berurutan.
- Speed: Pengguna melaporkan penjanaan pantas—selalunya di bawah 10 saat untuk banyak pengeditan—membantu untuk aliran kerja berulang.
- Reka bentuk pertama mengedit: Walaupun banyak model dioptimumkan untuk penjanaan terdorong teks tulen, UX dan API Nano-Banana menekankan pengeditan (suntingan satu pukulan, gabungan berbilang imej, pemindahan gaya).
Bagaimanakah saya boleh mengedit dengan Nano-Banana pada CometAPI?
CometAPI ialah pasaran/pembungkus API yang mengagregatkan banyak model (termasuk API Imej Kilat Gemini 2.5 (Pisang Nano)) di belakang satu titik akhir yang serasi dengan OpenAI. Jika anda ingin membuat prototaip dengan cepat atau mengelak daripada menyediakan akaun Google Cloud/Vertex untuk ujian pertama, CometAPI ialah jambatan praktikal — anda mendapat kunci API, pilih gemini-2.5-flash-image (Atau gemini-2.5-flash-image-preview ), kemudian hantar permintaan seperti suntingan imej gaya Sembang. CometAPI juga menawarkan contoh dan membimbing untuk mencuba model.
Mengapa menggunakan CometAPI?
- Satu kunci API untuk mengawal semuanya — memudahkan ujian berbilang penyedia.
- Tukar penyedia dalam pengeluaran jika harga atau SLA berubah.
- Berguna untuk pasukan yang mahukan kawalan tahap perkhidmatan (penghadan kadar, pengelogan berpusat).
Cara memanggil Nano-Banana (CometAPI) — contoh praktikal
Di bawah adalah contoh yang mudah. Gantikan YOUR_COMET_KEY dan failkan laluan dengan anda sendiri.
CURL — suntingan asas (imej + gesaan → imej yang disunting)
Contoh:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Penerangan:**Mula-mula, tukar fail imej sumber anda kepada rentetan Base64 dan letakkannya inline_data.data. Kedua, Jangan sertakan awalan seperti data:image/jpeg;base64, . Output juga terletak di candidates.content.parts dan merangkumi:
- Bahagian teks pilihan (huraian atau gesaan).
- Bahagian imej sebagai
inline_data(di manadataialah Base64 imej output).
Jika anda hanya ingin mencuba penyuntingan imej pada Nano-Banana, CometAPI menawarkan kredit percuma kepada pengguna baharu. Anda boleh mencuba Nano-Banana di taman permainan atau menggunakan API Imej Flash Gemini 2.5. Walau bagaimanapun, jika anda mahukan penggunaan tanpa had, anda boleh membayar 20% daripada harga Gemini.
Nano-Banana mempunyai beberapa kelebihan teras: keserupaan yang konsisten, suntingan tempatan yang disasarkan melalui bahasa semula jadi dan gabungan berbilang imej.
Seterusnya, saya akan menunjukkan kelebihan Nano-Banana melalui beberapa kes penggunaan, dan anda akan melihat keajaibannya.
Contoh 1: Gabungkan berbilang imej ke dalam satu kolaj
Muat naik imej:

Contoh penerangan input: Seorang model sedang bergambar dan bersandar pada bmw merah jambu. Dia memakai barang-barang berikut, pemandangan itu berlatar belakang kelabu muda. Alien hijau adalah rantai kunci dan ia dilekatkan pada beg tangan merah jambu. Model itu juga mempunyai burung kakak tua merah jambu di bahunya. Terdapat seekor pug duduk di sebelahnya memakai kolar merah jambu dan fon kepala emas.
Base64 yang dikembalikan ditukar kembali kepada imej:

Kod:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Nota: tukar fail imej sumber anda kepada rentetan Base64 dan masukkan ke dalam inline_data.data (jangan sertakan awalan seperti data:image/jpeg;base64,).
Gunakan analisis kes: Dengan menggunakan gabungan berbilang imej, pereka boleh menjadi lebih kreatif. Sebagai contoh, pereka rumah boleh menggabungkan imej untuk membuat rendering kasar kesannya. Pengguna boleh menggabungkan imej seluruh badan mereka dengan perkara yang mereka ingin beli untuk membantu mereka memutuskan sama ada untuk membeli. Ini juga boleh dijadikan rujukan untuk penghasilan animasi dan komik.
Contoh 2: Edit imej untuk mengekalkan persamaan
Di bawah ini saya akan menyediakan beberapa pusingan suntingan untuk menguji pisang nano.
Mula-mula, muat naik imej:

Kedua, meminta: Tambah anak anjing ke rumput
Pengeluaran :

Akhirnya, meminta: Gunakan imej rujukan watak yang dilampirkan. Pelihara anjing itu. Letakkan watak dalam pemandangan jalanan bandar neon yang hujan pada waktu malam. Pastikan ciri muka sama dengan rujukan.

Gunakan analisis kes: Ia boleh dilihat bahawa konsistensi yang agak tinggi dikekalkan dalam beberapa pusingan pengubahsuaian imej.
Contoh 3: Pemindahan gaya dan ubah suai butiran muka
Muat naik imej:

meminta: Tajamkan muka sedikit, tambahkan butiran filem 6%, pangkas hingga 16:9. Jangan ubah ciri muka, Tambah cahaya rim lembut di sebelah kanan.
pengeluaran:

Kes penggunaan lain Nano-Banana
1) Gambar kepala korporat & potret profesional
Penggunaan: buat gambar kepala jenama seragam dengan cepat (pemasaran, LinkedIn, bios syarikat). Nano-Banana mengekalkan kesetiaan wajah semasa menukar pakaian, latar belakang atau pencahayaan.
Prompt — pakaian + pencahayaan (edit)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Prompt — pertukaran latar belakang + ubah suai
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) E-dagang & visualisasi produk
Penggunaan: letakkan produk ke dalam adegan gaya hidup, hasilkan tangkapan produk yang konsisten dari sudut berbeza, atau tunjukkan varian warna.
Prompt — produk dalam adegan (gabungan berbilang imej)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Prompt — varian warna (edit)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Kandungan sosial & pemasaran influencer
Penggunaan: suntingan gaya pantas, pertukaran pakaian, tindanan bermusim atau tanaman berbilang format untuk platform sosial.
Prompt — suntingan bermusim untuk suapan dan cerita
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt — varian promosi yang digayakan
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Konsistensi aset watak / jenama (maskot, watak berulang)
Penggunaan: kekalkan logo, maskot atau watak yang sama secara visual merentas adegan, kempen atau episod.
Prompt — penguatkuasaan helaian aksara
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Pembaikan & pewarnaan foto bersejarah
Gunakan: pulihkan atau warnakan imej arkib sambil mengekalkan komposisi dan butiran wajah yang halus.
Prompt — warnakan + pembaikan
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Apakah teknik gesaan lanjutan yang meningkatkan kebolehpercayaan?
Penggunaan sauh rujukan and kekangan mikro
Sauh rujukan ialah maklumat ringkas dan boleh disahkan yang anda tambahkan untuk mengurangkan kesamaran: nama pakaian yang tepat ("blazer navy, berdada tunggal, lapel takuk"), rujukan pencahayaan ("pencahayaan Rembrandt") atau istilah kamera ("lensa potret 50mm, f/2.8"). Kekangan mikro memberitahu model apa yang tidak boleh diubah (cth, "jangan ubah tatu pada lengan kanan"). Ini mengurangkan kebebasan model dengan cara yang produktif dan biasanya meningkatkan kesetiaan hasil.
Gelung lelaran: tanya, nilai, perhalusi
- Pas pertama: gunakan gesaan yang tepat tetapi padat.
- Menilai keputusan: perhatikan apa yang salah model (cth, menukar bentuk muka, kehilangan aksesori).
- Pembetulan yang disasarkan: hantar gesaan susulan pendek merujuk hasil sebelumnya ("Simpan segala-galanya daripada keluaran terakhir tetapi simpan anting-anting telinga kiri asal dan jadikan kening lebih tebal"). Kekuatan penyuntingan perbualan Nano-Banana membolehkan anda pulih dengan cepat.
Rangkaian suntingan untuk transformasi yang kompleks
Untuk suntingan besar, pecahkan kerja kepada rangkaian suntingan yang lebih kecil dan bukannya satu arahan besar-besaran. Contoh rantai: (1) pertukaran latar belakang → (2) kemas kini pakaian → (3) penggredan warna → (4) ubah suai akhir. Ini memastikan setiap fokus segera dan mengurangkan kesan silang yang tidak dijangka.
Bagaimanakah saya harus menyusun gesaan untuk Nano-Banana? (Anatomi segera)
Gesaan imej yang baik mempunyai struktur yang konsisten. Gunakan yang berikut anatomi segera untuk mendapatkan hasil yang tepat dan boleh diulang:
Anatomi segera (urutan yang disyorkan)
- Tindakan / Matlamat — apa yang anda mahu model itu do? (cth, "Edit swafoto ini untuk mencipta gambar kepala profesional" atau "Jana foto gaya hidup produk yang menggabungkan kedua-dua imej ini").
- Subjek — siapa atau apa yang ada dalam imej? Jelaskan tentang identiti, umur, bilangan orang, item, dsb.
- Atribut - ciri visual: pakaian, ekspresi muka, warna mata, rambut, prop.
- Persekitaran & Pencahayaan — lokasi, masa hari, pencahayaan mood, jarak fokus, petunjuk lensa (“potret 35mm”).
- Gaya & Selesai — gaya fotografi (sinematik, studio, butiran filem, hyperreal), atau gaya seni (lukisan minyak, vektor, komik).
- Kekangan / Keselamatan — apa-apa yang perlu dielakkan (tiada logo, tiada kebogelan, tiada teks perubatan).
- Token ketekalan (pilihan) — frasa pendek yang anda gunakan semula untuk mengekalkan pengecaman aksara merentas berbilang gesaan (cth, “Gunakan rujukan aksara 'Luna scarf'”).
Petua untuk konsistensi watak (langkah praktikal)
- Gunakan "frasa rujukan": sertakan frasa pendek dan unik yang terikat pada subjek (cth, “token watak: 'jaket biru-Maya'”) dalam setiap gesaan. Model ini akan memautkan pengeditan dengan lebih pasti kepada aksara yang sama jika anda menggunakan semula frasa ini.
- Sertakan butiran berlabuh: nyatakan ciri yang tersendiri dan tidak berubah (cth, “parut kening kiri, tanda lahir hijau pada pipi kanan”) supaya model mempunyai penambat tetap untuk dikekalkan.
- Kekalkan pose dan bingkai apabila boleh: jika anda mahukan kesinambungan sebenar, pastikan sudut kamera/perihalan pose serupa merentas gesaan.
- Mulakan dari imej asal yang sama: untuk menyunting aliran kerja, sentiasa bekalkan imej sumber yang sama seperti sauh. Apabila anda mesti menukar foto, masukkan imej asal sebagai input tambahan dan terangkan transformasi.
Apakah mod kegagalan biasa dan bagaimana saya membetulkannya?
Kegagalan: hanyut identiti (subjek kelihatan berbeza)
Punca: model terlalu umum gaya yang diminta atau salah tafsir kekangan.
pembetulan: tambah klausa "pelihara" eksplisit, lampirkan imej asal sebagai rujukan, atau lakukan pengeditan dalam langkah yang lebih kecil dan sahkan output perantaraan.
Kegagalan: prop atau tangan yang tidak konsisten
Punca: tangan dan aksesori kecil dari segi sejarah sukar untuk kebanyakan model imej.
pembetulan: sertakan kekangan mikro ("pelihara jam tangan pada pergelangan tangan kanan"), sediakan rujukan jarak dekat yang terperinci untuk item kecil, atau jalankan langkah pembetulan sasaran akhir yang memfokuskan hanya pada elemen yang bermasalah.
Kegagalan: pencahayaan atau bayang-bayang kelihatan tidak semula jadi
Punca: suntingan besar (pertukaran latar belakang atau pencahayaan semula utama) boleh mencipta ketidakpadanan.
pembetulan: minta model memadankan "cahaya arah dari kiri atas, bayang lembut" atau berikan imej rujukan pencahayaan yang diingini.
Kesimpulan
Nano-Banana (Gemini 2.5 Flash Image) ialah satu langkah ke hadapan yang ketara dalam pengeditan dan penjanaan imej gred pengguna: pantas, konsisten dan bersepadu dengan ekosistem Gemini dan alatan keselamatan Google. Hasil terbaik datang dari gesaan yang jelas dan memfokuskan tugas, arahan pemeliharaan eksplisit apabila anda memerlukan ketekalan identiti dan aliran kerja berperingkat yang memisahkan pratonton pantas daripada pemaparan akhir. Apabila model dan ekosistem berkembang, jurutera pantas harus terus menguji, mencatat hasil dan membina kawalan yang dihadapi pengguna yang menjadikan pengeditan telus dan boleh diterbalikkan.


