Rilisan terbaru Google Gambar Flash Gemini 2.5 — dijuluki “Nano-Banana” telah dengan cepat menjadi andalan untuk penyuntingan gambar percakapan: ia menjaga kemiripan tetap konsisten di seluruh suntingan, menggabungkan beberapa gambar dengan rapi, dan mendukung suntingan lokal berbasis perintah yang sangat alami. Di bawah ini saya akan menjelaskan apa itu Nano Banana, cara menggunakannya, baik melalui Gemininya Google dan melalui akses pihak ketiga (misalnya, CometAPI), berikan contoh prompt konkret dan kode yang bisa Anda masukkan ke dalam proyek, dan bagikan kiat pengembang untuk pengeditan multi-turn, peningkatan skala, dan prompt lanjutan. Saya menulis ini sebagai pengembang yang menggunakan model gambar setiap hari — anggap saja ini sebagai panduan praktis yang sedikit beropini.
Apa itu Nano-Banana?
Apa sebenarnya arti “Gemini 2.5 Flash Image / Nano-Banana”?
Nano-Pisang adalah nama panggilan / nama kode komunitas untuk Gambar Flash Gemini 2.5, model pembuatan & pengeditan gambar terbaru Google DeepMind. Dirancang untuk prompt-pertama pengeditan (Anda memberinya instruksi bahasa alami) dengan fokus khusus pada konsistensi karakter (menjaga orang/hewan peliharaan/objek yang sama terlihat di seluruh suntingan), fusi multi-gambar (mencampur objek di seluruh foto sumber), dan penggunaan interaktif latensi rendah dalam aplikasi seperti Gemini dan Google AI Studio. Model ini tersedia melalui API Gemini milik Google, AI Studio, dan sudah muncul di CometAPI.
Sebagai pengembang, pikirkan Nano-Banana bukan sebagai generator gambar murni “dari awal”, tetapi sebagai generator gambar yang sangat mumpuni. asisten pengeditan dan komposisi foto: memahami konten gambar Anda, mengingat subjek di setiap penyuntingan, dan merespons instruksi bahasa alami dengan cara yang sesuai dengan siklus desain iteratif yang cepat. Hal ini membuatnya sangat berguna untuk mockup produk, gambar karakter yang konsisten, iterasi konsep yang cepat, dan permainan kreatif sosial.
ringkasan yang menghadap pengembang
- Nama model: pratinjau-gambar-gemini-2.5-flash / gambar-gemini-2.5-flash.
- Konsistensi & kontinuitas: Nano-Banana mempertahankan detail karakter di seluruh suntingan dengan lebih andal daripada banyak pesaingnya, membuatnya lebih disukai untuk suntingan berurutan dan penceritaan.
- Kecepatan: Pengguna melaporkan pembuatan yang cepat—seringkali di bawah 10 detik untuk banyak pengeditan—bermanfaat untuk alur kerja berulang.
- Desain pengeditan terlebih dahulu: Sementara banyak model dioptimalkan untuk pembuatan teks murni, UX dan API Nano-Banana menekankan pada pengeditan (pengeditan satu kali, penggabungan beberapa gambar, transfer gaya).
Bagaimana saya bisa mengedit dengan Nano-Banana di CometAPI?
CometAPI adalah pasar/pembungkus API yang menggabungkan banyak model (termasuk API Gambar Flash Gemini 2.5 (Nano Banana)) di balik satu titik akhir yang kompatibel dengan OpenAI. Jika Anda ingin membuat prototipe dengan cepat atau menghindari penyediaan akun Google Cloud/Vertex untuk pengujian pertama, CometAPI adalah jembatan praktis — Anda mendapatkan kunci API, pilih gemini-2.5-flash-image (Atau gemini-2.5-flash-image-preview ), lalu kirim permintaan seperti edit gambar gaya Obrolan. CometAPI juga menawarkan contoh dan membimbing untuk mencoba modelnya.
Mengapa menggunakan CometAPI?
- Satu kunci API untuk mengatur semuanya — menyederhanakan pengujian beberapa penyedia.
- Tukar penyedia dalam produksi jika harga atau SLA berubah.
- Berguna untuk tim yang menginginkan kontrol tingkat layanan (pembatasan kecepatan, pencatatan terpusat).
Cara memanggil Nano-Banana (CometAPI) — contoh praktis
Berikut adalah contoh sederhana. Ganti YOUR_COMET_KEY dan jalur file dengan milik Anda sendiri.
CURL — edit dasar (gambar + perintah → gambar yang diedit)
Contoh:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Deskripsi:**Pertama, ubah file gambar sumber Anda menjadi string Base64 dan letakkan di inline_data.dataKedua, Jangan sertakan awalan seperti data:image/jpeg;base64, Outputnya juga terletak di candidates.content.parts dan termasuk:
- Bagian teks opsional (deskripsi atau perintah).
- Bagian gambar sebagai
inline_data(dimanadataadalah Base64 dari gambar keluaran).
Jika Anda hanya ingin mencoba mengedit gambar di Nano-Banana, CometAPI menawarkan kredit gratis untuk pengguna baru. Anda dapat mencoba Nano-Banana di Playground atau menggunakan Gemini 2.5 Flash Image API. Namun, jika Anda ingin penggunaan tanpa batas, Anda dapat membayar diskon 20% untuk harga Gemini.
Nano-Banana memiliki beberapa keunggulan inti: kemiripan yang konsisten, penyuntingan lokal yang ditargetkan melalui bahasa alami, dan penggabungan multi-gambar.
Selanjutnya, saya akan menunjukkan keunggulan Nano-Banana melalui beberapa kasus penggunaan, dan Anda akan melihat keajaibannya.
Contoh 1: Gabungkan beberapa gambar menjadi satu kolase
Unggah gambar:

Contoh deskripsi masukan: Seorang model berpose dan bersandar di sebuah BMW merah muda. Ia mengenakan barang-barang berikut, dengan latar belakang abu-abu muda. Alien hijau tersebut adalah gantungan kunci yang terpasang pada tas tangan merah muda. Model tersebut juga memiliki seekor burung beo merah muda di bahunya. Seekor anjing pug duduk di sebelahnya, mengenakan kerah merah muda dan headphone emas.
Base64 yang dikembalikan diubah kembali menjadi gambar:

Kode:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Catatan: ubah file gambar sumber Anda menjadi string Base64 dan masukkan ke dalam inline_data.data (jangan sertakan awalan seperti data:image/jpeg;base64,).
Analisis kasus penggunaan: Dengan menggunakan fusi multi-gambar, desainer dapat lebih kreatif. Misalnya, desainer rumah dapat menggabungkan gambar untuk membuat rendering kasar efeknya. Konsumen dapat menggabungkan gambar seluruh tubuh mereka dengan barang yang ingin mereka beli untuk membantu mereka memutuskan apakah akan membeli. Ini juga dapat digunakan sebagai referensi untuk produksi animasi dan komik.
Contoh 2: Edit gambar untuk mempertahankan kesamaan
Di bawah ini saya akan memberikan beberapa putaran penyuntingan untuk menguji nano banana.
Pertama, unggah gambar:

Kedua, Cepat: Tambahkan anak anjing ke halaman rumput
Output:

Terakhir, Cepat: Gunakan gambar referensi karakter yang terlampir. Simpan anjingnya. Tempatkan karakter di jalanan kota neon yang berhujan di malam hari. Pastikan fitur wajah karakter identik dengan referensi.

Analisis kasus penggunaan: Dapat dilihat bahwa konsistensi yang cukup tinggi dipertahankan dalam beberapa putaran modifikasi gambar.
Contoh 3: Transfer gaya dan modifikasi detail wajah
Unggah gambar:

Cepat: Pertajam sedikit wajah, tambahkan 6% film grain, potong menjadi 16:9. Jangan ubah fitur wajah. Tambahkan cahaya tepi yang lembut di sisi kanan.
keluaran:

Kasus penggunaan lain dari Nano-Banana
1) Foto kepala perusahaan & potret profesional
Kegunaan: Buat foto profil merek yang seragam dengan cepat (pemasaran, LinkedIn, biografi perusahaan). Nano-Banana mempertahankan kesetiaan wajah saat berganti pakaian, latar belakang, atau pencahayaan.
Prompt — pakaian + pencahayaan (sunting)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Prompt — tukar latar belakang + perbaiki
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) E-commerce & visualisasi produk
Penggunaan: menempatkan produk dalam suasana gaya hidup, menghasilkan gambar produk yang konsisten dari berbagai sudut, atau menunjukkan varian warna.
Prompt — produk dalam adegan (penggabungan multi-gambar)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Prompt — varian warna (sunting)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Konten sosial & pemasaran influencer
Penggunaan: penyuntingan gaya cepat, pertukaran pakaian, pelapisan musiman, atau pemotongan berbagai format untuk platform sosial.
Prompt — suntingan musiman untuk umpan dan cerita
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt — varian promo bergaya
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Konsistensi karakter/aset merek (maskot, karakter berulang)
Penggunaan: pertahankan logo, maskot, atau karakter yang identik secara visual di semua adegan, kampanye, atau episode.
Prompt — penegakan lembar karakter
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Perbaikan dan pewarnaan foto historis
Penggunaan: memulihkan atau mewarnai gambar arsip sambil mempertahankan komposisi dan detail wajah yang halus.
Prompt — warnai + perbaiki
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Teknik prompting tingkat lanjut apa yang meningkatkan keandalan?
penggunaan jangkar referensi dan kendala mikro
Jangkar referensi adalah informasi singkat dan terverifikasi yang Anda tambahkan untuk mengurangi ambiguitas: nama pakaian yang tepat ("blazer biru tua, model single-breasted, kerah berlekuk"), referensi pencahayaan ("pencahayaan Rembrandt"), atau istilah kamera ("lensa potret 50mm, f/2.8"). Batasan mikro memberi tahu model apa yang tidak boleh diubah (misalnya, "jangan ubah tato di lengan bawah kanan"). Ini mengurangi kebebasan model secara produktif dan biasanya meningkatkan fidelitas hasil.
Loop iterasi: bertanya, mengevaluasi, menyempurnakan
- Lulus pertama: Gunakan perintah yang tepat namun ringkas.
- Menilai hasil: perhatikan kesalahan yang dilakukan model tersebut (misalnya, mengubah bentuk wajah, kehilangan aksesori).
- Koreksi yang ditargetkan: Kirimkan prompt tindak lanjut singkat yang merujuk pada hasil sebelumnya (“Simpan semua hasil keluaran terakhir, tetapi pertahankan anting kiri asli dan buat alis lebih tebal”). Keunggulan penyuntingan percakapan Nano-Banana memungkinkan Anda pulih dengan cepat.
Rantai suntingan untuk transformasi kompleks
Untuk pengeditan besar, bagi pekerjaan menjadi beberapa pengeditan kecil, alih-alih satu instruksi besar. Contoh rangkaian: (1) pertukaran latar belakang → (2) pembaruan pakaian → (3) gradasi warna → (4) retouch akhir. Ini menjaga setiap perintah tetap fokus dan mengurangi efek silang yang tidak terduga.
Bagaimana saya harus menyusun prompt untuk Nano-Banana? (Anatomi prompt)
Prompt gambar yang baik memiliki struktur yang konsisten. Gunakan hal-hal berikut: anatomi cepat untuk mendapatkan hasil yang tepat dan dapat diulang:
Anatomi prompt (urutan yang disarankan)
- Tindakan / Tujuan — apa yang Anda inginkan dari model tersebut do? (misalnya, “Edit swafoto ini untuk membuat foto kepala profesional” atau “Buat foto gaya hidup produk yang menggabungkan kedua gambar ini”).
- Subjek — siapa atau apa yang ada di gambar? Jelaskan secara spesifik tentang identitas, usia, jumlah orang, barang, dll.
- atribut — karakteristik visual: pakaian, ekspresi wajah, warna mata, rambut, alat peraga.
- Lingkungan & Pencahayaan — lokasi, waktu, pencahayaan suasana hati, panjang fokus, petunjuk lensa (“potret 35mm”).
- Gaya & Penyelesaian — gaya fotografi (sinematik, studio, film grain, hiperrealistis), atau gaya seni (lukisan cat minyak, vektor, komik).
- Kendala / Keamanan — apa pun yang harus dihindari (tidak ada logo, tidak ada ketelanjangan, tidak ada teks medis).
- Token konsistensi (opsional) — frasa pendek yang Anda gunakan kembali untuk mempertahankan pengenalan karakter di beberapa perintah (misalnya, “Gunakan referensi karakter 'syal Luna'”).
Petunjuk untuk konsistensi karakter (langkah praktis)
- **Gunakan “frasa referensi”**Sertakan frasa singkat dan unik yang terkait dengan subjek (misalnya, "token karakter: 'Maya-blue-jacket'") di setiap prompt. Model akan lebih andal menghubungkan suntingan ke karakter yang sama jika Anda menggunakan kembali frasa ini.
- Sertakan detail yang dijangkarkan: tentukan fitur yang khas dan tidak dapat diubah (misalnya, “bekas luka alis kiri, tanda lahir hijau di pipi kanan”) sehingga model memiliki jangkar tetap untuk dipertahankan.
- Pertahankan pose dan pembingkaian jika memungkinkan:jika Anda menginginkan kontinuitas yang nyata, pertahankan deskripsi sudut/pose kamera yang serupa di semua perintah.
- Mulai dari gambar asli yang samaUntuk alur kerja pengeditan, selalu berikan gambar sumber yang sama dengan jangkar. Jika Anda perlu mengubah foto, sertakan gambar asli sebagai masukan tambahan dan jelaskan transformasinya.
Apa saja kegagalan umum dan bagaimana cara memperbaikinya?
Kegagalan: pergeseran identitas (subjek tampak berbeda)
Sebab: model tersebut menggeneralisasikan gaya yang diminta secara berlebihan atau salah menafsirkan batasan.
perbaikan: tambahkan klausa “pertahankan” yang eksplisit, lampirkan gambar asli sebagai referensi, atau lakukan pengeditan dalam langkah-langkah yang lebih kecil dan validasi keluaran antara.
Kegagalan: alat peraga atau tangan tidak konsisten
Sebab: tangan dan aksesori kecil secara historis sulit bagi banyak model gambar.
perbaikan: sertakan kendala mikro (“simpan jam tangan di pergelangan tangan kanan”), berikan referensi jarak dekat yang mendetail untuk item kecil, atau jalankan langkah koreksi tertarget akhir yang berfokus hanya pada elemen yang bermasalah.
Kegagalan: pencahayaan atau bayangan terlihat tidak alami
Sebab: pengeditan besar (pertukaran latar belakang atau perubahan pencahayaan utama) dapat menimbulkan ketidaksesuaian.
perbaikan: minta model untuk mencocokkan “cahaya terarah dari kiri atas, bayangan lembut” atau berikan gambar referensi pencahayaan yang diinginkan.
Kesimpulan
Nano-Banana (Gemini 2.5 Flash Image) merupakan langkah maju yang signifikan dalam pengeditan dan pembuatan gambar tingkat konsumen: cepat, konsisten, dan terintegrasi dengan ekosistem Gemini dan perangkat keamanan Google. Hasil terbaik berasal dari perintah yang jelas dan berfokus pada tugas, instruksi preservasi eksplisit saat Anda membutuhkan konsistensi identitas, dan alur kerja bertahap yang memisahkan pratinjau cepat dari render akhir. Seiring berkembangnya model dan ekosistem, para insinyur prompt harus terus menguji, mencatat hasil, dan membangun kontrol yang dapat diakses pengguna yang membuat pengeditan menjadi transparan dan dapat dibalik.


