Nano Banana 2 — singkatan yang digunakan komuniti untuk model penjanaan imej terbaharu Google dalam keluarga Gemini — dengan pantas mengubah jangkaan terhadap penjanaan dan penyuntingan imej yang pantas serta berkualiti tinggi. Dilancarkan pada akhir Februari 2026, varian “Flash Image” ini (Gemini 3.1 Flash Image / Nano Banana 2) menyasarkan pembangun dan pasukan produk yang memerlukan keluaran setara profesional pada kadar pemprosesan tinggi dan latensi rendah. Dalam artikel ini, saya menggabungkan laporan dan dokumentasi terkini untuk menerangkan apa itu Nano Banana 2, bagaimana prestasinya dalam penanda aras, cara mengakses dan memanggilnya (termasuk melalui gerbang pihak ketiga seperti CometAPI), serta corak prompt dan penggunaan praktikal yang boleh anda terapkan dalam produksi.
CometAPI menyediakan antara muka gaya HTTP tunggal yang mendedahkan banyak model (termasuk model imej) di bawah titik akhir yang konsisten. Ini boleh memudahkan pertukaran antara vendor atau menggabungkan output daripada beberapa model. Nano Banana 2 (Gemini 3.1 Image) telah tersedia di CometAPI.
Apa itu Nano Banana 2?
Nano Banana 2 (selari secara dalaman dengan Gemini 3.1 Flash Image) ialah model penjanaan imej berfokus dan berkecekapan tinggi daripada Google yang memprioritaskan kelajuan, kos per imej yang lebih rendah, serta pematuhan arahan yang lebih kukuh untuk tugas imej kreatif dan editorial. Ia direka untuk duduk bersama varian “Pro” yang lebih tinggi fideliti: Nano Banana 2 untuk throughput tinggi dan Nano Banana Pro (Gemini 3 Pro Image) untuk output premium bertaraf aset.
Ia direka untuk menyampaikan:
- Inferens pantas (menyasarkan latensi sangat rendah supaya penjanaan dan suntingan imej terasa hampir serta-merta).
- Kualiti visual tinggi menghampiri keluarga “Pro” tetapi dengan penggunaan pengiraan/kos yang lebih rendah.
- Pematuhan arahan yang lebih baik (render subjek yang diminta, teks dalam imej, dan adegan berbilang watak dengan lebih tepat).
- Sokongan resolusi dan nisbah aspek yang luas, daripada pratonton kecil pantas hingga saluran paip asli 2K/4K untuk aset akhir.
Apa yang membezakan Nano Banana 2 daripada Nano Banana / Pro asal?
- Seni bina / enjin: Dibina di atas rangka kerja inferens Flash Gemini (Gemini 3.1 Flash Image) jadi ia menukar beberapa tetapan kualiti maksimum untuk peningkatan dramatik dalam kelajuan dan kos.
- Kes penggunaan: Sesuai untuk automasi berskala besar (aset pemasaran, lakaran kecil, UI), penyuntingan hampir masa nyata, dan aliran kerja di mana latensi dan kos penting tetapi anda masih memerlukan fideliti subjek bertaraf Pro.
Prestasi Penanda Aras Nano Banana 2

Konsisten Merentasi Kategori
Gemini 3.1 Flash Image menunjukkan peningkatan yang boleh diukur dalam setiap kategori yang dilaporkan berbanding Gemini 2.5 Flash.
Peningkatan Paling Ketara
- Kualiti visual
- Penyuntingan komposisi berbilang input
- Ketahanan penyuntingan umum
Kedudukan Kompetitif
- Mendahului keutamaan keseluruhan GenAI-Bench dalaman.
- Mengatasi GPT-Image 1.5 dalam metrik keseluruhan dan visual.
- Peningkatan kecil yang sempit menunjukkan penghalusan seni bina dan bukannya perubahan radikal.
Bagaimana saya boleh mengakses Nano Banana 2?
Di mana ia tersedia
Nano Banana 2 boleh diakses melalui peralatan Gemini Google (aplikasi Gemini), Gemini API (didokumenkan di bawah dok pembangun AI Google), dan sedang dibentangkan melalui produk perusahaan awan seperti Vertex AI untuk pratonton/integrasi perusahaan. CometAPI juga telah mengumumkan sokongan dan pembalut untuk memudahkan integrasi.
Cara Menggunakan API Nano Banana 2 (CometAPI): apakah pilihan yang ada?
Panduan CometAPI menggunakan bentuk
generateContentgaya Gemini dan memulangkan imej sebagai Base64 dalamcandidates[0].content.parts[].inline_data.data. Anda mesti menyahkod Base64 itu untuk menyimpan fail di sisi klien. Anda hanya perlu menggantikanhttps: //generativelanguage.googleapis.comdenganhttps://api.cometapi.com. Imej yang dipulangkan biasanya diberikan sebagaiinline_datayang disandikan Base64. Anda perlu menyahkodnya di sisi klien dan menyimpan sebagai fail. CometAPI menyediakan diskaun untuk membantu anda menggunakan API Nano Banana 2.
CometAPI menyediakan pembalut REST bersepadu dan titik akhir jelas untuk model Gemini — sesuai jika anda lebih suka satu kelayakan dan mahu menukar penyedia tanpa mengubah kod aplikasi anda. Untuk Nano Banana 2, halaman CometAPI menyertakan snippet curl terus untuk titik akhir gemini-3.1-flash-image-preview:generateContent mereka. Di bawah ialah contoh curl yang dikemas berdasarkan dok CometAPI.
Prasyarat untuk Menggunakan Nano Banana 2 melalui CometAPI
Akaun CometAPI & Kunci API: Cipta akaun di CometAPI dan jana kunci akses API anda (sk-…). Kunci ini digunakan untuk mengesahkan semua permintaan API ke titik akhir CometAPI.
Bahasa Pengaturcaraan & Runtimes:
- Node.js 18+ (untuk JavaScript/TypeScript)
- Python 3.10+
- (Atau mana-mana bahasa yang boleh membuat permintaan HTTP)
Alat HTTP atau SDK:
- Untuk JavaScript:
fetch,axios, atau klien serasi OpenAI - Untuk Python:
requests,httpx, atau klien OpenAI - Alat ini membantu anda menghantar panggilan API dan mengendalikan respons.
Gambaran ringkas pola permintaan
- Base URL:
https://api.cometapi.com(asas CometAPI). - Nama model:
gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image) ataugemini-2.5-flash-imagebergantung pada ketersediaan. - Auth: pengepala
Authorization: sk-xxxx— CometAPI biasanya menggunakan kunci gayask-. - Respons: imej dipulangkan sebagai Base64 di bawah
response.candidates[0].content.parts[].inline_data.data. Nyahkod dan tulis ke cakera.
Aliran Kerja Contoh (Tahap Tinggi)
- Dapatkan kunci API daripada CometAPI.
- Pilih pengecam model anda (cth.
gemini-3.1-flash-imageatau yang serupa, bergantung pada ketersediaan). - Hantar permintaan POST ke titik akhir penjanaan model dengan prompt anda.
- Kendalikan data imej yang dipulangkan dalam aplikasi anda (nyahkod base64, sajikan sebagai PNG, dll.).
- Untuk penyuntingan imej, sertakan data imej sedia ada dan arahan suntingan dalam permintaan anda.
Menggunakan API rasmi Gemini (teks → imej)
Di bawah ialah contoh Node.js ringkas yang menunjukkan cara memanggil titik akhir generateContent untuk gemini-3.1-flash-image-preview (ini mencerminkan snippet rasmi dalam dok). Gantikan YOUR_API_KEY dengan kelayakan anda dan tambah pengendalian ralat untuk produksi.
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
mkdir -p ./output
curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
-H "Authorization: $COMETAPI_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
}
]
}
],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "9:16"
}
}
}' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
if 'text' in part:
print(part['text'])
elif 'inlineData' in part:
img = base64.b64decode(part['inlineData']['data'])
with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
f.write(img)
print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"
CometAPI menyediakan SDK dan pembalut klien serasi OpenAI, jadi sesetengah pasukan boleh menukar penyedia dengan perubahan kod minimum, membenarkan anda meminta output imej yang disandikan Base64 atau URL dihoskan bergantung pada konfigurasi anda. Sentiasa semak skema generateContent rasmi untuk medan payload yang tepat.
Aliran Imej→Imej (sunting)
Untuk menyunting imej sedia ada:
- Tukarkan imej sumber anda kepada Base64 (tanpa awalan
data:image/...;base64,). - POST dengan payload yang merangkumi
inline_data.datayang mengandungi rentetan Base64 itu dan prompt penyuntingan (cth., “tukar latar belakang kepada langit senja, buang tanda air”). - Respons akan merangkumi output Base64 baharu untuk dinyahkod dan disimpan.
curl
--location
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \
--header 'Authorization: ' \
--header 'Content-Type: application/json' \
--data-raw '{ "contents":
[ { "role": "user", "parts":
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } }
] }
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE"
] } }'
Parameter lazim untuk ditala
model: pilihgemini-3.1-flash-image-preview(Nano Banana 2) ataugemini-3-pro-image-preview(Pro).imageConfig.aspect_ratiodanimageConfig.image_size(512,1K,2K,4K) — mempengaruhi kos dan latensi.responseModalities:["Image"]atau["Text","Image"]untuk aliran multimodal.
Bagaimana saya harus menggubal prompt untuk Nano Banana 2?
Kejuruteraan prompt untuk model imej menggabungkan komposisi, gaya, petunjuk kamera/pencahayaan, dan kenyataan kekangan. Nano Banana 2 ditala untuk mengikuti arahan dengan boleh diharap, jadi seimbangkan ringkas dengan ketegasan.
Struktur prompt (disyorkan)
- Subjek utama: siapa/apa dalam imej.
- Aksi atau keadaan: apa yang dilakukan subjek.
- Persekitaran & suasana: latar, pencahayaan, atmosfera.
- Arahan teknikal: kanta kamera, nisbah aspek, resolusi, komposisi.
- Gaya & rujukan: gaya seni, rujukan artis (berhati-hati dengan peraturan hak cipta), era.
- Kekangan: bilangan watak/objek, elakkan warna tertentu, sertakan teks yang boleh dibaca.
Contoh prompt:
“Imej fotorealistik pisang kecil berwarna kuning berbentuk roket vintaj, terletak di atas meja kayu mahogani berkilat dalam studio bermandikan cahaya matahari. Kanta 50mm, kedalaman bidang cetek, pencahayaan waktu emas yang hangat, perincian tinggi, tiada logo yang kelihatan, 2048×1152.”
Petua untuk mengedit prompt (inpainting / gantian)
- Sediakan topeng dengan jelas dan nyatakan kawasan yang perlu diubah.
- Gunakan perkataan “preserve” untuk kawasan yang perlu dikekalkan (cth., “kekalkan ciri wajah subjek, ganti latar belakang sahaja”).
- Untuk teks dalam imej, berikan teks tepat dan nyatakan fon/gaya (cth., “sans-serif yang jelas, sejajar di tengah”). Nano Banana 2 menekankan render teks yang lebih baik, tetapi pastikan anda jelas.
Senarai semak nyahpepijat prompt
- Jika output tersasar, cuba ringkaskan: kurangkan arahan gaya kreatif dahulu, kemudian perkenalkan semula perincian.
- Jika teks tidak boleh dibaca: nyatakan fon, saiz, dan kontras dalam prompt serta tingkatkan resolusi.
- Jika komposisi salah: gunakan penentu sudut kamera dan spesifikasi kanta.
Apakah perangkap lazim dan bagaimana mengelakkannya?
Perangkap: Kebergantungan berlebihan pada prompt sekali sahaja
Elakkan mengharapkan satu prompt mengurus pemangkasan, susun atur, dan suntingan berbilang langkah. Pecahkan kerja kepada: jana asas → sunting/ganti → gilap akhir. Gunakan seed dan topeng untuk ketepatan.
Perangkap: Mengabaikan provenans dan semakan hak cipta
Jangan guna berskala tanpa SynthID/C2PA atau provenans lain. Banyak perusahaan memerlukan kebolehjejak untuk kandungan asal AI.
Perangkap: Kejutan bajet
Jejaki penggunaan pada peringkat model dan titik akhir, dan tetapkan had penggunaan keras melalui penyedia atau proksi. Tahap Flash lebih murah tetapi masih boleh menelan kos yang banyak jika anda menjana ribuan imej 4K tanpa sengaja.
Amalan terbaik yang disyorkan dengan Nano Banana 2?
Pemproduksian penjanaan imej memerlukan perhatian terhadap kos, latensi, kawalan kualiti, provenans dan keselamatan. Di bawah ialah amalan terbaik praktikal yang ditapis daripada laporan lapangan, dok Google, dan ujian komuniti.
Kejuruteraan prompt & output deterministik
- Templatkan prompt anda: untuk output yang boleh diulang (cth., foto produk), gunakan prompt berstruktur dengan segmen tetap (subjek, kamera, pencahayaan, tekstur, pasca-proses). Ini mengurangkan hanyutan antara panggilan.
- Gunakan imej rujukan dan arahan topeng untuk suntingan dan bukannya cuba mencapai suntingan setempat kompleks melalui teks semata-mata — ia mengurangkan ralat semantik dan artifak.
Penalaan kos & prestasi
- Pilih mod Flash/“Nano Banana 2” untuk volum tinggi: Jika anda perlukan banyak iterasi pantas, gunakan model tier Flash dan saiz lebih kecil (2K vs 4K) untuk mengurangkan kos dan latensi.
- Kumpulkan permintaan jika boleh: sesetengah penyedia membenarkan pengelompokan multi-prompt — ia mengurangkan latensi keseluruhan per aset yang dijana dalam saluran paip throughput tinggi. (Semak dok penyedia anda.)
Keselamatan, provenans dan perundangan
- Aktifkan metadata SynthID dan C2PA pada aset yang dijana bagi menyokong audit dan pematuhan hiliran (terutamanya apabila imej digunakan dalam pengiklanan/PR). Google dan rakan kongsi menekankan SynthID sebagai mekanisme provenans.
- Semakan manusia untuk kandungan sensitif: lapisan dasar automatik adalah kukuh tetapi tidak sempurna — gunakan semakan manual untuk kempen yang menghadap umum atau kandungan melibatkan tokoh awam.
Jaminan kualiti
- Automatikkan semakan QA: jalankan pengelas pasca-penjanaan pantas untuk artifak yang tidak dijangka (render teks salah, fideliti wajah rendah, penciptaan logo tidak sengaja). Kekalkan sistem pemarkahan dan pelan gagal selamat kepada render tier Pro jika semakan automatik gagal.
- Simpan prompt dan seed: untuk keboleh audit dan kebolehulangan, simpan prompt tepat, cap masa, versi model dan sebarang seed atau parameter deterministik yang digunakan.
UX sensitif latensi
- UX progresif: pulangkan draf beresolusi rendah/pantas terlebih dahulu, dan gantikan dengan render beresolusi tinggi/Pro apabila sedia. Ini memastikan aplikasi anda responsif (ramai penyedia menawarkan “draf” atau perisa Flash).
Nota akhir & langkah seterusnya
Nano Banana 2 dibina untuk mengubah ekonomi aliran kerja berasaskan imej: latensi lebih rendah dan kos per panggilan lebih rendah membuka kes penggunaan seperti penjanaan aset iklan atas permintaan, ujian kreatif A/B pantas, dan alat reka bentuk kerjasama masa nyata. Model ini telah diintegrasikan di seluruh permukaan pengguna dan awan Google; untuk pembangun yang ingin menerapkan dengan pantas, CometAPI menyediakan pembalut pasaran yang mudah yang menyokong titik akhir imej Gemini serta model lain — langkah praktikal apabila anda mahu bereksperimen dengan berbilang enjin tanpa menukar kod aplikasi.
Pembangun boleh mengakses Nano Banana 2 melalui CometAPI sekarang. Untuk bermula, terokai keupayaan model dalam Playground dan rujuk API guide untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda berintegrasi.
Sedia untuk bermula?→ Daftar untuk Nano Banana 2 hari ini !
Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI, ikuti kami di VK, X dan Discord!
