Pada Februari 2026, Google memperkenalkan generasi terbaharu teknologi model imej berasaskan AI, menandakan satu pencapaian penting dalam dunia AI generatif yang berkembang pesat. Model terbaharu—Nano Banana 2—menggabungkan keupayaan imejan maju dengan prestasi sepantas kilat, merapatkan jurang antara kelajuan, kualiti dan kegunaan dunia sebenar. Diposisi sebagai model penjanaan imej lalai merentasi ekosistem Gemini Google, Airtable, API dan perkhidmatan awan, Nano Banana 2 mengubah cara AI menghasilkan, menyunting dan memaparkan imej.
Apakah sebenarnya Nano Banana 2?
Nano Banana 2—secara rasmi dikenali sebagai Gemini 3.1 Flash Image—ialah model penjanaan dan penyuntingan imej AI terbaharu daripada Google. Ia mewakili evolusi strategik daripada model visual AI pendahulunya, menggabungkan keupayaan generatif yang berkuasa dengan kelajuan yang tidak pernah berlaku sebelum ini. Seperti yang dijelaskan oleh syarikat, model ini menggabungkan penaakulan visual berkualiti tinggi dengan prestasi output pantas, secara efektif membawa ciri “bertaraf profesional” ke domain yang sebelum ini berlatensi tinggi.
Berbeza daripada model generatif kompak yang mengoptimumkan semata-mata untuk kelajuan atau tugas ringan, Nano Banana 2 menggabungkan dua objektif yang secara sejarahnya terpisah:
- Pemahaman imej berkesetiaan tinggi (kualiti bertaraf Pro)
- Penjanaan berlatensi rendah (pengalaman kelajuan Flash)
Ciri Nano Banana 2 untuk imej AI
Keupayaan teras
- Penjanaan teks-ke-imej (prompt untuk sekali jalan atau berbilang langkah) dengan kesetiaan tinggi bagi objek, pencahayaan dan tekstur.
- Penyuntingan imej / inpainting / gabungan berbilang imej — bermakna anda boleh membekalkan imej rujukan dan meminta model menggabung, menukar, atau menyunting bahagian-bahagiannya melalui arahan bahasa semula jadi. Ini ialah ciri teras dalam API imej Gemini.
- Konsistensi watak & subjek merentas suntingan (mengekalkan wajah/gaya watak yang sama melalui suntingan berulang) — penting untuk papan cerita dan penghasilan seni bersiri.
- Penandaan tera air SynthID / asal-usul (provenance): keluaran termasuk penanda SynthID untuk membantu menjejak asal-usul & pengesanan imej yang dijana AI. Ini sebahagian daripada pendekatan ketelusan Google.
Kawalan bertaraf produksi
- Resolusi sehingga 4K, kawalan nisbah aspek dan pelbagai modaliti output (imej + teks berkaitan), menjadikan Nano Banana 2 sesuai untuk aset kecil dan visual sedia produksi.
- Pengemudian prompt dan aliran kerja beriterasi: Nano Banana 2 menyokong pengantara selang prompt dengan input imej dan langkah penapisan berulang supaya anda boleh “sketch → refine → finalize” dalam satu saluran paip berprogram.
Prestasi Penanda Aras (GenAI-Bench Human Elo Evaluation)
1️⃣ Keutamaan Keseluruhan (Teks-ke-Imej)
| Model | Elo Score | Margin vs 3.1 Flash |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | 1079.0 ± 7.0 | — |
| Gemini 2.5 Flash Image (Nano Banana) | 1073.0 ± 5.0 | -6 |
| GPT-Image 1.5 | 1021.0 ± 5.0 | -58 |
| Gemini 3 Pro Image (Nano Banana Pro) | 942.0 ± 6.0 | -137 |
Interpretasi:
- Gemini 3.1 Flash Image mendahului kedudukan keutamaan.
- Peningkatan +6 berbanding 2.5 Flash menunjukkan penambahbaikan berukuran.
- Margin +58 berbanding GPT-Image 1.5 mencerminkan kelebihan keutamaan pengguna yang bermakna secara statistik dalam ujian buta sisi demi sisi.
- Peringkat Flash mengatasi varian Pro yang terdahulu dalam konfigurasi penanda aras ini.

2️⃣ Kualiti Visual (Kesetiaan Teks-ke-Imej)
| Model | Elo Score | Margin vs 3.1 Flash |
|---|---|---|
| Gemini 3.1 Flash Image | 1140.0 ± 6.0 | — |
| Gemini 2.5 Flash Image | 1129.0 ± 6.0 | -11 |
| GPT-Image 1.5 | 1043.0 ± 5.0 | -97 |
Interpretasi:
- Keuntungan relatif terbesar muncul dalam kualiti visual.
- +11 berbanding model Flash sebelumnya menunjukkan penapisan bertahap yang konsisten.
- Margin ~97 mata berbanding GPT-Image 1.5 menunjukkan peningkatan kukuh dalam realisme, ketajaman perincian, ketepatan komposisi dan pengurangan artifak.
- Julat keyakinan ± menunjukkan kebolehpercayaan statistik dalam perbezaan kedudukan.
3️⃣ Prestasi Penyuntingan & Tugas Khusus
| Kategori Tugas | Gemini 3.1 Flash | Gemini 2.5 Flash | Penambahbaikan |
|---|---|---|---|
| Penyuntingan Umum | 1065 ± 9 | 1047 ± 9 | +18 |
| Penyuntingan Watak | 1056 ± 7 | 1049 ± 7 | +7 |
| Berbilang Input (1–3 imej) | 1037 ± 8 | 1016 ± 8 | +21 |
Interpretasi
- Penyuntingan Umum (+18) menunjukkan peningkatan aliran kerja terapan yang paling ketara.
- Penyuntingan Berbilang Input (+21) menunjukkan penaakulan komposisi yang lebih kukuh merentas berbilang imej sumber.
- Penambahbaikan penyuntingan watak adalah sederhana tetapi positif secara arah, mencerminkan konsistensi identiti dan pengekalan gaya yang lebih baik.

Berapakah Kos Nano Banana 2?
Salah satu aspek paling berimpak daripada pelancaran Nano Banana 2 ialah strategi harga—terutamanya bagi pembangun, perniagaan dan pencipta yang bergantung pada penjanaan berskala besar.
Harga dan Kos API
Menurut analisis industri:
- Kos API Nano Banana Pro kira-kira ~$0.134 setiap imej pada resolusi asas.
- Harga API Nano Banana 2 kira-kira ~$0.067 setiap imej pada resolusi setara, kira-kira separuh kos Nano Banana Pro.
- Kos yang lebih rendah berskala dengan penjanaan resolusi tinggi dan penggunaan pukal.
Ini menjadikan Nano Banana 2 jauh lebih mampu milik untuk organisasi yang membangunkan produk visual berasaskan AI, khususnya pada skala besar atau dalam aplikasi berorientasikan pengguna di mana kelajuan dan kecekapan kos penting.
Bagaimana mengakses API Nano Banana 2 secara percuma?
CometAPI menyediakan satu permukaan API yang boleh memanggil model Nano Banana Pro dan Flash. Ini berguna jika anda mahu bertukar antara berbilang model imej tanpa menulis semula logik panggilan.
CometAPI menawarkan percubaan percuma bagi [specific API name], dan harga API ialah 20% daripada harga rasmi.
| Comet Price (USD / M Tokens) | Official Price (USD / M Tokens) |
|---|---|
| Input:$0.2/MOutput:$1.2/M | Input:$0.25/MOutput:$1.5/M |
Bagaimana Nano Banana 2 berbanding dengan Nano Banana Pro?
Nano Banana Pro diperkenalkan pada November 2025 dan mewakili peningkatan dalam kualiti dan keupayaan kreatif dengan kos kelajuan yang lebih perlahan dan keperluan sumber yang lebih tinggi. Ia dipasarkan sebagai model untuk keluaran “bertaraf studio” dengan perincian halus dan aliran kerja profesional.
Nano Banana 2 pada asasnya menggabungkan kecerdasan kreatif dan kualiti Pro dengan latensi rendah dan kelajuan Flash. Menurut perincian perbandingan:
| Ciri | Nano Banana 2 | Nano Banana Pro |
|---|---|---|
| Penamaan rasmi | Gemini 3.1 Flash Image | Gemini 3 Pro Image |
| Kelajuan penjanaan | 4–6 saat tipikal | 20–60+ saat |
| Resolusi maksimum | Sehingga 4K | Sehingga 2K (bergantung tetapan) |
| Kos setiap penjanaan | Kira-kira separuh daripada Pro pada skala setara | Lebih tinggi |
| Konsistensi watak | Sehingga 5 watak | Sehingga 5 watak |
| Kesetiaan berbilang objek | Sehingga 14 objek | Sehingga 14 objek |
| Pengalaman lalai | Ya merentasi Gemini | Legasi / khusus |
| Aras percuma | Tersedia | Terutamanya aras Pro/Ultra |
Dalam praktiknya, ini bermakna Nano Banana 2 selalunya menyampaikan kualiti visual hampir bertaraf Pro dengan lebih pantas dan lebih murah, menjadikannya pilihan lalai untuk kebanyakan kes penggunaan manakala Nano Banana Pro kekal tersedia untuk kerja khusus dengan kesetiaan tertinggi.
Nano Banana 2 (Gemini 3.1 Flash Image Preview) menduduki tempat pertama dalam kategori teks-ke-imej bagi analisis imej AI, dan harganya hanya separuh daripada harga Nano Banana Pro.
Perbezaan praktikal yang akan anda perhatikan
- Kelajuan iterasi: Latensi lebih rendah untuk suntingan pantas (Google menyebutnya “kelajuan Flash”), sesuai untuk pereka yang mengiterasi berpuluh kali. Latensi berangka tepat bergantung pada resolusi dan penyebaran, tetapi Google secara jelas memasarkan 512px sebagai aras pantas untuk iterasi.
- Throughput lebih tinggi / kos setiap imej lebih rendah: Google menekankan kelebihan harga-prestasi untuk saluran paip penjanaan imej berskala lebih besar, terutamanya melalui Gemini API dan Google AI Studio.
- Kesetiaan lebih baik pada skala: Berbanding Nano Banana asal (Ogos 2025) dan Nano Banana Pro (Nov 2025), Nano Banana 2 bertujuan mengekalkan penaakulan visual dan kesetiaan sambil memendekkan masa antara prompt dan output boleh guna.
Penggunaan untuk prompt dan aliran kerja penyuntingan
Struktur prompt yang berkesan
Struktur pragmatik yang disyorkan:
- Subjek / aksi utama: “Potret seorang wanita tua sedang mengait”
- Gaya / kamera: “pencahayaan sinematik, kanta 85mm, kedalaman medan cetek, fotorealistik”
- Konteks / butiran adegan: “ruang tamu yang selesa, cahaya pagi menembusi langsir renda”
- Kekangan / komposisi: “subjek di tengah, tiada logo, sertakan latar bokeh lembut”
- Spesifikasi output (pilihan): “1024x1024, png, latar belakang lutsinar”
Contoh prompt gabungan:
"A photorealistic portrait of an elderly woman knitting in a cozy living room, morning light through lace curtains, 85mm bokeh, warm tones, 3:4 aspect ratio, no text, high detail"

Saya memerhati 10–15 saat untuk prompt kompleks dan perincian tinggi pada konfigurasi 1K–2K pada Nano Banana 2, jauh lebih pantas daripada masa yang dilaporkan bagi beberapa alternatif pada kualiti visual setara. Nano Banana 2 sering menyamai atau mengatasi iterasi “Nano Banana Pro” terdahulu pada metrik perincian tekstur dan realisme pencahayaan, khususnya dalam fotografi produk dan potret manusia. Namun, terdapat keanehan komposisi sekali-sekala (cth., tangan yang tidak konsisten, artifak kecil dalam tekstur berulang) — isu yang model besar masih boleh tunjukkan.
Jadi: Nano Banana 2 mencapai titik tengah yang sangat baik — fotorealisme yang sangat baik dengan sebahagian kecil latensi — tetapi ia tidak sempurna. Untuk pembaikan potret bertaraf editorial atau arahan seni khusus, pengawasan manusia atau langkah penyuntingan tambahan masih disyorkan. Untuk kualiti maksimum murni (render yang sangat besar, intensif pengiraan, ultra-fotorealistik), Nano Banana Pro mungkin masih lebih sesuai, namun ia hadir dengan kos lebih tinggi dan respons lebih perlahan.
Amalan Terbaik untuk Nano Banana 2
Petua khusus untuk Nano Banana 2
- Jelas tentang teks dalam imej: Nano Banana 2 dilaporkan jauh lebih baik dalam memaparkan teks yang boleh dibaca dan tepat. Jika anda memerlukan papan tanda atau label, sertakan teks tepat dan petunjuk fon.
- Konsistensi watak: Apabila meminta berbilang watak, ulang butiran pengenalan (cth., “Alice: rambut bob coklat, baju sejuk biru; Ben: tinggi, berbintik, jaket hijau”) untuk meningkatkan konsistensi merentas rakaman.
- Token seed dan style: Gunakan
seeduntuk kebolehulangan dan sertakan tokenstyle(cth., “dalam gaya pengiklanan moden”) jika anda mahukan rupa yang konsisten merentas banyak imej. - Nisbah aspek & resolusi: Jika hasil akhir anda ialah 2K/4K, minta resolusi sasaran dengan jelas. Nano Banana 2 mengendalikan nisbah aspek ekstrem (cth., panoramik) dengan baik apabila diprompt.
Saluran penyuntingan
Gunakan “thinking levels” (Google menyebut mod Minimal/Tinggi/Dinamik) apabila anda perlukan model berfikir lebih tentang prompt kompleks sebelum rendering — berguna untuk rajah atau imej yang sarat arahan.
Mulakan dengan bingkai idea: jana papan cerita pada 512px (pantas), pilih bingkai terbaik, kemudian naikkan resolusi dan perhalusi pada 2K/4K.
Kejuruteraan prompt: petua praktikal
- Jelas tentang atribut subjek (umur, pakaian, orientasi, pencahayaan) untuk memanfaatkan konsistensi subjek Nano Banana 2. Untuk aliran kerja watak bersiri, sertakan imej rujukan konsisten dan token jelas untuk identiti.
- Gunakan aras 512px untuk penerokaan beriterasi, kemudian tingkatkan ke 1K/2K/4K apabila diperlukan untuk lintasan akhir — ini meminimumkan kos dan mempercepat kitaran kreatif.
- Manfaatkan ciri teks berlokalisasi dengan memasukkan bahasa sasaran dan kekangan tata letak jika menjana kreatif iklan berlokalisasi. Nano Banana 2 menyokong lokalisasi dalam imej.
Kesimpulan
Nano Banana 2 ialah langkah maju yang bermakna: ia mengurangkan geseran antara output imej berkualiti tinggi dan kelajuan/skala yang diperlukan pencipta. Dengan menggabungkan pembumian web Gemini, pemaparan teks yang lebih kukuh, dan latensi Flash, ia membuka aliran kerja baharu untuk pemasaran, reka bentuk produk dan penjanaan kandungan dipacu pembangun. Ulasan penggunaan memuji peningkatan kesetiaan dan memberi amaran tentang artifak sekali-sekala serta risiko penipuan yang datang bersama realisme yang lebih besar.
Jika pasukan anda bergantung pada penjanaan imej untuk kerja berorientasikan pelanggan, Nano Banana 2 wajar diuji segera dalam bukti konsep: ia berkemungkinan mengurangkan masa dan kos produksi sambil meningkatkan pariti aset dijana AI dengan aset yang dihasilkan manusia
Pembangun boleh mengakses Nano Banana 2 melalui CometAPI sekarang. Untuk bermula, teroka keupayaan model dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi bagi membantu anda berintegrasi.
Bersedia untuk bermula?→ Daftar untuk Nano Banana 2 hari ini !
Jika anda mahu mengetahui lebih banyak petua, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!
