Spesifikasi Teknis Gemini 3.1 Flash Image Preview
| Item | Gemini 3.1 Flash Image Preview |
|---|---|
| Penyedia | |
| Keluarga model | Gemini 3.1 (tingkat Flash) |
| Fokus utama | Generasi multimodal cepat dengan pratinjau gambar |
| Jenis input | Teks, Gambar |
| Jenis output | Teks, Gambar (generasi pratinjau) |
| Jendela konteks | Hingga 1M token (standar tingkat Flash Gemini 3.x) |
| Tingkat latensi | Latensi rendah, throughput tinggi |
| Dukungan streaming | Ya |
| Pemanggilan alat | Ya (kerangka kerja alat Gemini API) |
| Versi | 3.1 |
Apa itu Nano Banana 2
Nano Banana 2 adalah julukan populer yang digunakan oleh media dan komunitas pengembang untuk model Gemini-3.1-Flash-Image yang baru dirilis. Google memposisikannya sebagai mesin gambar tingkat “Flash” yang menghadirkan fidelitas visual mendekati Pro pada tingkat latensi dan biaya yang jauh lebih rendah — cocok untuk generasi volume tinggi, pengeditan iteratif cepat, dan alur kerja produk terintegrasi di seluruh layanan Google. Model ini mewarisi penalaran multimodal Gemini 3.1 dan menambahkan kapabilitas berfokus gambar (teks yang terbaca di dalam gambar, komposisi multi-gambar, dukungan rasio aspek lebar, 4K native).
Fitur utama
- Generasi berkecepatan tinggi, multi-resolusi: Kecepatan tingkat Flash dengan opsi keluaran 0.5K / 1K / 2K / 4K dan rasio aspek ekstrem yang baru (1:4, 4:1, 1:8, 8:1).
- Grounding web real-time: Mengintegrasikan hasil penelusuran teks dan gambar untuk membumikan konten yang dihasilkan pada informasi web terkini saat “Thinking” atau grounding penelusuran diaktifkan. Berguna untuk referensi terbaru dan infografis faktual.
- Perenderan teks yang ditingkatkan: Perenderan teks pendek dan teks grafis (font, ukuran) lebih baik dibanding model Flash sebelumnya; masih belum sempurna pada paragraf panjang/teks kecil.
- Pengeditan multi-input dan alur kerja multi-putaran: Dukungan kuat untuk menggabungkan beberapa gambar sebagai input dan untuk pengeditan iteratif lintas putaran.
📊 Kinerja Benchmark — Pembuatan & Pengeditan Gambar (skor Elo)
| Kapabilitas | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Text-to-Image — Preferensi Keseluruhan | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Text-to-Image — Kualitas Visual | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Text-to-Image — Infografis (Faktualitas) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Pengeditan — Umum | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Pengeditan — Karakter | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Pengeditan — Kreatif | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Pengeditan — Objek/Lingkungan | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Pengeditan — Multi-Input | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Pengeditan — Stilisasi | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Inti temuan dari tabel benchmark ini:
- Di seluruh kategori pembuatan text-to-image dan pengeditan gambar, Gemini 3.1 Flash Image secara konsisten memimpin atau menyamai skor tertinggi di antara tingkat Flash dan banyak model gambar kompetitif.
- Model ini menunjukkan hasil yang sangat kuat pada tolok ukur Kualitas Visual dan Infografis (Faktualitas)—menandakan bahwa model ini unggul tidak hanya dalam kualitas estetika, tetapi juga dalam perenderan konten yang akurat secara struktural.
- Pada pengeditan Multi-Input, Nano Banana 2 juga menunjukkan generalisasi yang kuat, dengan skor lebih tinggi daripada generasi Flash sebelumnya.
Evaluasi ini dilakukan melalui perbandingan Elo berdampingan oleh manusia pada kumpulan benchmark yang beragam, mencerminkan preferensi dan fidelitas pada tugas pembuatan/pengeditan gambar yang umum digunakan.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Model | Pemosisian | Benchmark/catatan representatif |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Tingkat Flash: kecepatan + kualitas visual tinggi (2K–4K) | Preferensi keseluruhan 1079.0 ± 7.0; kualitas visual 1140 ± 6.0 (GenAI-Bench internal). |
| Gemini 2.5 Flash Image (Nano Banana) | Rilis Flash sebelumnya (fidelitas lebih rendah) | Skor preferensi/visual sedikit lebih rendah dibanding 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Tingkat Pro: fidelitas yang dirasakan lebih tinggi untuk tugas kompleks, biaya/latensi lebih tinggi | Trade-off berbeda; beberapa metrik menunjukkan peringkat relatif yang berbeda pada tugas spesialis. |
| GPT-Image 1.5 / model komersial lain | Kompetitor (terbuka/tertutup) | Dalam benchmark internal Google, GPT-Image dan lainnya mencetak skor di bawah Gemini 3.1 pada kualitas visual dan preferensi keseluruhan dalam evaluasi yang dilaporkan. Perbandingan independen pihak ketiga bervariasi. |
Kapan memilih Flash Image Preview:
- Pratinjau gambar real-time di aplikasi
- Pembuatan gambar skala besar yang sensitif biaya
- Asisten desain interaktif
Cara mengakses dan mengintegrasikan Nano Banana 2
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu. Masuk ke konsol CometAPI Anda. Dapatkan kunci API kredensial akses antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirim.
Langkah 2: Kirim Permintaan ke API Nano Banana 2
Pilih endpoint “gemini-3.1-flash-image-preview8” untuk mengirim permintaan API dan atur badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI sebenarnya dari akun Anda. Di mana memanggilnya:Gemini menghasilkan gambar
Nano Banana 2 mendukung pengeditan gambar, pembuatan gambar, dan alur kerja multi-gambar. Untuk pengeditan gambar, Anda perlu mengunggah URL gambar. Untuk parameter lainnya, silakan merujuk dokumentasi.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran. Anda dapat langsung mengunduh gambar ke mesin lokal Anda di playground (biasanya dalam format PNG). URL gambar akan dihasilkan dalam proses API; harap segera mengunduhnya.