Gemini 2.5 Flash Image (alias "Nano Banana") adalah model pembuatan dan pengeditan gambar asli terbaru dari Google dalam keluarga Gemini 2.5. Model ini berfokus pada penggabungan multi-gambar, pengeditan bahasa alami yang presisi, dan alur kerja multimoda yang cepat.
Pengantar model
Apa itu — Gambar Flash Gemini 2.5 adalah model pembuatan dan penyuntingan gambar multimoda yang dibangun di atas keluarga Gemini 2.5. Model ini dirancang untuk menghasilkan gambar fotorealistik, melakukan suntingan yang ditargetkan (inpainting, transfer gaya, pertukaran objek), dan gabungkan beberapa gambar sumber menjadi satu keluaran yang koheren — sembari menerapkan penalaran bahasa Gemini yang ditingkatkan untuk mengendalikan komposisi dan semantik.
Fitur Utama
- Pembuatan & pengeditan gambar asli — menghasilkan gambar atau mengedit foto yang ada melalui perintah bahasa alami. (Hasilkan / Edit).
- Fusi multi-gambar — menggabungkan beberapa gambar masukan menjadi satu pemandangan fotorealistis.
- Konsistensi karakter — pertahankan subjek atau penampilan karakter yang sama di seluruh suntingan dan perintah. (Konsistensi).
- Tanda air SynthID — semua keluaran mencakup SynthID tak terlihat untuk mengidentifikasi konten yang dihasilkan AI. (Tanda air).
Detail teknis
- Arsitektur & posisi: dibangun di atas keluarga Gemini 2.5 Flash — dirancang sebagai latensi rendah Varian "Flash" yang mengorbankan sedikit ukuran/throughput model demi respons per panggilan yang jauh lebih cepat dan efisiensi biaya, sekaligus mempertahankan penalaran yang lebih kuat dibandingkan tingkatan Flash sebelumnya.
- Format dan batasan input: menerima gambar base64 sebaris untuk input kecil dan unggahan file melalui File API untuk gambar yang lebih besar (disarankan untuk ukuran >20 MB). Mendukung tipe MIME umum (JPEG, PNG).
- Mode operasi: teks ke gambar, penyuntingan gambar (inpainting / semantic masking), transfer gaya, komposisi multi-gambar, dan disisipkan respons teks+gambar (berguna untuk instruksi bergambar, resep, atau konten campuran).
- Mekanisme asal dan keamanan: tanda air yang terlihat pada keluaran AI ditambah penanda SynthID tersembunyi dan lapisan penegakan kebijakan untuk membatasi konten eksplisit yang tidak diizinkan.
Kinerja tolok ukur

Keterbatasan & risiko yang diketahui
- Batasan kebijakan konten: model menerapkan kebijakan konten (misalnya, melarang konten seksual eksplisit dan beberapa konten terlarang), tetapi penerapannya tidak sempurna — menghasilkan gambar tokoh publik atau ikon kontroversial mungkin masih memungkinkan dalam beberapa skenario, jadi pemeriksaan kebijakan sangatlah penting. )
- Mode kegagalan: mungkin pergeseran identitas dalam suntingan ekstrem, ketidakselarasan semantik sesekali (ketika perintah kurang ditentukan), dan artefak dalam adegan yang sangat rumit atau perubahan sudut pandang ekstrem.
- Asal usul dan penyalahgunaan: meskipun tanda air dan SynthID ada, hal ini tidak mencegah penyalahgunaan — mereka membantu deteksi dan atribusi tetapi bukan pengganti peninjauan manusia dalam alur kerja yang sensitif.
Kasus penggunaan umum
- Produk & e-niaga: tempatkan/katalog produk ke dalam foto gaya hidup melalui penggabungan multi-gambar.
- Perkakas / desain kreatif: iterasi cepat dalam aplikasi desain (integrasi Adobe Firefly dikutip).
- Pengeditan & retouching foto: suntingan lokal dari bahasa alami (menghapus objek, mengubah warna/pencahayaan, mengubah gaya).
- Aset cerita/karakter: menjaga karakter tetap konsisten di seluruh panel dan adegan.
Bagaimana cara menelepon Gambar Flash Gemini 2.5 API dari CometAPI
Gemini 2.5 Flash Image Harga API di CometAPI, diskon 20% dari harga resmi:
| Harga | $0.3120 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih "
Gemini-2.5 Flash-Image” untuk mengirim permintaan API dan mengatur isi permintaan. Metode permintaan dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan pengujian Apifox demi kenyamanan Anda. - Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- Titik akhir:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Parameter Model: pratinjau-gambar-gemini-2.5-flash / gambar-gemini-2.5-flash
- Otentikasi:
Bearer YOUR_CometAPI_API_KEY - Jenis konten:
application/json.
Catatan: Saat memanggil API, tetapkan parameter “stream”: true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Lihat Juga API GPT-gambar-1



