Fitur utama
- Pembuatan & pengeditan gambar native — menghasilkan gambar atau mengedit foto yang ada melalui prompt bahasa alami. (Hasilkan / Edit).
- Fusi multi-gambar — menggabungkan beberapa gambar input menjadi satu adegan fotorealistis.
- Konsistensi karakter — mempertahankan penampilan subjek atau karakter yang sama di seluruh edit dan prompt. (Konsistensi).
- Penyematan tanda air SynthID — semua keluaran menyertakan SynthID tak kasatmata untuk mengidentifikasi konten yang dibuat oleh AI. (Tanda air).
Detail teknis
- Arsitektur & pemposisian: dibangun di atas keluarga Gemini 2.5 Flash — dirancang sebagai varian “Flash” berlatensi rendah yang menukar sedikit ukuran model/throughput demi respons per panggilan yang jauh lebih cepat dan efisiensi biaya, sambil mempertahankan penalaran yang lebih kuat dibandingkan tingkatan Flash sebelumnya.
- Format input & batasan: menerima gambar base64 inline untuk input kecil dan unggahan file melalui File API untuk gambar yang lebih besar (direkomendasikan untuk >20 MB). Mendukung jenis MIME umum (JPEG, PNG).
- Mode operasi: teks-ke-gambar, pengeditan gambar (inpainting / penyamaran semantik), transfer gaya, komposisi multi-gambar, dan berselang-seling respons teks+gambar (berguna untuk instruksi bergambar, resep, atau konten campuran).
- Mekanisme asal-usul & keamanan: tanda air yang terlihat pada keluaran AI ditambah penanda SynthID tersembunyi serta lapisan penegakan kebijakan untuk membatasi konten terlarang yang eksplisit.
Keterbatasan & risiko yang diketahui
- Kendala kebijakan konten: model menerapkan kebijakan konten (misalnya, melarang konten seksual eksplisit dan beberapa konten terlarang), namun penegakan tidak sempurna — pembuatan gambar tokoh publik atau ikon kontroversial mungkin masih dimungkinkan dalam beberapa skenario, sehingga pemeriksaan kebijakan sangat penting. )
- Mode kegagalan: kemungkinan pergeseran identitas pada edit ekstrem, ketidakselarasan semantik sesekali (ketika prompt kurang terperinci), dan artefak dalam adegan yang sangat kompleks atau perubahan sudut pandang yang ekstrem.
- Asal-usul & penyalahgunaan: meskipun tanda air dan SynthID ada, hal tersebut tidak mencegah penyalahgunaan — keduanya membantu deteksi dan atribusi tetapi bukan pengganti tinjauan manusia dalam alur kerja yang sensitif.
Kasus penggunaan khas
- Produk & e-commerce: menempatkan/menampilkan produk katalog ke dalam bidikan gaya hidup melalui fusi multi-gambar.
- Perangkat kreatif / desain: iterasi cepat di aplikasi desain (integrasi Adobe Firefly disebutkan).
- Pengeditan & retouching foto: edit terlokalisasi dari bahasa alami (menghapus objek, mengubah warna/pencahayaan, mengubah gaya).
- Penceritaan / aset karakter: menjaga karakter tetap konsisten di berbagai panel dan adegan.