Ciri utama
- Penjanaan & penyuntingan imej asli — jana imej atau sunting foto sedia ada melalui gesaan bahasa semula jadi. (Jana / Sunting).
- Penggabungan berbilang imej — gabungkan berbilang imej input menjadi satu adegan fotorealistik.
- Konsistensi watak — kekalkan subjek atau rupa watak yang sama merentas suntingan dan gesaan. (Konsistensi).
- Tanda air SynthID — semua output menyertakan SynthID tidak kelihatan untuk mengenal pasti kandungan yang dijana AI. (Tanda air).
Butiran teknikal
- Seni bina & pemposisian: dibina atas keluarga Gemini 2.5 Flash — direka sebagai varian “Flash” berlatensi rendah yang menukar sedikit saiz model/kadar pemprosesan untuk masa respons setiap panggilan yang jauh lebih pantas dan kecekapan kos sambil mengekalkan penaakulan yang lebih kukuh berbanding peringkat Flash terdahulu.
- Format input & had: menerima imej base64 sebaris untuk input kecil dan muat naik fail melalui File API untuk imej yang lebih besar (disyorkan untuk >20 MB). Menyokong jenis MIME biasa (JPEG, PNG).
- Mod operasi: penukaran teks-ke-imej, penyuntingan imej (inpainting / pemaskeran semantik), pemindahan gaya, komposisi berbilang imej, dan respons teks+imej berselang-seli (berguna untuk arahan bergambar, resipi, atau kandungan bercampur).
- Jejak asal & mekanisme keselamatan: tanda air yang kelihatan pada output AI serta penanda SynthID tersembunyi dan lapisan penguatkuasaan dasar untuk mengehadkan kandungan yang jelas dilarang.
Had & risiko yang diketahui
- Kekangan dasar kandungan: model menguatkuasakan dasar kandungan (cth., melarang kandungan seksual eksplisit dan sesetengah kandungan terlarang), namun penguatkuasaan tidak sempurna — penjanaan imej tokoh awam atau ikon kontroversi mungkin masih boleh berlaku dalam sesetengah senario, maka semakan dasar adalah penting. )
- Mod kegagalan: kemungkinan hanyutan identiti dalam suntingan yang melampau, ketidakselarasan semantik sesekali (apabila gesaan kurang dinyatakan), dan artifak dalam adegan yang sangat kompleks atau perubahan sudut pandang yang melampau.
- Asal-usul & salah guna: walaupun tanda air dan SynthID hadir, ini tidak menghalang salah guna — ia membantu pengesanan dan atribusi tetapi bukan pengganti semakan manusia dalam aliran kerja sensitif.
Kes penggunaan tipikal
- Produk & e-dagang: meletakkan/mengatalogkan produk ke dalam penggambaran gaya hidup melalui penggabungan berbilang imej.
- Peralatan kreatif / reka bentuk: iterasi pantas dalam aplikasi reka bentuk (integrasi Adobe Firefly dirujuk).
- Penyuntingan foto & penyentuhan semula: suntingan setempat daripada bahasa semula jadi (buang objek, tukar warna/pencahayaan, ubah gaya).
- Penceritaan / aset watak: mengekalkan watak yang konsisten merentas panel dan adegan.