Temel özellikler
- Yerleşik görüntü oluşturma ve düzenleme — doğal dil istemleriyle görüntüler oluşturun veya mevcut fotoğrafları düzenleyin. (Oluştur / Düzenle).
- Çoklu görüntü birleştirme — birden fazla giriş görüntüsünü tek bir fotogerçekçi sahnede birleştirin.
- Karakter tutarlılığı — düzenlemeler ve istemler arasında aynı özne veya karakter görünümünü koruyun. (Tutarlılık).
- SynthID filigranlama — tüm çıktılar, yapay zekâ tarafından üretilen içeriği tanımlamak için görünmez SynthID içerir. (Filigran).
Teknik ayrıntılar
- Mimari ve konumlandırma: Gemini 2.5 Flash ailesi üzerine kurulu — daha hızlı çağrı başına yanıt ve maliyet verimliliği için biraz model boyutu/iş hacmini takas eden, düşük gecikmeli “Flash” varyantı; önceki Flash seviyelerine göre daha güçlü muhakemeyi korur.
- Girdi biçimleri ve sınırlar: küçük girdiler için satır içi base64 görüntüleri ve daha büyük görüntüler için File API üzerinden dosya yüklemelerini kabul eder (20 MB’tan büyükler için önerilir). Yaygın MIME türlerini destekler (JPEG, PNG).
- Çalışma modları: metinden görsele, görüntü düzenleme (inpainting / semantik maskeleme), stil aktarımı, çoklu görüntü kompozisyonu ve iç içe metin+görüntü yanıtları (resimli talimatlar, tarifler veya karma içerikler için kullanışlı).
- Köken ve güvenlik mekanizmaları: yapay zekâ çıktılarında görünür filigranlar ile gizli SynthID işaretleri ve açıkça yasaklanmış içeriği sınırlamak için politika uygulama katmanları.
Sınırlamalar ve bilinen riskler
- İçerik politikası kısıtlamaları: modeller içerik politikalarını uygular (ör., açık cinsel içerik ve bazı yasa dışı içeriklere izin vermemek), ancak uygulama kusursuz değildir — bazı senaryolarda kamu figürlerinin veya tartışmalı ikonların görüntülerini üretmek yine de mümkün olabilir, bu nedenle politika kontrolleri hayati önem taşır. )
- Hata kipleri: uç düzenlemelerde olası kimlik kayması, zaman zaman semantik uyumsuzluk (istemler yetersiz belirtildiğinde) ve çok karmaşık sahnelerde veya aşırı bakış açısı değişikliklerinde artefaktlar.
- Menşe ve kötüye kullanım: filigranlar ve SynthID mevcut olsa da, bunlar kötüye kullanımı önlemez — tespit ve atıfta bulunmaya yardımcı olurlar ancak hassas iş akışlarında insan incelemesinin yerine geçmezler.
Tipik kullanım durumları
- Ürün ve e-ticaret: ürünleri yaşam tarzı çekimlerine yerleştirme/kataloglama çoklu görüntü birleştirme yoluyla.
- Yaratıcı araçlar / tasarım: tasarım uygulamalarında hızlı yinelemeler (Adobe Firefly entegrasyonu belirtilmiştir).
- Fotoğraf düzenleme ve rötuş: doğal dilden yerel düzenlemeler (nesneleri kaldır, renk/aydınlatmayı değiştir, yeniden stillendir).
- Hikâye anlatımı / karakter varlıkları: paneller ve sahneler genelinde karakterleri tutarlı tutun.