Belangrijkste functies
- Native afbeeldinggeneratie en -bewerking — genereer afbeeldingen of bewerk bestaande foto’s via prompts in natuurlijke taal. (Genereren / Bewerken).
- Fusie van meerdere afbeeldingen — combineer meerdere invoerafbeeldingen tot één fotorealistische scène.
- Consistentie van personages — behoud hetzelfde uiterlijk van een onderwerp of personage over bewerkingen en prompts heen. (Consistentie).
- SynthID-watermerk — alle outputs bevatten een onzichtbare SynthID om AI-gegenereerde content te identificeren. (Watermerk).
Technische details
- Architectuur & positionering: gebouwd op de Gemini 2.5 Flash‑familie — ontworpen als een lage latentie “Flash”-variant die een beetje modelgrootte/doorvoer inruilt voor veel snellere respons per aanroep en kostenefficiëntie, met behoud van sterker redeneervermogen dan eerdere Flash‑niveaus.
- Invoerformaten & limieten: accepteert inline base64-afbeeldingen voor kleine inputs en bestandsuploads via de File API voor grotere afbeeldingen (aanbevolen voor >20 MB). Ondersteunt gangbare MIME-typen (JPEG, PNG).
- Bedrijfsmodi: tekst-naar-afbeelding, fotobewerking (inpainting / semantische maskering), stijltransfer, compositie met meerdere afbeeldingen, en verweven tekst+afbeelding-antwoorden (nuttig voor geïllustreerde instructies, recepten of gemengde inhoud).
- Herkomst & veiligheidsmechanismen: zichtbare watermerken op AI-outputs plus verborgen SynthID-markeringen en beleids-handhavingslagen om expliciet verboden content te beperken.
Beperkingen & bekende risico’s
- Beperkingen door contentbeleid: modellen handhaven contentbeleid (bijv. het verbieden van expliciet seksuele content en sommige illegale content), maar de handhaving is niet perfect — het genereren van beelden van publieke figuren of controversiële iconen kan in sommige scenario’s nog steeds mogelijk zijn, dus beleidscontroles zijn essentieel. )
- Foutmodi: mogelijke identiteitsdrift bij extreme bewerkingen, af en toe semantische misafstemming (wanneer prompts onvoldoende gespecificeerd zijn), en artefacten in zeer complexe scènes of bij extreme veranderingen in gezichtspunt.
- Herkomst & misbruik: hoewel watermerken en SynthID aanwezig zijn, voorkomen deze misbruik niet — ze helpen bij detectie en toeschrijving, maar zijn geen vervanging voor menselijke beoordeling in gevoelige werkstromen.
Typische gebruiksscenario’s
- Product & e-commerce: producten plaatsen/catalogiseren in lifestylefoto’s via fusie van meerdere afbeeldingen.
- Creatieve tooling / design: snelle iteraties in ontwerpprogramma’s (Adobe Firefly-integratie genoemd).
- Fotobewerking & retoucheren: gelokaliseerde bewerkingen vanuit natuurlijke taal (objecten verwijderen, kleur/belichting wijzigen, restylen).
- Storytelling / personage-assets: personages consistent houden over panelen en scènes.