Nøglefunktioner
- Indbygget billedgenerering & redigering — generér billeder eller redigér eksisterende fotos via prompts i naturligt sprog. (Generér / Redigér).
- Fusion af flere billeder — kombinér flere inputbilleder til én fotorealistisk scene.
- Karakterkonsistens — bevar samme motiv eller karakterudseende på tværs af redigeringer og prompts. (Konsistens).
- SynthID-vandmærkning — alle uddata indeholder en usynlig SynthID til at identificere AI-genereret indhold. (Vandmærke).
Tekniske detaljer
- Arkitektur & positionering: bygget på Gemini 2.5 Flash-familien — designet som en lav latenstid “Flash”-variant, der ofrer lidt modelstørrelse/gennemstrømning for langt hurtigere svartid pr. kald og omkostningseffektivitet, samtidig med at den bevarer stærkere ræsonnering end tidligere Flash-niveauer.
- Inputformater & begrænsninger: accepterer inline base64-billeder til små input og filuploads via File API til større billeder (anbefales for >20 MB). Understøtter almindelige MIME-typer (JPEG, PNG).
- Funktionsmåder: tekst-til-billede, billedredigering (inpainting / semantisk maskering), stiloverførsel, komposition af flere billeder samt indflettede tekst+billede-svar (nyttige til illustrerede instruktioner, opskrifter eller blandet indhold).
- Proveniens & sikkerhedsmekanismer: synlige vandmærker på AI-uddata plus skjulte SynthID-markører og lag til håndhævelse af politikker for at begrænse eksplicit ikke-tilladt indhold.
Begrænsninger og kendte risici
- Begrænsninger i indholdspolitik: modellerne håndhæver indholdspolitikker (f.eks. forbud mod eksplicit seksuelt indhold og noget ulovligt indhold), men håndhævelsen er ikke perfekt — generering af billeder af offentlige personer eller kontroversielle ikoner kan stadig være muligt i nogle scenarier, så politiktjek er afgørende. )
- Fejltilstande: mulig identitetsafvigelse ved ekstreme redigeringer, lejlighedsvis semantisk uoverensstemmelse (når prompts er underspecificerede), samt artefakter i meget komplekse scener eller ved ekstreme ændringer af synsvinkel.
- Proveniens & misbrug: selv om vandmærker og SynthID er til stede, forhindrer de ikke misbrug — de hjælper med detektion og attribuering, men er ikke en erstatning for menneskelig gennemgang i følsomme arbejdsgange.
Typiske anvendelsesområder
- Produkt & e-handel: placer/katalogisér produkter i livsstilsbilleder via sammensmeltning af flere billeder.
- Kreative værktøjer / design: hurtige iterationer i designapps (Adobe Firefly-integration omtalt).
- Billedredigering & retouchering: lokaliserede redigeringer fra naturligt sprog (fjern objekter, ændr farve/lys, ændr stil).
- Fortælling / karakteraktiver: hold karakterer konsistente på tværs af paneler og scener.