Alibaba’s Tongyi Lab har officielt udgivet Z-Image, en open source-billedgenereringsmodel med 6 milliarder parametre, som i øjeblikket tager AI-fællesskabet med storm. Udgivet i slutningen af 2025 har Z-Image hurtigt væltet tidligere favoritter som Flux og SDXL af tronen i mange lokale brugeres øjne.
Selvom dens tekniske effektivitet og tosprogede kapabiliteter er imponerende, handler den højeste buzz omkring Z-Image om en helt anden egenskab: dens potentiale for ubegrænset, ucensureret indholdsskabelse. I modsætning til proprietære, skybaserede modeller låst bag strenge sikkerhedsfiltre, gør dens åbne vægte det muligt for brugere at køre modellen lokalt på forbrugerhardware og give dem fuld frihed over det indhold, de genererer — inklusive NSFW (Not Safe For Work)-materiale.
Hvad er Z-Image, og hvorfor disrupter den markedet?
Z-Image (eller ZaoXiang) er en grundmodel udviklet af Alibabas Tongyi Lab. I modsætning til de massive, tunge modeller fra fortiden, der krævede GPU’er i enterprise-klassen, er Z-Image designet til effektivitet. Den benytter en ny Scalable Single-Stream Diffusion Transformer (S3-DiT)-arkitektur.
Den tekniske landvinding: S3-DiT
De fleste tidligere billedgeneratorer, såsom Stable Diffusion XL (SDXL), brugte en dual-stream-tilgang (behandlede tekst og billeddata separat) eller en hybrid-stream som Flux. Z-Image forenkler dette ved at sammenkæde tekst, visuelle semantiske tokens og billede-VAE-tokens til en enkel, samlet sekvens. Dette gør det muligt for modellen at håndtere tekst-billede-relationer mere direkte og effektivt.
Resultatet? En model med 6 milliarder parametre, der præsterer markant over sin vægtklasse.
- Lavt VRAM-krav: Den kan køre på GPU’er med så lidt som 6 GB til 8 GB VRAM, hvilket gør den tilgængelig for brugere med ældre kort som NVIDIA RTX 2060 eller 3060.
- Utrolig hastighed: Varianten Z-Image-Turbo bruger en destilleret 8-trins inferensproces, der kan generere 1024x1024-billeder af høj kvalitet på under et sekund på H800’ere eller blot få sekunder på forbrugerkort.
- Tosproget kunnen: Den gengiver tekst på både engelsk og kinesisk med høj nøjagtighed, en funktion som ofte mangler i vestligt centrerede modeller.
Varianterne
Udgivelsen inkluderer tre distinkte versioner:
- Z-Image-Turbo: Fartdjævlen. Optimeret til 8-trins generering, ideel til hurtige iterationer og realtids-workflows. Dette er den version, de fleste brugere i øjeblikket implementerer til lokal brug.
- Z-Image-Base: Den rå grundmodel. Selvom den er langsommere, er den det foretrukne valg til community-finetuning og træning af LoRA’er (Low-Rank Adaptations), da den bevarer mere detaljeret viden.
- Z-Image-Edit: En specialiseret variant designet til instruktionsstyret billedredigering (f.eks. "få personen til at smile", "skift baggrund til vinter").
Hvorfor vender brugere sig mod Z-Image til ubegrænset indhold?
I modsætning til traditionelle diffusionsmodeller, der kræver snesevis af trin for billedsyntese, excellerer Z-Image i effektivitet. Dens Turbo-variant, den mest populære udgave, opnår latens under et sekund på high-end GPU’er som H800 ved kun at bruge otte Number of Function Evaluations (NFEs). Denne hastighed er særligt gavnlig for NSFW-skabere, som ofte itererer på prompts for at finjustere eksplicitte detaljer. Funktionerne inkluderer fotorealistisk gengivelse med upåklagelig kontrol over lys, teksturer og kompositioner; tosproget tekstrendering på engelsk og kinesisk; og stærke instruktionsfølgende kapabiliteter. Til NSFW-brug gør Z-Images ucensurerede status — uden de sikkerhedsfiltre, der findes i modeller som DALL·E eller Midjourney — det muligt at generere voksent indhold uden begrænsninger, hvilket er bekræftet af community-tests på platforme som Reddit og YouTube i slutningen af 2025.
Basismodellen understøtter finetuning til tilpassede anvendelser, mens Edit-varianten muliggør præcise billedændringer via naturlige sprogprompts.
Hvorfor er Z-Image ideel til NSFW-indholdsskabelse?
For professionelle kunstnere, uafhængige spiludviklere og hobbyister er evnen til at generere ubegrænset indhold afgørende. Uanset om det er til kunstnerisk nøgenhed, grumme horror-temaer eller voksent indhold, er brugerne strømmet til Z-Image, fordi den ikke prædiker moral.
Fordi modellen er open source (Apache 2.0-licens), kan udviklere træne små adaptere for at styre modellen mod specifikke stilarter, karakterer eller eksplicitte temaer uden begrænsninger.
NSFW-indholdsskabelse kræver fleksibilitet, detaljerig præcision og privatliv — kvaliteter som Z-Image leverer i rigt mål. Traditionelle værktøjer censurerer ofte eksplicitte prompts, hvilket begrænser kunstnerisk udtryk. Z-Image behandler derimod ucensurerede input og muliggør generering af erotiske scener, fantasy-figurer eller voksentematiske illustrationer med høj fidelitet. Dens overlegenhed i fotorealisme til NSFW, der ofte overgår modeller som Stable Diffusion i prompt-overholdelse for komplekse scenarier med anatomi, positurer og atmosfærer. Denne ucensurerede tilgang er i tråd med etisk voksent indholdsskabelse, forudsat at brugerne følger lovgivning og platformenes retningslinjer.
Hvordan får man adgang til Z-Image?
Adgang til Z-Image er ligetil, med muligheder for både skybaserede og lokale opsætninger, så det passer til forskellige brugeres behov.
Hvor kan du finde Z-Image online?
Det primære online adgangspunkt er via den officielle demo på Hugging Face Spaces, hvor du kan generere billeder direkte i din browser uden installation. For en mere poleret weboplevelse, besøg z-image.ai, en uafhængig tjeneste, der distribuerer Z-Image-modeller. Her logger brugere ind for at få adgang til et galleri af genererede billeder, vælge billedformater (f.eks. 16:9 til widescreen-NSFW-scener) og bruge daglige gratis credits.
For avancerede brugere er model-checkpoints tilgængelige på Hugging Face (https://huggingface.co/Tongyi-MAI/Z-Image-Turbo) og ModelScope.
Hvilke gratis- og betalte muligheder findes der for Z-Image?
Gratis adgang inkluderer begrænsede daglige credits på z-image.ai, tilstrækkeligt til at teste NSFW-prompts. Betalte planer tilbyder ekstra credits til højvolumengenerering, startende på overkommelige niveauer. For open source-entusiaster er lokal adgang via GitHub (https://github.com/Tongyi-MAI/Z-Image) helt gratis, om end det kræver hardwareinvestering.
Hvordan installerer man Z-Image lokalt?
Lokal installation låser op for fuld kontrol, hvilket er essentielt for privatlivsfølsom NSFW-skabelse. Da det er open source, er det ikke en "app", du downloader fra en butik, men en model, du kører i et miljø.
Hvilken hardware og software har du brug for?
Z-Image Turbo kører effektivt på GPU’er med 6–12 GB VRAM, såsom NVIDIA RTX 3060 eller højere. Softwareforudsætninger inkluderer Python 3.10+, PyTorch 2.0+ og CUDA til NVIDIA GPU’er.
Trin-for-trin installationsvejledning
- Klon repoet:
git clonehttps://github.com/Tongyi-MAI/Z-Image.git` og gå til mappen. - Installer afhængigheder:
pip install -e .for native inferens, ellerpip install git+https://github.com/huggingface/diffusersfor Diffusers-understøttelse. - Hent modeller: Hent
Z-Image-Turbofra Hugging Face og placer den i din models-mappe. - Til ComfyUI-integration (anbefalet til node-baserede workflows): Installer ComfyUI, opdatér det, og download krævede safetensors-filer som
z_image_turbo_bf16.safetensors.
Hvordan genererer man NSFW-indhold med Z-Image?
At skabe NSFW-indhold indebærer at udforme effektive prompts og finjustere parametre.
Hvilke prompts fungerer bedst til NSFW-billeder?
Effektive NSFW-prompts bør være detaljerede: Angiv anatomi, positurer, lys og stemning. Dens tosprogede understøttelse gør det muligt at blande sprog for unikke resultater. Tips fra fal.ai’s guide fra december 2025 anbefaler at undgå vage termer for at forbedre overholdelsen.
Hvordan bruger man Python-kode til NSFW-generering?
Her er et Python-eksempel med Diffusers til lokal generering:
import torch
from diffusers import ZImagePipeline
# Indlæs pipelinen
pipe = ZImagePipeline.from_pretrained(
"Tongyi-MAI/Z-Image-Turbo",
torch_dtype=torch.bfloat16,
low_cpu_mem_usage=False,
)
pipe.to("cuda")
# Aktivér optimeringer (valgfrit)
# pipe.transformer.compile()
# pipe.enable_model_cpu_offload()
# NSFW-prompt-eksempel
prompt = "Erotisk scene af et nøgent par, der omfavner lidenskabeligt, blødt stearinlys, detaljeret anatomi, høj opløsning, fotorealistisk."
# Generér billede
image = pipe(
prompt=prompt,
height=1024,
width=1024,
num_inference_steps=9, # Optimalt til Turbo
guidance_scale=0.0, # Ingen guidance for ucensureret output
generator=torch.Generator("cuda").manual_seed(69),
).images[0]
image.save("nsfw_example.png")
Denne kode producerer NSFW-billeder i høj kvalitet på få sekunder. Eksperimentér med seeds for variationer.
Avancerede teknikker: Billedredigering til NSFW
Brug Z-Image-Edit til at ændre eksisterende billeder: Upload et basisbillede og prompt "Forstærk nøgenhed med mere eksplicitte detaljer." Denne finetunede variant, planlagt til fuld udgivelse i begyndelsen af 2026 ifølge nyhedsopdateringer, excellerer i kreative redigeringer.
Hvordan bør brugere skrive prompts for de bedste resultater?
Prompting til Z-Image er en smule anderledes end til ældre modeller som Stable Diffusion 1.5. Fordi den bruger en Transformer-rygrad, der ligner store sprogmodeller (LLM’er), forstår den naturligt sprog meget bedre.
1. Naturligt sprog vs. tag-salat
- Gammel metode (SD1.5):
masterpiece, best quality, 1girl, red dress, standing, city street, bokeh - Z-Image-metode:
A high-quality photo of a woman wearing a red dress standing on a busy city street with blurred lights in the background.
Selvom den kan forstå kommaseparerede tags, excellerer den, når du beskriver scenen i sætninger. Dette er især nyttigt til at generere komplekse, ubegrænsede scener, hvor forholdet mellem objekter (f.eks. "X holder Y") er afgørende.
2. Udnyttelse af tosproget kapabilitet
En af Z-Images unikke funktioner er dens evne til at gengive tekst. Hvis du vil have tekst i dit billede, skal du blot inkludere den i anførselstegn.
- Prompt:
A movie poster for a horror film titled "THE UNKNOWN", dark atmosphere, skulls. - Resultat: Modellen vil sandsynligvis gengive teksten "THE UNKNOWN" korrekt, en bedrift der forvirrer de fleste andre modeller.
3. Brug af negative prompts
For Turbo-versionen er negative prompts (at fortælle modellen, hvad den ikke skal generere) mindre effektive, fordi modellen har færre trin til at "rette" sig selv.
Råd: Fokuser på en stærk positiv prompt. Hvis du har brug for at fjerne specifikke elementer (f.eks. "deformerede hænder"), er det ofte bedre at bruge Base-modellen eller forfine billedet via et img2img-workflow.
Konklusion
Udgivelsen af Z-Image markerer et afgørende øjeblik. Den beviser, at open source-modeller fra Kina ikke kun indhenter vestlige, lukkede modeller, men overgår dem i effektivitet og tilgængelighed.
For brugeren, der er interesseret i ubegrænset indhold, repræsenterer Z-Image frihed. Den bryder afhængigheden af abonnementsbaserede tjenester, der overvåger og censurerer input. Men denne frihed kommer med ansvar.
CometAPI tilbyder tilsvarende mindre restriktive Grok-modeller (Tillader Grok NSFW? Alt du behøver at vide), samt modeller som Nano Banana Pro, GPT- image 1.5, Sora 2 (Kan Sora 2 generere NSFW-indhold? Hvordan kan vi prøve det?) osv. — forudsat at du har de rette NSFW-tips og -tricks til at omgå begrænsningerne og begynde at skabe frit. Før adgang skal du sikre dig, at du er logget ind på CometAPI og har indhentet API-nøglen. CometAPI tilbyder en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.
Klar til at gå i gang?→ Gratis prøve til at skabe !
