Qwen-image-edit API

CometAPI
AnnaNov 12, 2025
Qwen-image-edit API

Qwen-Image-Edit is de bewerkingstak van de Qwen-beeldfamilie, ontwikkeld door het Qwen-team (Alibaba/QwenLM-ecosysteem). Het is gebouwd op een MMDiT-backbone met 20 miljard parameters en breidt de geavanceerde tekstweergavemogelijkheden van Qwen-Image expliciet uit naar robuuste workflows voor beeldbewerking. Het model is bedoeld voor taken waarbij bewerkingsgetrouwheid van belang is, zoals het direct wijzigen van tekst op borden, het behouden van lettertypen en lay-out, het toevoegen/verwijderen van objecten met behoud van semantische consistentie, gezichtspunt-/houdingstransformaties en fijnmazige stijloverdrachten.

Belangrijkste kenmerken

  • Nauwkeurige tekstbewerking in afbeeldingen (tweetalig: Chinees en Engels) — tekst toevoegen, verwijderen of vervangen, waarbij het lettertype/de grootte/de stijl zoveel mogelijk behouden blijft.
  • Dubbele bewerkingsmodi: semantisch + uiterlijk — ondersteunt semantische wijzigingen op hoog niveau (rust, objectvervanging, gezichtspunt) en bewerkingen van het uiterlijk op laag niveau (stijloverdracht, textuur, lokale retouchering).
  • Masker-/regio-/multi-turn-bewerkingen — ondersteunt gemaskeerde inpainting, regioprompts en gekoppelde bewerkingen voor iteratieve verfijningsworkflows.
  • Multi-image-invoer (nieuwste versie): De 2509-iteratie biedt ondersteuning voor het bewerken van meerdere afbeeldingen (bijvoorbeeld persoon+persoon, persoon+product), verbeterde consistentie van identiteit/product/tekst en native invoer in ControlNet-stijl.

Technische details

  • Basisschaal / familie: gebouwd op de 20B-parameter Qwen-Image-fundamentmodel (MMDiT-stijl diffusie/multimodaal ontwerp).
  • Bewerkingspijplijn met dubbele codering: De bewerkingsmodule ontvangt (1) een semantische representatie via een Qwen2.5-VL visuele encoder en (2) een reconstructieve representatie via een VAE-encoder. Door beide representaties parallel aan te sturen, kan de bewerkingskop een afweging maken tussen semantische verandering en pixelgetrouwheid. Deze dubbele codering is een belangrijke technische keuze voor robuuste bewerkingen.
  • Progressieve / curriculum training: De training evolueerde van eenvoudigere taken voor tekstweergave en -generatie naar complexe tekstweergave op alineaniveau en multi-task bewerkingsdoelen (T2I-, TI2I-, I2I-reconstructie). Dit curriculum zou een centrale factor zijn in de verbeterde tekstgetrouwheid en bewerkingsstabiliteit van het model.
  • Model smaak / modules: Qwen-Image-Edit wordt beschreven als een MMDiT-stijl 20B-model dat Qwen2.5-VL-componenten, een diffusiebewerkingskop en VAE-componenten voor controle over het uiterlijk integreert.

Benchmarkprestaties

Geclaimde cross-benchmark SOTA: Het Qwen-team rapporteert state-of-the-art (SOTA) of topresultaten op meerdere openbare benchmarks voor het genereren en bewerken van afbeeldingen, waaronder GenEval, DPG, OneIG-Bench (generatie) en GEdit, ImgEdit, GSO (bewerking).

Qwen-image-edit API

Beperkingen en kanttekeningen (praktisch)

  1. Artefacten en randgevallen: Uit community-tests blijkt dat er af en toe sprake is van oververzadiging, huidtextuurartefacten of compositienaden in enkele zeer gedetailleerde bewerkingen. Community-bliksemvorken zijn bedoeld om dit te verhelpen.
  2. Berekenen / geheugen: Het 20B-model en de uiterst nauwkeurige bewerkingspipelines zijn GPU-intensief. Lokale implementatie profiteert van bfloat16/FP8 en geoptimaliseerde samplingworkflows (er bestaan ​​4/8-staps "lightning"-varianten om VRAM en latentie te verminderen).
  3. Veiligheid en IP: Net als alle algemene imagers kan Qwen-Image-Edit auteursrechtelijk beschermde tekens of gevoelige content genereren. Voor productiegebruik zijn moderatiecontroles en het goedkeuren van rechten vereist. (Typische best practice voor ondernemingen.)
  4. Fout toestanden: Obscure of zeer zeldzame tekens/woorden kunnen nog steeds onjuist worden weergegeven of vereisen iteratieve (“aaneengeschakelde”) bewerkingen om convergentie te bewerkstelligen (auteurs wijzen op voorbeelden zoals zeldzame Chinese tekens die stapsgewijze correcties vereisen).

Hoe Qwen-Image-Edit zich verhoudt tot andere opties

  • Stabiele diffusie / SDXL (inpainting): SDXL plus ControlNet en speciale inpainting-pipelines zijn snel, hebben brede community-toolondersteuning en veel LoRA's; ze blinken uit in algemene inpainting-workflows en snelheid/efficiëntie. De sterke punten van Qwen-Image-Edit zijn: native tweetalige tekstbewerking, in sommige gevallen een sterkere identiteits-/productconsistentie en geïntegreerde afwegingen tussen semantiek en uiterlijk. Communityvergelijkingen laten zien dat Qwen vaak hoger scoort op het gebied van bewerkingsgetrouwheid en tekstnaleving, maar tegen hogere computerkosten.
  • Gesloten-bron editors (Adobe Firefly / DALL·E / Runway): Gesloten API's kunnen zeer verfijnd zijn (gebruikersinterface, geïntegreerde moderatie, latentiegaranties), maar Qwen-Image-Edit onderscheidt zich als een volledig open alternatief dat specifiek gericht is op robuuste tweetalige tekstbewerking en lokale implementatie biedt. De praktische keuze hangt vaak af van de vraag of u lokale controle / open licenties of een verfijnde cloud-UX nodig hebt.

Praktische gebruiksscenario's

  • Bewerkingen van posters en bewegwijzering — tekst op posters wijzigen met behoud van lettertype/textuur.
  • Productmarketing / postergeneratie — items toevoegen/verwijderen, productidentiteit behouden voor e-commerce-afbeeldingen.
  • Bewerkingen met behoud van de identiteit van portretten — houdingveranderingen, stijloverdrachten terwijl de identiteit consistent blijft (verbeterd in 2509).
  • Restauratie & kalligrafiecorrectie — restauratie van oude foto’s en stapsgewijze correctie van handgeschreven/gedrukte tekens.
  • Creatieve/ontwerpworkflows — bewerkingen van composities van meerdere afbeeldingen, generatie van memes, styling van avatars waarbij tweetalige tekst betrokken kan zijn.

Hoe de qwen-image-edit API vanuit CometAPI aan te roepen

qwen-image-edit API-prijzen in CometAPI, 20% korting op de officiële prijs:

Invoertokens$2.00
Uitvoertokens$6.40

Vereiste stappen

  • Inloggen cometapi.comAls u nog geen gebruiker bent, registreer u dan eerst.
  • Log in op uw CometAPI-console.
  • Haal de API-sleutel voor de toegangsgegevens van de interface op. Klik op 'Token toevoegen' bij de API-token in het persoonlijke centrum, haal de tokensleutel op: sk-xxxxx en verstuur.

Qwen-image-edit API

Gebruik methode

  1. Selecteer het eindpunt "qwen-image-edit" om de API-aanvraag te versturen en de aanvraagbody in te stellen. De aanvraagmethode en de aanvraagbody zijn te vinden in de API-documentatie op onze website. Onze website biedt ook een Apifox-test voor uw gemak.
  2. Vervangen met uw werkelijke CometAPI-sleutel van uw account.
  3. Vul het inhoudsveld in en het model zal hierop reageren.
  4. Verwerk het API-antwoord om het gegenereerde antwoord te verkrijgen.

CometAPI biedt een volledig compatibele REST API voor een naadloze migratie. Belangrijke details voor afbeelding bewerken:

Zie ook Qwen-image API

Lees Meer

500+ modellen in één API

Tot 20% korting