Qwen-image-edit API

CometAPI
AnnaNov 12, 2025
Qwen-image-edit API

Qwen-Image-Edit — Qwen командасы әзірлеген Qwen кескіндер тобының өңдеу бөлімі (Alibaba / QwenLM экожүйесі). Ол 20 миллиард параметрлі MMDiT магистральында құрастырылған және Qwen-Image-тің кеңейтілген мәтінді көрсету мүмкіндіктерін кескінді өңдеудің сенімді жұмыс үрдістеріне айқын түрде кеңейтеді. Модель нақтылықты өңдеу маңызды болатын тапсырмаларға арналған — мысалы, белгілердегі мәтінді тікелей өзгерту, қаріптер мен орналасуды сақтау, мағыналық сәйкестікті сақтай отырып нысандарды қосу/жою, көзқарас/поза түрлендірулері және ұсақ-түйек мәнерді тасымалдау.

Басты ерекшеліктер

  • Суреттегі мәтінді дәл өңдеу (екі тілде: қытай және ағылшын) — мүмкіндігінше қаріпті/өлшемді/стильді сақтай отырып, мәтінді қосу, жою немесе ауыстыру.
  • Қосарлы өңдеу режимдері: семантикалық + сыртқы түрі — жоғары деңгейлі семантикалық өзгерістерді (демалу, нысанды ауыстыру, көзқарас) және төменгі деңгейдегі сыртқы көріністі өңдеуді (стильді тасымалдау, текстура, жергілікті ретуш) қолдайды.
  • Маска / аймақ / көп айналымды өңдеулер — қайталанатын нақтылау жұмыс үрдістері үшін бүркенішпен бояуды, аймақтық сұрауларды және тізбектелген өңдеулерді қолдайды.
  • Көп кескінді енгізулер (соңғы нұсқа): 2509 итерациясы көп кескінді өңдеу қолдауын қосады (мысалы, адам+адам, адам+өнім), жақсартылған сәйкестік/өнім/мәтін сәйкестігі және ControlNet стиліндегі кірістер.

Техникалық мәліметтер

  • Негізгі шкала/отбасы: үстіне салынған 20B параметрі Qwen-Image негізі үлгісі (MMDiT стиліндегі диффузия / мультимодальды дизайн).
  • Қос кодтауды өңдеу құбыры: өңдеу модулі (1) Qwen2.5-VL визуалды кодтары арқылы семантикалық көріністі және (2) VAE кодтары арқылы реконструктивтік ұсынуды алады. Екі көріністі параллель беру өңдеу басшысына семантикалық өзгерістер мен пикселдердің дәлдігін салыстыруға мүмкіндік береді. Бұл қос кодтау сенімді өңдеулер үшін негізгі инженерлік таңдау болып табылады.
  • Прогрессивті/оқу бағдарламасы бойынша оқыту: оқыту қарапайым мәтінді көрсету және генерациялау тапсырмаларынан күрделі абзац деңгейіндегі мәтінді көрсету және көп тапсырманы өңдеу мақсаттарына дейін (T2I, TI2I, I2I қайта құру) өтті. Бұл оқу бағдарламасы үлгінің жақсартылған мәтін дәлдігі мен өңдеу тұрақтылығының орталық факторы болып табылады.
  • Үлгі дәм/модульдер: Qwen-Image-Edit Qwen2.5-VL құрамдастарын, диффузиялық өңдеу басын және сыртқы көріністі басқаруға арналған VAE құрамдастарын біріктіретін MMDiT стиліндегі 20B үлгісі ретінде сипатталған.

Эталондық өнімділік

Мәлімделген кросс-бенчмарк SOTA: Qwen командасы жалпыға ортақ кескіндерді жасау және өңдеудің бірнеше көрсеткіштері бойынша заманауи (SOTA) немесе жоғары деңгейлі нәтижелерді хабарлайды, соның ішінде GenEval, DPG, OneIG-Bench (ұрпақ) және GEdit, ImgEdit, GSO (редакциялау).

Qwen-image-edit API

Шектеулер мен ескертулер (практикалық)

  1. Артефактілер және жиектері: қауымдастық сынағы кейбір жоғары егжей-тегжейлі өңдеулерде мезгіл-мезгіл шамадан тыс қанықтылықты, тері текстурасының артефактілерін немесе біріктірілген тігістерді көрсетеді; қауымдастықтың найзағайлары бұларды азайтуға бағытталған.
  2. Есептеу / жады: 20B үлгісі және толық дәлдіктегі өңдеу құбырлары графикалық процессорды қажет етеді. Жергілікті орналастыру bfloat16/FP8 және оңтайландырылған іріктеу жұмыс үрдістерінің артықшылықтары (VRAM және кешігуді азайту үшін 4/8 қадамдық «найзағай» нұсқалары бар).
  3. Қауіпсіздік және IP: барлық жалпы мақсаттағы кескіндер сияқты, Qwen-Image-Edit авторлық құқықпен қорғалған таңбаларды немесе құпия мазмұнды жасай алады — өндірісті пайдалану модерацияны басқару элементтерін және құқықтарды тазартуды қажет етеді. (Кәсіпорынның ең жақсы тәжірибесі.)
  4. Сәтсіздік режимдері: түсініксіз немесе өте сирек таңбалар/сөздер әлі де дұрыс көрсетілмеуі мүмкін немесе біріктіру үшін қайталанатын («тізбектелген») өңдеулер қажет болуы мүмкін (авторлар кезең-кезеңімен түзетуді қажет ететін сирек қытай глифтері сияқты мысалдарды атап өтеді).

Qwen-Image-Edit басқа опциялармен қалай салыстырылады

  • Тұрақты диффузия / SDXL (бояу): SDXL plus ControlNet және арнайы бояу құбырлары жылдам, кең қауымдастық құралдарын қолдауы және көптеген LoRAs бар; олар жалпы бояу жұмыс үрдісінде және жылдамдық/тиімділікте жоғары. Qwen-Image-Edit-тің күшті жақтары жергілікті екі тілді мәтінді өңдеу, кейбір жағдайларда қатаң сәйкестік/өнім сәйкестігі және біріктірілген семантикалық+көрініс айырбастары. Қауымдастық салыстырулары Qwen көбінесе өңдеудің дәлдігі мен мәтінді сақтауда жоғарырақ, бірақ есептеу құны жоғары екенін көрсетеді.
  • Жабық бастапқы редакторлар (Adobe Firefly / DALL·E / Runway): жабық API интерфейстері өте жылтыратылған болуы мүмкін (UI, біріктірілген модерация, кідіріс кепілдіктері), бірақ Qwen-Image-Edit сенімді екі тілді мәтінді өңдеуге арнайы бағытталған және жергілікті орналастыруды ұсынатын толық ашық балама ретінде ерекшеленеді. Практикалық таңдау көбінесе сізге жергілікті бақылау/ашық лицензиялау немесе жылтыратылған бұлттық UX қажет пе, соған байланысты.

Практикалық қолдану жағдайлары

  • Постер мен маңдайшаларды өңдеу — шрифт/текстураны сақтай отырып, постердегі мәтінді өзгерту.
  • Өнім маркетингі / постер жасау — элементтерді қосу/жою, электрондық коммерция суреттері үшін өнімнің сәйкестігін сақтау.
  • Портрет сәйкестігін сақтайтын өңдеулер — сәйкестікті сақтай отырып, поза өзгерістері, стильді тасымалдау (2509 жылы жетілдірілді).
  • Қалпына келтіру және каллиграфияны түзету — ескі фотосуреттерді қалпына келтіру және қолжазба/басылған таңбаларды кезең-кезеңімен түзету.
  • Шығармашылық/дизайн жұмыс үрдістері — екі тілді мәтін қатысуы мүмкін көп кескінді композицияны өңдеу, мем жасау, аватарды сәндеу.

CometAPI ішінен qwen-image-edit API қалай шақыруға болады

qwen-image-edit CometAPI ішіндегі API бағасы, ресми бағадан 20% жеңілдік:

Енгізу токендері$2.00
Шығару белгілері$6.40

Қажетті қадамдар

  • Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз.
  • Сіздің кіріңіз CometAPI консолі.
  • Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.

Qwen-image-edit API

Пайдалану әдісі

  1. API сұрауын жіберу және сұрау мәтінін орнату үшін «qwen-image-edit» соңғы нүктесін таңдаңыз. Сұраныс әдісі мен сұрау мәтіні API doc веб-сайтымыздан алынған. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox тестін ұсынады.
  2. Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
  3. Мазмұн өрісіне сұрағыңызды немесе сұрауыңызды енгізіңіз — үлгі осыған жауап береді.
  4. . Жасалған жауапты алу үшін API жауабын өңдеңіз.

CometAPI үздіксіз тасымалдау үшін толық үйлесімді REST API қамтамасыз етеді. Негізгі мәліметтер суретті өңдеу:

  • Негізгі URL: https://api.cometapi.com/v1/images/edits
  • Модель атаулары: qwen-image-өңдеу
  • Түпнұсқалық растама: Bearer YOUR_CometAPI_API_KEY тақырып
  • Мазмұн түрі: application/json .

Сондай-ақ, қараңыз Qwen-image API

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік