/
Mô hìnhHỗ trợDoanh nghiệpBlog
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Tài nguyên
Mô hình AIBlogDoanh nghiệpNhật ký thay đổiGiới thiệu
2025 CometAPI. Bảo lưu mọi quyền.Chính sách Bảo mậtĐiều khoản Dịch vụ
Home/Models/Aliyun/Qwen Image
Q

Qwen Image

Theo Yêu cầu:$0.028
Qwen-Image — 2025 жылы Alibaba компаниясының Tongyi Qianwen командасы жариялаған кескіндерді генерациялауға арналған революциялық іргелі модель. 20 миллиард параметрі бар бұл модель MMDiT (Көпмодальды диффузиялық трансформер) архитектурасына негізделген. Модель күрделі мәтінді рендерлеу және дәл кескін өңдеу салаларында елеулі серпілістерге қол жеткізді, әсіресе қытай тіліндегі мәтінді рендерлеуде айрықша өнімділік көрсетеді. DeepL.com (тегін нұсқа) арқылы аударылды
Mới
Sử dụng thương mại
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Негізгі мүмкіндіктер

  • Суреттер ішіндегі жергілікті / жоғары сапалы мәтіндік рендеринг — жасалған кескіндерде (постерлер, қаптама, скриншоттар) оқуға жеңіл, семантикалық тұрғыдан дәл мәтінді жасауда өте мықты — бұл көптеген бұрынғы кескін модельдері қиналған сала.
  • Жоғары дәлдіктегі мультимодальды нәтиже — жақсы детальмен және тілді ескеретін орналасумен фотореалистік әрі стильдендірілген кескіндер жасайды.
  • Стильді тасымалдау және детальдарды жақсарту — көріністің тұтастығын сақтай отырып, бірізді көркем стильдерді қолдана алады немесе жергілікті детальдарды жақсарта алады.

Техникалық мәліметтер — Qwen-Image қалай жұмыс істейді

Архитектура және компоненттер (түйінсөздер: MMDiT, Qwen2.5-VL). Модель кескін синтезі үшін MMDiT-негізіндегі diffusion transformer-ді және prompt-тарды әрі визуалды контексті түсіндіру үшін визуалды-тілдік энкодерді (Qwen2.5-VL) пайдаланады. Бұл бөліну модельге семантикалық бағыттауды және пиксельдік көріністі әртүрлі өңдеуге мүмкіндік береді, соның арқасында мәтін дәлдігі мен өңдеу кезіндегі бірізділік жақсарады. Ресми репозиторий мен техникалық есеп негізгі T2I моделі үшін 20B параметрлі backbone қолданылатынын атап өтеді.

Оқыту пайплайны (түйінсөздер: curriculum learning, data pipeline). Күрделі мәтін рендерингін шешу үшін Qwen-Image прогрессивті curriculum қолданады: ол қарапайым, мәтінсіз кескіндерден басталып, біртіндеп абзац деңгейіндегі енгізулерге дейін күрделі, мәтінге бай мысалдармен оқытылады. Команда ауқымды жинауды, мұқият сүзуді, синтетикалық аугментацияны және теңгеруді қамтитын жан-жақты пайплайн құрды, осылайша модель оқу барысында шынайы мәтін/фото композицияларының көп түрін көреді. Бұл стратегиялық curriculum модельдің көптілді мәтін рендерингінде озық болу себептерінің бірі.

Өңдеу механизмі (түйінсөздер: dual-encoding, VAE + VL encoder). Өңдеу үшін жүйе түпнұсқа кескінді екі рет береді: бір рет семантикалық басқару үшін Qwen2.5-VL энкодеріне және бір рет қалпына келтіруші көрініс ақпараты үшін VAE энкодеріне. Бұл dual-encoding дизайны өңдеу модуліне семантикалық өзгерістер жасауға мүмкіндік бере отырып, тұлғалық ерекшелікті және визуалды дәлдікті сақтауға көмектеседі — мысалы, нысанды ауыстыру немесе мәтіндік мазмұнды өзгерту кезінде қатысы жоқ аймақтарды бүлдірмейді.

Бенчмарк өнімділігі

Qwen-Image генерация мен өңдеу бойынша бірнеше ашық бенчмаркта SOTA немесе SOTA-ға жақын нәтижелерге қол жеткізеді, әсіресе мәтін рендерингі тапсырмаларында және шынайы композиция бенчмарктарында (мысалы, T2I-CoreBench және таңдап алынған кескін өңдеу жинақтары) өте күшті нәтиже көрсетеді.

Qwen-image API

Qwen-Image басқа жетекші модельдермен қалай салыстырылады

Салыстырмалы артықшылықтары: мәтін рендерингі және екітілді мәтін дәлдігі — бұл модельдің көптеген генеративті бәсекелестерге (мысалы, DALL·E 3, SDXL, Midjourney) қарағандағы айрықша артықшылықтары. Ол модельдер көбіне таза көркем композицияда немесе стильдік әртүрлілікте күштірек болғанымен, тығыз көпжолды немесе қытайша мәтін орналасуында әлсіздеу келеді. Көптеген қауымдастық салыстырулары және модель авторларының бенчмарк кестелері бұл сипаттаманы растайды.

Салыстырмалы ымыралар: жабық, мұқият бапталған коммерциялық жүйелермен салыстырғанда, Qwen-Image кейбір жағдайларда бірдей реализмге жету үшін кейінгі өңдеуді немесе prompt/adapter баптауын қажет етуі мүмкін (қисық беттердегі бұрмалану, фотореалистік композициялау), тәуелсіз тесттерге сәйкес. Үлгіленген дизайндарды, қаптама макеттерін немесе екітілді мәтін орналасуларын басым қоятын пайдаланушылар үшін Qwen-Image көбіне қолайлырақ болады.


Әдеттегі және жоғары құнды қолдану жағдайлары

  • Қаптама және өнім макеттері: жапсырмалар мен қаптаманы сынау үшін дәл мәтін және көпжолды орналасулар.
  • Жарнама және дизайн нобайлары: мәтін дәлдігі маңызды болғанда жылдам прототиптеу (постерлер, баннерлер).
  • Құжаттандырылған кескін генерациясы: оқылатын мазмұнды міндетті түрде қамтуы тиіс кескіндерді жасау (мәзірлер, белгілер, интерфейстер).
  • Кескін өңдеу пайплайндары: стиль мен перспективаны сақтай отырып, нысаналы өңдеулер (мәтінді ауыстыру, нысан қосу/алып тастау).
  • Qwen image API-іне қалай қол жеткізуге болады

1-қадам: API кілті үшін тіркелу

cometapi.com сайтына кіріңіз. Егер әлі пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI console тіркелгіңізге кіріңіз. Интерфейстің қол жеткізу деректемесі — API кілтін алыңыз. Жеке орталықтағы API token бөлімінде “Add Token” түймесін басып, token key алыңыз: sk-xxxxx және жіберіңіз.

2-қадам: Qwen image API-іне сұраулар жіберу

API сұрауын жіберу үшін “qwen-image ”endpoint-ін таңдап, сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің сайттағы API doc бөлімінде берілген. Ыңғайлылығыңыз үшін біздің сайт Apifox тестін де ұсынады. <YOUR_API_KEY> орнын тіркелгіңіздегі нақты CometAPI кілтімен ауыстырыңыз. base url — Images format(https://api.cometapi.com/v1/images/generations) арқылы CometAPI.

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель дәл соған жауап береді .

3-қадам: Нәтижелерді алу және тексеру

Жасалған жауапты алу үшін API жауабын өңдеңіз. Өңдеуден кейін API тапсырма күйін және шығыс деректерін қайтарады.

Tính năng cho Qwen Image

Khám phá các tính năng chính của Qwen Image, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Qwen Image

Khám phá mức giá cạnh tranh cho Qwen Image, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Qwen Image có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Theo Yêu cầu:$0.028
Theo Yêu cầu:$0.035
-20%

Mã mẫu và API cho Qwen Image

Qwen-Image — жоғары дәлдікті мәтіндік рендерингке, дәл өңдеуге және мәтіннен кескін жасауға арналған Qwen топтамасындағы кескін жасау және кескін өңдеу іргелі моделі. Ол мәтінді ескере отырып генерациялауды, екітілді мәтіндік рендерингті (әсіресе қытай және ағылшын тілдерінде жоғары деңгейде), сондай-ақ контекст ішіндегі ұсақ деңгейлі өңдеуді орындауға арналған. Бұл шығарылым түсіну + генерация біріктірілген дизайн философиясына баса мән береді (кескінді түсіну тапсырмалары мен генеративті тапсырмалар бірыңғай үдерісте оқытылған).

Các phiên bản của Qwen Image

Lý do Qwen Image có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
version
qwen-image-edit-plus-2025-10-30
qwen-image-max-2025-12-30
qwen-image
qwen-image-edit

Thêm mô hình