Alibaba Cloud компаниясының AI бөлімі ресми түрде іске қосылды Qwen‑VLo, оның Qwen мультимодальды модельдер сериясының соңғы итерациясы, біртұтас көру және тіл мүмкіндіктеріндегі елеулі ілгерілеуді білдіреді. 28 жылдың 2025 маусымында жарияланған Qwen‑VLo түсіну және генерациялау функцияларын ұсынады, ол өзінің алдыңғы нұсқаларынан әлдеқайда асып түседі, табиғи тілдегі сұраулар мен визуалды енгізулер арқылы басқарылатын жоғары ажыратымдылықтағы кескін жасау және өңдеуді қамтиды.
Qwen‑VL және Qwen2.5‑VL сияқты бұрынғы шығарылымдарға сүйене отырып, Qwen‑VLo Alibaba мультимодальды AI-дағы «жан-жақты жаңарту» ретінде сипаттайтын нәрсені білдіреді. Qwen‑VL негізінен көрнекі ақпаратты интерпретациялауға және Qwen2.5‑VL кеңейтілген ұзақ мәтінмәнді түсінуге назар аударғанымен, Qwen‑VLo бұл күшті жақтарын екі жақты көру-тіл тапсырмаларын орындауға қабілетті бір құрылымға біріктіреді. Ол ашық нұсқауларды орналастырады, қытай және ағылшын тілдерін қоса бірнеше тілдерді қолдайды және адам суретшілерімен бәсекелесу үшін өз нәтижелерін нақтылайды.
Басты ерекшеліктер
Прогрессивті кескін жасау
Qwen‑VLo кескіндерді кезең-кезеңімен (солдан оңға және жоғарыдан төмен) құрастырады, сәйкестік пен визуалды үйлесімділікті қамтамасыз ету үшін болжанған мазмұнды итеративті түрде нақтылайды. Бұл механизм генерацияның тиімділігін де, шығармашылық процесті пайдаланушы бақылауын да арттырады.
Динамикалық ажыратымдылықты қолдау
Динамикалық ажыратымдылықты оқытуды пайдалана отырып, модель еркін енгізу/шығару ажыратымдылықтары мен арақатынастарды өңдей алады. Пайдаланушылар әртүрлі сценарийлерге бейімделген мазмұнды (мысалы, веб-баннерлер, әлеуметтік медиа мұқабалары немесе жоғары ажыратымдылықтағы плакаттар) бекітілген форматтармен шектелмей жасай алады.
Ашық нұсқауларды өңдеу
Табиғи тілдің сұраулары арқылы Qwen VLo стильді тасымалдау («Ван Гог стилін қолдану»), композиттік түрлендірулер («Шуақты аспанды қосу») және көп қырлы модификациялар сияқты кеңейтілген өңдеулерді бір нұсқаулықта орындай алады. Ол сондай-ақ тереңдік карталары, сегменттеу маскалары және жиектер контурлары сияқты дәстүрлі көрнекі сигналдарды шығаруды және өңдеуді қолдайды.
Көптілді өзара әрекеттесу
Модель бірнеше тілдегі пәрмендерді қабылдайды (қазіргі уақытта қытай және ағылшын тілдерін қолдайды), осылайша жаһандық пайдаланушы базасын қамтамасыз етеді және шығармашылық жұмыс үрдістеріндегі тілдік кедергілерді бұзады.
Қол жетімділік және қол жеткізу
Qwen‑VLo қазір қол жетімді алдын-ала қарау Qwen Chat платформасы арқылы chat.qwen.ai. Alibaba Cloud алдын ала қарау шығарылымы ретінде пайдаланушылар генерация кезінде кездейсоқ сәйкессіздіктерге немесе нақты дәлсіздіктерге тап болуы мүмкін екенін атап өтті. Әзірлеу тобы кеңірек шығарылым алдында осы шектеулерді шешу үшін белсенді түрде қайталануда.
Alibaba компаниясының AI инженерлері бұлттық және шеткі орталарда қолдану үшін Qwen‑VLo-ны оңтайландырды. Аралас дәлдіктегі кванттау және жаңа параметрді тиімді дәл баптау әдістерін қолдана отырып, модель ықшам есептеу алаңында жоғары өнімділікті сақтайды. Alibaba сондай-ақ Alibaba Cloud жүйесінде кәсіпорын деңгейіндегі жұмыс жүктемелеріне дейін масштабтау кезінде Qwen‑VLo кешігуге сезімтал қолданбаларға (мысалы, интерактивті дизайн құралдары) қызмет көрсете алатынын қамтамасыз ету үшін кідіріс пен сапаны теңестіру үшін бейімделгіш қорытынды құбырларын біріктірді.
Салыстырыңыз Qwen-VL-Plus/Макс
| Функция өлшемі | Qwen-VL-Plus/Макс | Qwen VLo |
|---|---|---|
| Суретті түсіну | Негізгі классификация, сипаттама | Көпөлшемді құрылымды тану, кеңейтілген контекстік түсіну |
| Кескінді құру | Шектеулі стильді қолдау | Жоғары дәлдік, прогрессивті ұрпақ, стильді басқарудың күшті мүмкіндіктері |
| Көп тапсырманы орындау мүмкіндігі | Тапсырмаға қатысты енгізуді қажет етеді | Бірыңғай көп тапсырма, күрделі тілдік нұсқауларды қолдайды |
| Көптілді өзара әрекеттесу | Шектеулі қолдау | Қытай және ағылшын тілдерін жергілікті қолдау, табиғи тілді басқаруды жеңілдету |
| Мәліметтерді сақтау мүмкіндігі | Генерациядағы ықтимал бөлшектердің жоғалуы | Негізгі құрылымдар мен семантиканы дәл анықтау және қайта құру |
Басталу
CometAPI – OpenAI GPT сериялары, Google Gemini, Anthropic's Claude, Midjourney, Suno және т.б. сияқты жетекші провайдерлердің 500-ден астам AI үлгілерін бір, әзірлеушілерге ыңғайлы интерфейске біріктіретін бірыңғай API платформасы. Тұрақты аутентификацияны, сұрауды пішімдеуді және жауаптарды өңдеуді ұсына отырып, CometAPI қолданбаларыңызға AI мүмкіндіктерін біріктіруді айтарлықтай жеңілдетеді. Чат-боттарды, кескін генераторларын, музыкалық композиторларды немесе деректерге негізделген аналитикалық құбырларды құрастырып жатсаңыз да, CometAPI сізге AI экожүйесіндегі соңғы жетістіктерге қол жеткізе отырып, жылдамырақ қайталауға, шығындарды басқаруға және жеткізуші-агностикалық күйде қалуға мүмкіндік береді.
Бастау үшін үлгілердің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз.
Ең соңғы Qwen‑VLo API интеграциясы жақын арада CometAPI-де пайда болады, сондықтан хабардар болыңыз! Qwen‑VLo үлгісін жүктеп салуды аяқтағанша, басқа үлгілерімізді мына жерден қараңыз. Модельдер беті немесе оларды ішінде көріңіз AI ойын алаңы. Qwen компаниясының CometAPI-дегі соңғы үлгісі Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b) and qwen-vl-plus-latest.

