Alibaba DAMO академиясы бүгін ресми түрде шығарылды Wan 2.2, a Сарапшылар қоспасы (ММ) сәулет. Wan 2.2 есептеу тиімділігін, қозғалыс дәлдігін және кинематографиялық мәнерлілігін серпінді жақсартуды уәде етеді — әзірлеушілер мен жасаушыларға бұрын-соңды болмаған бақылау және икемділікпен мәтін немесе кескін нұсқауларынан жоғары сапалы 1080p бейнелер жасауға мүмкіндік береді. Wan 2.2 егжей-тегжейлі, қозғалысты өңдеу, салыстыру және визуалды бейнелеуде айтарлықтай табыстар береді. 2.1.
Wan 2.2. негізгі инновациялар
1. ТМ-мен басқарылатын тазарту құбыры
ішкі желілерде жүйе ресурстарды ең маңызды жерлерге бөле алады — сахна орналасуына арналған кең штрихтар, содан кейін егжей-тегжейлі нақтылау. Бұл дизайн Wan 2.2 флагмандық моделіне 27 миллиард жалпы параметрмен мақтана отырып, бір қорытынды өту үшін бар болғаны 14 миллиардты белсендіруге мүмкіндік береді, бұл жоғары сапалы бейне синтезіне қажетті есептеу ресурстарын тиімді екі есе азайтады.
- Жоғары шу бойынша сарапшы жалпы қозғалыс траекториясын және көрініс композициясын орнатуға бағытталған.
- Шу деңгейі төмен сарапшы мұқият құрылымды, бет бөлшектерін және жарықтандыру нюанстарын қолданады.
Бұл қос-сарапшылық жүйе жасаушылардың Wan 2.1 нұсқасымен салыстырғанда графикалық процессор жады талаптарын пропорционалды түрде арттырмай-ақ, кәсіби кинематографиялық дәлдікпен ұзағырақ, күрделірек тізбектерді жасай алуына кепілдік береді.
2. Кинематографиялық эстетикалық басқару жүйесі
Архитектуралық инновацияларына сүйене отырып, ол пайдаланушыларға интуитивті кілт сөздерді шақыру арқылы жарықтандыруды, түс градациясын, камера бұрыштарын және композицияны басқаруға мүмкіндік беретін бұрын-соңды болмаған «Фильм эстетикасын басқару жүйесін» ұсынады. «Күн батқан жарқырау», «жұмсақ жиек жарығы» немесе «төмен бұрышты теңдестірілген композиция» сияқты дескрипторларды біріктіру арқылы авторлар Голливуд блокбастерлерін немесе инди-арт фильмдерін еске түсіретін көріністерді автоматты түрде жасай алады. Керісінше, «салқын тондар», «қатты жарықтандыру» және «динамикалық жақтау» сияқты енгізулер сұраныс бойынша ғылыми-фантастикалық немесе ноар стиліндегі көрнекі бейнелерді жасайды.
Ашық бастапқы AI бейне үлгілерінде алғаш рет Wan 2.2 біріктіреді фильм деңгейіндегі басқару интерфейсі:
- 60+ реттелетін параметрлер жарықтандыруды, түсті бағалауды, жақтауды, линзаның әсерлерін және өріс тереңдігін қамтиды.
- Ақылды стильді байланыстыру, пайдаланушыларға көңіл-күйді сипаттауға мүмкіндік береді (мысалы, «ымырттағы түнгі жарықтандыру») және жүйеге күрделі камера мен түс параметрлерін автоматты түрде конфигурациялауға мүмкіндік береді.
- Алдын ала анықталған кинематографиялық алдын ала орнатулармысалы, «винтаждық вестерн», «нео‑Токио ғылыми фантастикасы» және «құжаттық репортаж» шығармашылық жұмыс үрдісін жеңілдетеді.
3. Жетілдірілген физика және эмоционалдық реализм
Wan 2.2 нақты дүние құбылыстары мен адамның микроэкспрессияларын имитациялауда айтарлықтай жақсартуларды көрсетеді:
- Физика симуляциясы табиғи сұйықтық динамикасы, көлемді жарықтандыру және соқтығыс әсерлері үшін.
- Бет микро-экспрессиясын түсіру, дірілдеген еріндер, қастың ауысуы және басылған көз жасы сияқты нәзік белгілерді жоғары дәлдікпен көрсету.
- Көп адамдық көріністі өңдеу, когерентті өзара әрекеттесулерді қамтамасыз ету және қозғалатын кейіпкерлер бойынша дәйекті жарықтандыру.
Модель нұсқалары және өнімділік
Wan 2.2 шығарылымы мыналарды қамтиды:
- Wan 2.2‑T2V‑A14B: Мәтіннен бейнеге
- Wan 2.2‑I2V‑A14B: Бейнеге сурет
- Wan 2.2‑IT2V‑5B: Тұтынушыға арналған графикалық процессорларға сәйкес келетін ықшам 5 миллиард параметрді біріктірілген модель, Бірыңғай ұрпақ
5B нұсқасы 3×4×16 уақыт-кеңістік таңбалауышын азайту үшін жоғары сығымдалған 16D VAE мүмкіндігін пайдаланады — тіпті қарапайым жабдықта да біркелкі 1080p шығаруға мүмкіндік береді.
Wan 2.2 жиынтығы әртүрлі пайдалану жағдайларына арналған екі негізгі ұсынысты қамтиды:
14B-параметрі MoE үлгісі (Wan 2.2-T2V-A14B және Wan 2.2-I2V-A14B)
- Максималды сапа үшін толық MoE архитектурасын қолданады.
- 1080p ажыратымдылығымен мәтіннен бейнеге және суреттен бейнеге жұмыс процестерін қолдайды.
- Студия деңгейіндегі өндіріс пен зерттеулер үшін өте қолайлы.
5B-параметрі тығыз бірыңғай үлгі (Wan 2.2-IT2V-5B)
- Тұтынушы деңгейіндегі бір графикалық процессорда (мысалы, NVIDIA RTX 4090) орналастыруға болатын ықшам, өнімділікке бағытталған модель.
- Минимуттарда 720p, 24 кадр/с бейнелерді жасайды, ең аз сапа жоғалтуымен 3×4×16 уақытша және кеңістікті кішірейтуге қол жеткізу үшін жоғары сығымдағы 16D VAE мүмкіндігін пайдаланады.
- Әуесқойлар мен шағын командаларға AI бейне генерациясымен тәжірибе жасау үшін кедергіні төмендетеді.
Көрсеткіштер кішірек үлгінің стандартты ойын жабдығында бес минуттан аз уақыт ішінде 5 секундтық жоғары ажыратымдылықтағы клипті жеткізе алатынын көрсетеді, бұл Wan 2.2-ні өз класындағы ең жылдам ашық бастапқы шешімдердің біріне айналдырады.
Қолжетімділік және ашық бастапқы көз міндеттемесі
Alibaba-ның AI-ны демократияландыруға берген уәдесіне сәйкес, Wan 2.2 толық көзі ашық және көптеген платформалар арқылы еркін қол жетімді:
- GitHub және құшақтайтын бет үлгіні және кодты тікелей жүктеп алу үшін.
- Мода қауымдастығы қауымдастық басқаратын кеңейтімдер мен интеграциялар үшін.
- Alibaba Cloud BaiLian API кәсіпорын деңгейіндегі, сұраныс бойынша үлгі хостингіне арналған.
- Tongyi Wanxiang веб-сайты және қолданбасы кодсыз, браузерге негізделген эксперимент үшін.
2025 жылдың басынан бері Wan сериясы ашық бастапқы қауымдастықта 5 миллионнан астам жүктеп алуды жинады, бұл оның ғаламдық AI тәжірибешілері арасында бірлескен инновациялар мен дағдыларды дамытудағы рөлін атап өтті.
Өнеркәсіптің салдары
Wan 2.2 шығарылымы AI көмегімен фильм түсіру мен мазмұнды жасаудағы маңызды сәт болып табылады:
Коммерциялық әлеует: Брендтер, жарнама берушілер және әлеуметтік медиа платформалары бейне активтерді жылдам прототиптеуден, жекелендірілген жарнамалық шығармалардан және динамикалық әңгімелеу пішімінен пайда көреді.
Кедергілерді төмендету: Кәсіби мамандар мен тәуелсіз авторлар енді қымбат аппараттық немесе бағдарламалық құрал лицензияларынсыз студия деңгейіне жақын бейне өндірісіне қол жеткізе алады.
Инновациялық катализатор: MoE негізіндегі генеративті бейне үлгісін ашық көзбен пайдалану жаңа архитектуралар мен көркем құралдарды тудыру ықтималдығымен зерттеу ынтымақтастығын жылдамдатады.
Басталу
CometAPI – OpenAI GPT сериялары, Google Gemini, Anthropic's Claude, Midjourney, Suno және т.б. сияқты жетекші провайдерлердің 500-ден астам AI үлгілерін бір, әзірлеушілерге ыңғайлы интерфейске біріктіретін бірыңғай API платформасы. Тұрақты аутентификацияны, сұрауды пішімдеуді және жауаптарды өңдеуді ұсына отырып, CometAPI қолданбаларыңызға AI мүмкіндіктерін біріктіруді айтарлықтай жеңілдетеді. Чат-боттарды, кескін генераторларын, музыкалық композиторларды немесе деректерге негізделген аналитикалық құбырларды құрастырып жатсаңыз да, CometAPI сізге AI экожүйесіндегі соңғы жетістіктерге қол жеткізе отырып, жылдамырақ қайталауға, шығындарды басқаруға және жеткізуші-агностикалық күйде қалуға мүмкіндік береді.
Ең соңғы Wan 2.2 интеграциясы жақында CometAPI-де пайда болады, сондықтан хабардар болыңыз! Gemini 2.5 Flash-Lite үлгісін жүктеп салуды аяқтағанша, Үлгілер бетіндегі басқа үлгілерімізді зерттеңіз немесе AI Playground қолданбасында қолданып көріңіз.
Күту кезінде әзірлеушілер қол жеткізе алады Veo 3 API және Midjourney Video API арқылы CometAPI wan 2.2 орнына бейне жасау үшін тізімде көрсетілген соңғы Клауд үлгілерінің нұсқасы мақаланың жарияланған күнінде берілген. Бастау үшін үлгінің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз. CometAPI біріктіруге көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсыныңыз.
Қорытындылай келе, Alibaba компаниясының Wan 2.2 нұсқасы AI бейнедегі соңғы деңгейді ілгерілетіп қана қоймайды, сонымен қатар ашық коды бар экожүйелердің прогресті қалай жылдамдататынын және пайдалану жағдайларын әртараптандыратынын көрсетеді. Әзірлеушілер оның MoE негізі және кинематографиялық басқару элементтерімен тәжірибе жасай бастағанда, AI-генерацияланған бейне мазмұнының келесі толқыны Alibaba мүмкіндіктерін кеңейтуге көмектескен қауымдастықтардан пайда болуы мүмкін.
