Wan 2.7 техникалық сипаттамалары
| Тармақ | Wan 2.7 (Video Suite) |
|---|---|
| Провайдер | Alibaba Tongyi Lab |
| Модель отбасы | Wan 2.7 Video Suite |
| Архитектура | 27B параметрлі Сарапшылар қоспасы (MoE) |
| Енгізу түрлері | Мәтін, суреттер, бейнелер, аудио референстер |
| Шығыс түрлері | Қалауыңызша аудиосы бар жасалған/өңделген бейне клиптер |
| Қолдау көрсетілетін режимдер | Мәтіннен бейнеге (T2V), Суреттен бейнеге (I2V), Референстен бейнеге (R2V), Бейне өңдеу |
| Ажыратымдылық | 720P және 1080P шығару |
| Бейненің ұзақтығы | 2–15 секунд |
| Аудио қолдауы | Нативті аудио генерациясы, дауыс референстері, ерін қимылымен синхрондау ағындары |
| Референс мүмкіндігі | Көп референсті суреттер/бейне, сәйкестікті сақтау |
| Кейіпкер тұрақтылығы | Жұмыс ағынына қарай бірнеше референс субъектісін қолдайды |
| Шығарылым буыны | Wan 2.6-ның негізгі мұрагері |
Wan 2.7 деген не?
Wan 2.7 — қарапайым промпттан бейнеге жасауға қарағанда, басқарылатын ІИ киноөндіріс жұмыс ағындарына арналған Alibaba-ның флагмандық мультимодальды бейне генерация жиынтығы. Модель отбасы генерацияны, өңдеуді, жалғастыруды және референске негізделген тұрақтылықты бір жүйеде біріктіріп, авторларға тақырыпты жақсырақ сақтау және көріністі басқару арқылы қысқа кинематографиялық роликтер құруға мүмкіндік береді.
Алдыңғы бейне генераторлар көбіне промпт сапасына назар аударса, Wan 2.7 кадрларды бекіту, референс енгізулері, аудио синхрондау және құрылымдалған көп-кадрлы жұмыс ағындары арқылы басқарылушылықты алдыңғы орынға қояды.
Wan 2.7 негізгі мүмкіндіктері
- Thinking Mode жоспарлау конвейері: Модель рендерингтен бұрын көрініс композициясын және қозғалысты жоспарлап, промптқа сәйкестікті жақсартады және үйлесімсіздік ақауларын азайтады.
- Бірінші және соңғы кадрды басқару: Пайдаланушылар кіріспе және соңғы кадрларды анықтай алады, жүйе олардың арасындағы қозғалысты интерполяциялайды.
- Референске негізделген сәйкестікті сақтау: Бірнеше кадр бойы кейіпкердің келбетін, киімін, объектілерді және стильді сақтайды.
- Нативті мультимодальды жұмыс ағындары: Бір жұмыс ағынында мәтін, сурет, аудио және бейне референстерін қолдайды.
- Интеграцияланған аудио генерациясы: Визуалмен қатар фондық музыка, қоршаған ортаның дыбыстары және дауыс синхронизациясын жасауға болады.
- Өңдеу және жалғастыруды қолдау: Бар бейнелерді жаңадан бастамай-ақ ұзарту, түрлендіру немесе қайта стильдеу мүмкін.
Wan 2.7-нің бенчмарк өнімділігі
Мәтіндік LLM-дермен салыстырғанда, Wan 2.7 бойынша жария бенчмарк деректері әлі шектеулі, бірақ үшінші тарап бағалаулары мен қауымдастық сынақтары Wan 2.6-пен салыстырғанда қозғалыс тұрақтылығы, промптқа сәйкестік және басқарылушылық бойынша айтарлықтай жақсартуларды көрсетеді.
Экожүйеде байқалған жайттар мыналарды қамтиды:
- Алдыңғы Wan нұсқаларымен салыстырғанда қозғалыс бірізділігінің күшеюі.
- Үшінші тараптың мәтіннен бейнеге бағалауларында жоғарырақ нәтижелер.
- Көп субъектілі консистенттілік пен референсті сақтау жақсарған.
- Бұрынғы ашық бейне модельдеріне қарағанда аудиомен интеграциясы жақсырақ.
Ресми бенчмарк ашықтығы әлі де шектеулі болғандықтан, өнімділік туралы мәлімдемелерге сақтықпен қарау қажет.
Wan 2.7 басқа бейне модельдерімен салыстыру
| Ерекшелік | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Нативті аудио ағындары | Күшті | Күшті | Орташа |
| Референске негізделген тұрақтылық | Күшті | Орташа | Орташа |
| Бірінші + соңғы кадрды басқару | Иә | Ішінара | Шектеулі |
| Бейне өңдеу ағындары | Иә | Иә | Шектеулі |
| Ең жоғары ортақ ажыратымдылық | 1080P | Жоғары деңгейдегі кинематографиялық шығару | 1080P |
| Көп референсті қолдау | Айқын басымдық | Орташа | Орташа |
Wan 2.7 шектеулері
- Ұзақметражды өндіріс құралдарымен салыстырғанда қысқа клип ұзақтығы.
- 1080P максималды шығысы өте жоғары ажыратымдылықтағы ағындарды шектейді.
- Жылдам қозғалысты көріністерде тұрақсыздық артефактылары болуы мүмкін.
- Көп референсті ағындар күрделілікті және промпт инженериясы талаптарын арттырады.
- Жария бенчмарк есептері салыстырмалы түрде сирек.
Өкілдік қолдану жағдайлары
- Кейіпкер тұрақтылығы сақталған қысқаметражды фильмдер және сторибордтар.
- Аудио синхрондауымен маркетингтік роликтер.
- Әлеуметтік желілерге бейне генерациясы.
- Өнім визуализациясы және концепт-трейлерлер.
- Бейнені жалғастыру және көріністі интерполяциялау ағындары.
- Референске негізделген аватар және кейіпкер анимациясы.
CometAPI-де WAN 2.7 Video API-ін қалай пайдалану керек
1-қадам: Kie Al Playground-та WAN 2.7 Video API-ін сынап көріңіз
Алдымен CometAPI Playground-та WAN 2.7 Video API-ін пайдаланып WAN 2.7 функционалдығын сынаңыз. Суреттерді жүктеңіз, промпттар қосыңыз немесе референстерді қолданыңыз да, өндірістік жұмыс ағынына енгізбестен бұрын жасалған WAN бейнесін алдын ала қарап шығыңыз.
2-қадам: WAN 2.7 API кілтін алыңыз және API құжаттамасымен танысыңыз
CometAPI консолінен WAN 2.7 API кілтін алыңыз және құжаттаманы қараңыз. Мәтіннен бейнеге, суреттен бейнеге және WAN бейне ағындарын қолдау үшін WAN 2.7 Video API эндпойнттарын, аутентификациясын және параметрлерін түсініңіз.
3-қадам: WAN 2.7 AI бейнелерін генерациялап, оларды жұмыс ағыныңызға интеграциялаңыз
Промпттар, суреттер немесе референстерді пайдалана отырып, WAN 2.7 Video API арқылы WAN 2.7 AI бейнелерін жасаңыз. Масштабталатын бейне жасауды іске қосу үшін WAN 2.7 нәтижелерін өнімдік жұмыс ағындарына, контент құбырларына немесе AI бейне құралдарына интеграциялаңыз.