Q

Wan2.6

Секундына:$0.08
Мәтін мен суреттерден бейнелер жасаңыз. Референспен бірізділікті сақтай отырып, суреттерді жасаңыз және өңдеңіз.
Жаңа
Коммерциялық пайдалану

Wan 2.6 техникалық сипаттамалары

ПараметрWan 2.6 бейне жинағы
ПровайдерAlibaba / Tongyi Lab
Модельдер отбасыWan 2.6
Шығарылым мерзімі2025 жылғы желтоқсан айындағы генерация
Енгізу түрлеріМәтін, кескіндер, референс бейнелер, аудио енгізулер
Шығыс түріҚосымша синхрондалған аудиомен бейне
Негізгі режимдерМәтіннен бейнеге (T2V), кескіннен бейнеге (I2V), референстен бейнеге (R2V)
Flash нұсқаларыI2V Flash, R2V Flash
Ажыратымдылық қолдауы720P және 1080P
Ұзақтығы бойынша қолдау2–15 секунд (жұмыс ағынына байланысты)
Аудио мүмкіндіктеріТүпнұсқа аудио генерациясы, дауыс референстері, ерін синхрондау
Көп кадрлы қолдауБір жұмыс ағынында 2–8 көрініс сегменті
Референс қолдауы5 референске дейін (жұмыс ағына байланысты аралас кескін/бейне)
API жұмыс ағыныАсинхронды тапсырма құру + поллинг

Wan 2.6 деген не?

Wan 2.6 — Alibaba-ның мультимодалды бейне генерациялау жүйесі, ол басқарылатын қысқа форматтағы өндіріске шоғырланған. Тек промптқа негізделген тәсілден гөрі, бұл модель жасаушылардың жұмыс ағындары үшін мәтіндік промпттарды, кескін референстерін, референс бейнелерді, аудио бойынша шарттауды және көріністерді тізбектеуді біріктіреді. Алдыңғы Wan нұсқаларымен салыстырғанда негізгі жаңарту — референске негізделген тұтастықтың күшеюі және ұзағырақ баяндауды генерациялау.

Wan 2.6 негізгі мүмкіндіктері

  • Референстен бейнеге жұмыс ағындары: Пайдаланушылар әр генерацияда кейіпкердің болмысын, стильін және дауыстың сабақтастығын сақтау үшін кескін немесе бейне референстерін бере алады.
  • Көп кадрлы нарратив генерациясы: Бір генерациялау ағынында көріністер арасындағы ауысулар мен оқиға дамуын қамтамасыз ету үшін бірнеше промптты тізбектеуді қолдайды.
  • Түпнұсқа аудио синхронизациясы: Генерацияланған аудио, қолданушы жүктеген жеке аудио және ерін синхрондау жұмыс ағындары үшін кіріктірілген қолдау.
  • Икемді енгізу режимдері: Тек промпт арқылы генерациялауды, алғашқы кадрдан анимациялауды және референс-бағытталған жұмыс ағындарын қолдайды.
  • Итерацияға арналған Flash нұсқалары: Жылдам нұсқалар соңғы жоғары сапалы рендерлерге дейін жедел тестілеуге мүмкіндік береді.
  • Ұзағырақ клиптер: Бұрынғы генерациялармен салыстырғанда клип ұзақтығы ұлғайтылған, бұл нарративтік контент жасауды қолдайды.

Wan 2.6 бенчмарк өнімділігі

Wan 2.6 үшін ресми бенчмарк ашықтығы шектеулі күйінде қалып отыр; Alibaba мәтіндік LLM провайдерлеріне қарағанда стандартталған бенчмарк көрсеткіштерін азырақ жариялады. Бағалаудың көбі ашық лидербордтардан гөрі жұмыс ағындарын тестілеу мен экожүйелік салыстырулардан алынады. Қауымдастық тестілері тұрақты түрде мыналарды атап көрсетеді:

  • Ескі Wan нұсқаларымен салыстырғанда кейіпкер тұтастығының жақсаруы.
  • Аудио-бейне синхрондаудың жақсаруы.
  • Көп кадрлы сабақтастықтың күшеюі.
  • Референс бойынша шарттаудың сенімдірек болуы.

Бенчмарк жарияланымдары сирек болғандықтан, өндірістік тестілеу енгізуге дейін маңызды болып қала береді.

Wan 2.6 және басқа бейне модельдері

МүмкіндікWan 2.6Wan 2.7Veo-family models
Түпнұсқа аудио генерациясыКүштіКүштірекКүшті
Көп кадрлы жұмыс ағыныИәЖақсартылғанОрташа
Референстен бейнегеКүшті басымдықКүштірек басқару мүмкіндіктеріОрташа
Клип ұзақтығы15s дейінҰқсас / жұмыс ағынына байланыстыӘр түрлі
Көп референсті қолдау5 референске дейінКеңейтілген жұмыс ағындарыОрташа
Өңдеу жұмыс ағындарыОрташаӨңдеуді жақсырақ қолдауКүшті

Wan 2.6 шектеулері

  • Қысқа клип ұзақтығы әлі де ұзақ форматтағы өндірісті шектейді.
  • Қозғалысы жоғары көріністерде уақытша тұрақсыздық байқалуы мүмкін.
  • Референсқа тәуелді жұмыс ағындары баптау күрделілігін арттырады.
  • Қоғамдық бенчмарк есептері шектеулі күйінде қалып отыр.
  • Асинхронды генерациялау конвейерлері интеграция күрделілігін арттырады.

Өкілдік қолдану сценарийлері

  1. Кейіпкер тұрақтылығы сақталған маркетингтік бейнелер.
  2. Көп көріністі әлеуметтік желі клиптері.
  3. Автор аватарын анимациялау.
  4. Референске негізделген өнім бейнелері.
  5. Синхрондалған аудиомен AI арқылы әңгімелеу.
  6. Тұлғалық сәйкестікті сақтауды қажет ететін бренд контенті.

ЖҚС