Wan 2.1 API

CometAPI
AnnaMar 20, 2025
Wan 2.1 API

Wan 2.1 API – терең оқытудың заманауи үлгілерін пайдалана отырып, мәтінді немесе кескінді енгізуді жоғары сапалы, шынайы бейнелерге түрлендіретін жетілдірілген AI негізіндегі бейне генерациялау интерфейсі.

Wan 2.1 API

Негізгі ақпарат: Wan 2.1 дегеніміз не?

Wan 2.1 — Alibaba Cloud әзірлеген, мәтіндік немесе кескінге негізделген кірістерден жоғары сапалы бейне мазмұнын жасауға арналған AI моделі. Ол динамикалық және визуалды когерентті бейнеклиптерді синтездеу үшін диффузиялық трансформаторларды және 3D вариациялық автокодерлерді (VAEs) қоса алғанда, тереңдетілген оқытудың кеңейтілген құрылымдарын пайдаланады. Ашық бастапқы шешім ретінде Wan 2.1 әзірлеушілердің, зерттеушілердің және мазмұнды жасаушылардың кең ауқымына қол жетімді, бұл AI басқаратын бейнелерді жасау мүмкіндіктерін айтарлықтай жақсартады.

Wan 2.1 өнімділік көрсеткіштері

Wan 2.1 AI арқылы жасалған бейне сапасында ерекше өнімділікті көрсетті, ол бар ашық бастапқы кодты үлгілерден үнемі асып түседі және коммерциялық жабық бастапқы шешімдермен бәсекелеседі. Модель VBench-те жоғары орын алады, бейне генеративті модельдерді бағалау үшін пайдаланылатын эталон, әсіресе күрделі қозғалыс генерациясында және көп нысанды өзара әрекеттесуде жақсы. Бұрынғы итерациялармен салыстырғанда, Wan 2.1 тамаша уақытша үйлесімділікті, жақсартылған ажыратымдылықты және азайтылған артефактілерді ұсынады, бұл үздіксіз көру тәжірибесін қамтамасыз етеді.

Техникалық Толығырақ

Архитектуралық инновациялар

Модель мыналарды қамтитын озық негізге салынған:

  • 3D вариациялық автокодер (VAE): Кеңістік-уақыттық қысуды жақсартады және жоғары бейне сапасын сақтай отырып, жадты пайдалануды азайтады.
  • Диффузиялық трансформатор (DiT): Бейне генерациясында ұзақ мерзімді кеңістік-уақыттық сәйкестікті қамтамасыз ететін толық назар аудару механизмін жүзеге асырады.
  • Көп сатылы оқыту процесі: Жаттығу тиімділігі мен есептеу ресурстарын бөлуді оңтайландыру үшін ажыратымдылық пен бейне ұзақтығын біртіндеп арттырады.

Модель нұсқалары

Әр түрлі пайдаланушы қажеттіліктерін қанағаттандыру үшін ол бірнеше конфигурацияда қол жетімді:

  • Wan 2.1-T2V-14B: Жоғары сапалы, шынайы бейне синтезі үшін оңтайландырылған 14 миллиард параметрлік мәтіннен бейнеге модель.
  • Wan 2.1-T2V-1.3B: Бар болғаны 1.3 ГБ VRAM қажет ететін, қолжетімді 8.19 миллиард параметрлі модель, тұтынушы деңгейіндегі графикалық процессорларға шамамен 5 минут ішінде 480 секундтық 4p бейнелерді жасауға мүмкіндік береді.
  • Wan 2.1-I2V-14B-480P & 720P: Статикалық кескіндерді динамикалық бейне мазмұнына түрлендіруге арналған әртүрлі ажыратымдылықты қолдайтын кескіннен бейнеге модельдер.

Тренинг деректер жинағы және алдын ала өңдеу

Wan 2.1 үшін пайдаланылатын деректер жинағы көп сатылы деректерді тазалау және кеңейту процесі арқылы мұқият өңделген ауқымды, жоғары сапалы бейне тізбектерін қамтиды. Бұл визуалды және қозғалыс дәлдігін арттыра отырып, сапасыз деректердің жойылуын қамтамасыз етеді. Алдын ала дайындық процесі төрт кезеңге бөлінеді, модельдің әртүрлі ажыратымдылықтар мен қозғалыс күрделіліктерін өңдеу қабілетін біртіндеп жетілдіреді.

Ван эволюциясы 2.1

Wan 2.1 - алдыңғы итерациялармен салыстырғанда айтарлықтай жақсартуларды біріктіретін, бұрынғы AI басқаратын бейне генерациялау үлгілерінің тікелей эволюциясы. Кәдімгі генеративті қарсылас желілерден (GAN) диффузиялық негізделген архитектураға көшу жасалған бейнелердің шынайылығы мен үйлесімділігін айтарлықтай арттырды. Сонымен қатар, трансформаторға негізделген назар аудару механизмдерін қабылдау күрделі кеңістіктік-уақыттық модельдеуге мүмкіндік берді, бұл бірнеше бағалау көрсеткіштері бойынша өнімділікті жақсартуға әкелді.

Wan 2.1 артықшылықтары

Соңғы үлгідегі бейнелерді жасау

Wan 2.1 күрделі қозғалысы мен табиғи көрінетін нысандары бар шынайы бейнелерді жасауда бар ашық бастапқы үлгілерден асып түседі.

Жоғары есептеу тиімділігі

Оңтайландырылған архитектура GPU тиімді пайдалануын қамтамасыз етеді, тіпті тұтынушы деңгейіндегі аппараттық құралдарға жоғары сапалы бейне мазмұнын жасауға мүмкіндік береді.

Қолданбаның жан-жақты әлеуеті

Мәтіннен бейнеге (T2V) және кескіннен бейнеге (I2V) генерациясын қолдайды, бұл оны әртүрлі салаларға, соның ішінде медиа, маркетинг, білім беру және ойын ойындарына жоғары бейімді етеді.

Ашық бастапқы қол жетімділік

Wan 2.1 Apache 2.0 лицензиясы бойынша қол жетімді, бұл инновацияны дамытады және AI зерттеушілері мен әзірлеушілері арасында кеңірек қабылдауға мүмкіндік береді.

Техникалық көрсеткіштері

Эталондық өнімділік

  • VBench рейтингі: Көп нысанды өзара әрекеттесу және қозғалыс күрделілігі санаттарында үнемі жоғары ұпайларға қол жеткізеді.
  • Қорытынды шығару жылдамдығы: Модельдің кішірек нұсқасы (1.3B) RTX 5 құрылғысында кванттау сияқты оңтайландыру әдістерін қажет етпестен 480 секундтық 4p бейнені 4090 минут ішінде жасайды.
  • Жадты пайдалану: Тиімді өңдеу үшін тек 8.19 ГБ VRAM қажет, бұл оны пайдаланушылардың кең ауқымына қолжетімді етеді.

Қолдану сценарийлері

Жарнама және маркетинг Брендтерге жоғары сапалы жарнамалық бейнелерді жылдам жасауға мүмкіндік береді, өндіріс шығындары мен уақыт кестелерін азайтады.

Білім және оқыту Динамикалық оқу мазмұнын дамытуға, белсенділік пен оқу тәжірибесін арттыруға ықпал етеді.

Ойын-сауық және мазмұнды жасау Кинорежиссерлерге, аниматорларға және контент жасаушыларға AI көмегімен бейне жасау құралдарымен мүмкіндік береді.

Виртуалды шындық (VR) және кеңейтілген шындық (AR) AI-генерацияланған бейне активтері арқылы иммерсивті цифрлық тәжірибелерді құруды қолдайды.

Қатысты тақырыптар:3 жылғы AI музыкасын жасаудың ең жақсы 2025 моделі

қорытынды

Wan 2.1 сапа, тиімділік және қол жетімділік үшін жаңа көрсеткіштерді белгілейтін AI-ге негізделген бейнелерді жасаудағы үлкен жетістік болып табылады. Оның заманауи машиналық оқыту архитектурасының, жоғары есептеу тиімділігінің және ашық көздің қолжетімділігінің үйлесімі оны әртүрлі салаларда құнды құралға айналдырады. Жасанды интеллект креативтілік пен автоматтандырудың шекараларын ілгерілетуді жалғастыра отырып, ол цифрлық мазмұнды құруды қайта құрудағы генеративті модельдердің әлеуетін көрсетеді.

Wan 2.1 API жүйесін CometAPI-ден қалай шақыруға болады

1.Кіру дейін cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз

2.Кіру тіркелгі деректерінің API кілтін алыңыз интерфейсінің. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.

  1. Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/

  2. API сұрауын жіберу және сұрау мәтінін орнату үшін Wan 2.1 соңғы нүктесін таңдаңыз. Сұрау әдісі мен сұрау органы мына жерден алынады веб-сайтымыздың API құжаты. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox тестін ұсынады.

  3. Жасалған жауапты алу үшін API жауабын өңдеңіз. API сұрауын жібергеннен кейін сіз жасалған аяқтауды қамтитын JSON нысанын аласыз.

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік