Wan 2.1 API

CometAPI
AnnaMar 20, 2025
Wan 2.1 API

Wan 2.1 API ایک اعلی درجے کی AI سے چلنے والا ویڈیو جنریشن انٹرفیس ہے جو جدید ترین ڈیپ لرننگ ماڈلز کا استعمال کرتے ہوئے ٹیکسٹ یا امیج ان پٹ کو اعلیٰ معیار کی، حقیقت پسندانہ ویڈیوز میں تبدیل کرتا ہے۔

Wan 2.1 API

بنیادی معلومات: وان 2.1 کیا ہے؟

وان 2.1 ایک AI ماڈل ہے جسے علی بابا کلاؤڈ نے تیار کیا ہے، جسے متنی یا تصویر پر مبنی ان پٹ سے اعلیٰ معیار کا ویڈیو مواد تیار کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ متحرک اور بصری طور پر مربوط ویڈیو کلپس کو سنتھیسائز کرنے کے لیے ڈفیوژن ٹرانسفارمرز اور 3D ویریشنل آٹو اینکوڈرز (VAEs) سمیت اعلی درجے کے گہرے سیکھنے کے فریم ورک کا فائدہ اٹھاتا ہے۔ اوپن سورس حل کے طور پر، وان 2.1 ڈیولپرز، محققین، اور مواد تخلیق کاروں کی ایک وسیع رینج کے لیے قابل رسائی ہے، جو AI سے چلنے والی ویڈیو جنریشن کی صلاحیتوں کو نمایاں طور پر آگے بڑھا رہا ہے۔

وان 2.1 کی کارکردگی میٹرکس

Wan 2.1 نے AI سے تیار کردہ ویڈیو کوالٹی میں غیر معمولی کارکردگی کا مظاہرہ کیا ہے، موجودہ اوپن سورس ماڈلز کو مستقل طور پر پیچھے چھوڑتے ہوئے اور کمرشل کلوز سورس سلوشنز کا مقابلہ کیا ہے۔ ماڈل VBench پر بہت زیادہ درجہ رکھتا ہے، ایک بینچ مارک جو ویڈیو جنریٹیو ماڈلز کا جائزہ لینے کے لیے استعمال ہوتا ہے، خاص طور پر پیچیدہ موشن جنریشن اور ملٹی آبجیکٹ کے تعامل میں بہترین۔ پہلے کی تکرار کے مقابلے میں، وان 2.1 بہترین وقتی مستقل مزاجی، بہتر ریزولیوشن، اور کم نمونے پیش کرتا ہے، جو دیکھنے کے بغیر کسی رکاوٹ کے تجربے کو یقینی بناتا ہے۔

تکنیکی تفصیلات

تعمیراتی اختراعات

ماڈل ایک جدید فریم ورک پر بنایا گیا ہے جس میں شامل ہیں:

  • تھری ڈی ویریشنل آٹو اینکوڈر (VAE): spatiotemporal کمپریشن کو بڑھاتا ہے اور ویڈیو کے اعلی معیار کو برقرار رکھتے ہوئے میموری کے استعمال کو کم کرتا ہے۔
  • بازی ٹرانسفارمر (DiT): ایک مکمل توجہ کا طریقہ کار نافذ کرتا ہے جو ویڈیو جنریشن میں طویل مدتی spatiotemporal مستقل مزاجی کو قابل بناتا ہے۔
  • ملٹی اسٹیج ٹریننگ کا عمل: تربیت کی کارکردگی اور کمپیوٹیشنل وسائل کی تخصیص کو بہتر بنانے کے لیے دھیرے دھیرے ریزولوشن اور ویڈیو کا دورانیہ بڑھاتا ہے۔

ماڈل کی مختلف حالتیں

صارف کی مختلف ضروریات کو پورا کرنے کے لیے، یہ متعدد کنفیگریشنز میں دستیاب ہے:

  • Wan 2.1-T2V-14B: ایک 14-بلین پیرامیٹر ٹیکسٹ ٹو ویڈیو ماڈل اعلی معیار، حقیقت پسندانہ ویڈیو ترکیب کے لیے موزوں ہے۔
  • Wan 2.1-T2V-1.3B: ایک زیادہ قابل رسائی 1.3-بلین پیرامیٹر ماڈل جس کے لیے صرف 8.19 GB VRAM کی ضرورت ہوتی ہے، جس سے صارفین کے درجے کے GPUs کو تقریباً 5 منٹ میں 480 سیکنڈ کی 4p ویڈیوز تیار کرنے کی اجازت ملتی ہے۔
  • Wan 2.1-I2V-14B-480P اور 720P: مختلف ریزولوشنز کو سپورٹ کرنے والے امیج ٹو ویڈیو ماڈلز، جامد تصاویر کو متحرک ویڈیو مواد میں تبدیل کرنے کے لیے ڈیزائن کیا گیا ہے۔

ڈیٹا سیٹ اور پری پروسیسنگ کی تربیت

وان 2.1 کے لیے استعمال ہونے والے ڈیٹاسیٹ میں بڑے پیمانے پر، اعلیٰ معیار کے ویڈیو سیکوینسز شامل ہیں جو ایک کثیر مرحلہ ڈیٹا کی صفائی اور بڑھانے کے عمل کو استعمال کرتے ہوئے احتیاط سے تیار کیے گئے ہیں۔ یہ بصری اور حرکت کی مخلصی کو بڑھاتے ہوئے کم معیار کے ڈیٹا کے خاتمے کو یقینی بناتا ہے۔ پہلے سے تربیت کے عمل کو چار مراحل میں تقسیم کیا گیا ہے، جس سے ماڈل کی مختلف ریزولوشنز اور حرکت کی پیچیدگیوں کو سنبھالنے کی صلاحیت کو آہستہ آہستہ بہتر کیا جاتا ہے۔

وان کا ارتقاء 2.1

وان 2.1 پہلے کے AI سے چلنے والے ویڈیو جنریشن ماڈلز کا براہ راست ارتقاء ہے، جو پچھلے تکرار کے مقابلے میں خاطر خواہ بہتری کو یکجا کرتا ہے۔ روایتی جنریٹو ایڈورسریل نیٹ ورکس (GANs) سے بازی پر مبنی فن تعمیرات کی منتقلی نے تخلیق شدہ ویڈیوز کی حقیقت پسندی اور ہم آہنگی کو نمایاں طور پر بڑھایا ہے۔ مزید برآں، ٹرانسفارمر پر مبنی توجہ کے طریقہ کار کو اپنانے نے زیادہ نفیس spatiotemporal ماڈلنگ کو فعال کیا ہے، جس کی وجہ سے متعدد تشخیصی میٹرکس میں کارکردگی بہتر ہوتی ہے۔

وان 2.1 کے فوائد

اسٹیٹ آف دی آرٹ ویڈیو جنریشن

Wan 2.1 پیچیدہ حرکت اور قدرتی نظر آنے والی اشیاء کے ساتھ حقیقت پسندانہ ویڈیوز بنانے میں موجودہ اوپن سورس ماڈلز کو پیچھے چھوڑ دیتا ہے۔

اعلی کمپیوٹیشنل کارکردگی

آپٹمائزڈ فن تعمیر GPU کے موثر استعمال کو یقینی بناتا ہے، یہاں تک کہ صارف کے درجے کے ہارڈ ویئر کو بھی اعلیٰ معیار کا ویڈیو مواد تیار کرنے کی اجازت دیتا ہے۔

ورسٹائل ایپلی کیشن پوٹینشل

ٹیکسٹ ٹو ویڈیو (T2V) اور امیج ٹو ویڈیو (I2V) جنریشن کو سپورٹ کرتا ہے، جو اسے میڈیا، مارکیٹنگ، تعلیم اور گیمنگ سمیت مختلف صنعتوں کے لیے انتہائی قابل موافق بناتا ہے۔

اوپن سورس کی رسائی

Wan 2.1 Apache 2.0 لائسنس کے تحت دستیاب ہے، جدت کو فروغ دیتا ہے اور AI محققین اور ڈویلپرز کے درمیان وسیع تر اپنانے کے قابل بناتا ہے۔

تکنیکی اشارے

بینچ مارک کارکردگی

  • وی بینچ رینکنگ: ملٹی آبجیکٹ کے تعامل اور حرکت کی پیچیدگی کے زمروں میں مسلسل ٹاپ اسکور حاصل کرتا ہے۔
  • انفرنس سپیڈ: چھوٹا ماڈل ویرینٹ (1.3B) RTX 5 پر 480 منٹ میں 4 سیکنڈ کی 4090p ویڈیو بناتا ہے بغیر کوانٹائزیشن جیسی اصلاح کی تکنیک کی ضرورت کے۔
  • میموری کا استعمال: موثر پروسیسنگ کے لیے صرف 8.19 GB VRAM کی ضرورت ہے، جس سے اسے صارفین کی ایک وسیع رینج کے لیے قابل رسائی بنایا جا سکتا ہے۔

درخواست کے منظر نامہ

تشہیر اور مارکیٹنگ کی برانڈز کو اعلیٰ معیار کی پروموشنل ویڈیوز تیزی سے بنانے کے قابل بناتا ہے، پیداواری لاگت اور ٹائم لائنز کو کم کرتا ہے۔

تعلیم اور تربیت متحرک تدریسی مواد کی ترقی، مشغولیت اور سیکھنے کے تجربات کو بڑھانے میں سہولت فراہم کرتا ہے۔

تفریح ​​اور مواد کی تخلیق AI کی مدد سے ویڈیو پروڈکشن ٹولز کے ساتھ فلم سازوں، اینیمیٹروں اور مواد کے تخلیق کاروں کو بااختیار بناتا ہے۔

ورچوئل رئیلٹی (VR) اور Augmented Reality (AR) AI سے تیار کردہ ویڈیو اثاثوں کے ذریعے عمیق ڈیجیٹل تجربات کی تخلیق کی حمایت کرتا ہے۔

متعلقہ موضوعات:3 کے بہترین 2025 AI میوزک جنریشن ماڈل

نتیجہ

وان 2.1 AI سے چلنے والی ویڈیو جنریشن میں ایک اہم پیشرفت کی نمائندگی کرتا ہے، معیار، کارکردگی اور رسائی کے لیے نئے معیارات مرتب کرتا ہے۔ اس کا جدید ترین مشین لرننگ فن تعمیر، اعلیٰ کمپیوٹیشنل کارکردگی، اور اوپن سورس کی دستیابی اسے مختلف صنعتوں میں ایک قیمتی ٹول بناتی ہے۔ جیسا کہ AI تخلیقی صلاحیتوں اور آٹومیشن کی حدود کو آگے بڑھا رہا ہے، یہ ڈیجیٹل مواد کی تخلیق کو نئی شکل دینے میں تخلیقی ماڈلز کی صلاحیت کی مثال دیتا ہے۔

CometAPI سے وان 2.1 API کو کیسے کال کریں۔

1.لاگ ان کریں کرنے کے لئے cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔

2.رسائی کی سند API کلید حاصل کریں۔ انٹرفیس کے. ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔

  1. اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/

  2. API کی درخواست بھیجنے کے لیے Wan 2.1 اینڈ پوائنٹ کو منتخب کریں اور درخواست کا باڈی سیٹ کریں۔ درخواست کا طریقہ اور درخواست باڈی سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ API دستاویز. ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔

  3. تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔ API کی درخواست بھیجنے کے بعد، آپ کو ایک JSON آبجیکٹ موصول ہوگا جس میں تیار کردہ تکمیل ہوگی۔

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ