علی بابا کلاؤڈ نے Qwen-VLo ملٹی موڈل ماڈل جاری کیا، تصویری صلاحیت اپ گریڈ

CometAPI
AnnaJun 29, 2025
علی بابا کلاؤڈ نے Qwen-VLo ملٹی موڈل ماڈل جاری کیا، تصویری صلاحیت اپ گریڈ

علی بابا کلاؤڈ کے AI ڈویژن نے باضابطہ طور پر آغاز کر دیا ہے۔ Qwen-VLo، اس کی Qwen ملٹی موڈل ماڈل سیریز میں تازہ ترین تکرار، متحد وژن اور زبان کی صلاحیتوں میں ایک اہم پیشرفت کی نشاندہی کرتی ہے۔ 28 جون 2025 کو اعلان کیا گیا، Qwen‑VLo فہم اور جنریشن دونوں کی خصوصیات پیش کرتا ہے، جس میں اپنے پیشروؤں سے آگے بڑھ کر قدرتی زبان کے اشارے اور بصری ان پٹ کے ذریعے اعلی ریزولیوشن امیج کی تخلیق اور ترمیم شامل ہے۔

Qwen‑VL اور Qwen2.5‑VL جیسی پرانی ریلیزز کی بنیاد پر، Qwen‑VLo اس چیز کی نمائندگی کرتا ہے جسے Alibaba ملٹی موڈل AI میں "جامع اپ گریڈ" کے طور پر بیان کرتا ہے۔ جبکہ Qwen‑VL نے بنیادی طور پر بصری معلومات کی ترجمانی پر توجہ مرکوز کی، اور Qwen2.5‑VL نے طویل سیاق و سباق کی سمجھ میں اضافہ کیا، Qwen‑VLo ان طاقتوں کو ایک فریم ورک میں ضم کرتا ہے جو دو طرفہ نقطہ نظر کی زبان کے کاموں کے قابل ہے۔ یہ کھلی ہدایات کو ایڈجسٹ کرتا ہے، متعدد زبانوں کو سپورٹ کرتا ہے — بشمول چینی اور انگریزی — اور انسانی فنکاروں کا مقابلہ کرنے کے لیے اپنے آؤٹ پٹ کو بہتر بناتا ہے۔

اہم خصوصیات

پروگریسو امیج جنریشن

Qwen‑VLo تصاویر کو مرحلہ وار انداز میں بناتا ہے—بائیں سے دائیں اور اوپر سے نیچے — تسلسل اور بصری ہم آہنگی کو یقینی بنانے کے لیے پیشین گوئی شدہ مواد کو بار بار بہتر کرتا ہے۔ یہ طریقہ کار تخلیقی عمل پر نسل کی کارکردگی اور صارف کے کنٹرول دونوں کو بڑھاتا ہے۔

متحرک ریزولوشن سپورٹ

متحرک ریزولوشن ٹریننگ کا استعمال کرتے ہوئے، ماڈل صوابدیدی ان پٹ/آؤٹ پٹ ریزولوشنز اور پہلو تناسب کو سنبھال سکتا ہے۔ صارفین متنوع منظرناموں کے لیے تیار کردہ مواد تیار کر سکتے ہیں—جیسے کہ ویب بینرز، سوشل میڈیا کور، یا ہائی ریزولوشن پوسٹرز—بغیر فکسڈ فارمیٹس کی مجبوری کے۔

اوپن اینڈڈ انسٹرکشن ایڈیٹنگ

قدرتی زبان کے اشارے کے ذریعے، Qwen VLo جدید ترامیم انجام دے سکتا ہے جیسے کہ طرز کی منتقلی ("وان گو سٹائل کا اطلاق کریں")، جامع تبدیلیاں ("دھوپ کا آسمان شامل کریں")، اور ایک ہی ہدایات میں کثیر جہتی ترمیمات۔ یہ روایتی بصری سگنلز کو نکالنے اور ان میں ترمیم کرنے میں بھی مدد کرتا ہے جیسے گہرائی کے نقشے، سیگمنٹیشن ماسک، اور کنارے کی خاکہ۔

کثیر لسانی تعامل

یہ ماڈل متعدد زبانوں میں کمانڈز کو قبول کرتا ہے — فی الحال چینی اور انگریزی کو سپورٹ کر رہا ہے — اس طرح عالمی صارف کی بنیاد کو پورا کرتا ہے اور تخلیقی کام کے بہاؤ میں لسانی رکاوٹوں کو ختم کرتا ہے۔

دستیابی اور رسائی

Qwen‑VLo فی الحال دستیاب ہے۔ پیش منظر کیوین چیٹ پلیٹ فارم کے ذریعے chat.qwen.ai. علی بابا کلاؤڈ نے نوٹ کیا ہے کہ، ایک پیش نظارہ ریلیز کے طور پر، صارفین کو نسل کے دوران کبھی کبھار تضادات یا حقائق کی غلطیاں کا سامنا کرنا پڑ سکتا ہے۔ ترقیاتی ٹیم وسیع تر رول آؤٹ سے پہلے ان حدود کو دور کرنے کے لیے فعال طور پر اعادہ کر رہی ہے۔

ہڈ کے نیچے، علی بابا کے AI انجینئرز نے Qwen-VLo کو کلاؤڈ اور ایج دونوں ماحول میں تعینات کرنے کے لیے بہتر بنایا ہے۔ مخلوط درستگی کوانٹائزیشن اور نوول پیرامیٹر کی موثر فائن ٹیوننگ تکنیک کا فائدہ اٹھاتے ہوئے، ماڈل کمپیکٹ کمپیوٹ فوٹ پرنٹ پر اعلی کارکردگی کو برقرار رکھتا ہے۔ علی بابا نے تاخیر اور معیار کو متوازن کرنے کے لیے انڈیپٹیو انفرنس پائپ لائنز کو بھی مربوط کیا ہے، اس بات کو یقینی بناتے ہوئے کہ Qwen‑VLo تاخیر سے متعلق حساس ایپلیکیشنز — جیسے کہ انٹرایکٹو ڈیزائن ٹولز — فراہم کر سکتا ہے جب کہ علی بابا کلاؤڈ پر انٹرپرائز گریڈ کے کام کے بوجھ کو سکیل کیا جا رہا ہے۔

کا موازنہ Qwen-VL-Plus/Max

فنکشن کا طول و عرضQwen-VL-Plus/Maxکیوین وی ایل او
تصویری تفہیمبنیادی درجہ بندی، تفصیلکثیر جہتی ساخت کی پہچان، بہتر سیاق و سباق کی سمجھ
تصویری جنریشنمحدود انداز کی حمایتاعلی صحت سے متعلق، ترقی پسند نسل، مضبوط سٹائل کنٹرول کی صلاحیتیں
ملٹی ٹاسکنگ کی صلاحیتکام کے لیے مخصوص ان پٹ کی ضرورت ہے۔متحد ملٹی ٹاسکنگ، پیچیدہ زبان کی ہدایات کی حمایت کرتا ہے۔
کثیر لسانی تعاملمحدود حمایتچینی اور انگریزی کے لیے مقامی حمایت، ہموار قدرتی زبان کنٹرول
تفصیل کے تحفظ کی اہلیتنسل میں ممکنہ تفصیل کا نقصانکلیدی ڈھانچے اور سیمنٹکس کی درست شناخت اور تعمیر نو

شروع

CometAPI ایک متحد API پلیٹ فارم ہے جو سرکردہ فراہم کنندگان سے 500 سے زیادہ AI ماڈلز کو اکٹھا کرتا ہے — جیسے OpenAI کی GPT سیریز، Google کی Gemini، Anthropic's Claude، Midjourney، Suno، اور مزید — ایک واحد، ڈویلپر کے موافق انٹرفیس میں۔ مسلسل تصدیق، درخواست کی فارمیٹنگ، اور رسپانس ہینڈلنگ کی پیشکش کرکے، CometAPI ڈرامائی طور پر آپ کی ایپلی کیشنز میں AI صلاحیتوں کے انضمام کو آسان بناتا ہے۔ چاہے آپ چیٹ بوٹس، امیج جنریٹرز، میوزک کمپوزر، یا ڈیٹا سے چلنے والی اینالیٹکس پائپ لائنز بنا رہے ہوں، CometAPI آپ کو تیزی سے اعادہ کرنے، لاگت کو کنٹرول کرنے، اور وینڈر-ایگنوسٹک رہنے دیتا ہے—یہ سب کچھ AI ماحولیاتی نظام میں تازہ ترین کامیابیوں کو حاصل کرنے کے دوران۔

شروع کرنے کے لیے، میں ماڈلز کی صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ کریں API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔

تازہ ترین انٹیگریشن Qwen‑VLo API جلد ہی CometAPI پر ظاہر ہو گا، اس لیے دیکھتے رہیں!جب تک ہم Qwen‑VLo ماڈل اپ لوڈ کو حتمی شکل دے رہے ہیں، ہمارے دوسرے ماڈلز کو دیکھیں ماڈلز کا صفحہ یا میں ان کی کوشش کریں AI کھیل کا میدان. CometAPI میں Qwen کا تازہ ترین ماڈل ہے۔ Qwen 3 API(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b) and qwen-vl-plus-latest.

علی بابا کلاؤڈ نے Qwen-VLo ملٹی موڈل ماڈل جاری کیا، تصویری صلاحیت اپ گریڈ

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ