فیلڈ	قدر / نوٹس
ماڈل نام	Qwen3-VL-32B (Instruct / Thinking ویریئنٹس دستیاب ہیں).
ماڈل فیملی / آرکیٹیکچر	Qwen3-VL — ویژن-لینگوئج ٹرانسفارمر؛ ViT طرز کے ویژول اینکوڈر کے ساتھ ملٹی موڈل بیک بون + LLM فیوژن لیئرز۔
پیرامیٹرز کی تعداد	“32B” کلاس کہلاتا ہے (عوامی ذرائع ڈینس 32B ویریئنٹ کے لیے ~32–33B پیرامیٹر اسکیل فہرست کرتے ہیں).
ویریئنٹس	ڈینس: 2B / 4B / 8B / 32B; MoE: 30B-A3B, 235B-A22B (مزید بڑے MoE ویریئنٹس بھی جاری کیے گئے ہیں).
نیٹو کانٹیکسٹ لینتھ	256K ٹوکنز (نیٹو انٹرلیوڈ ملٹی موڈل کانٹیکسٹ)، انجینیئرڈ ایکسٹینشن موڈز/ٹیکنیکس کے ساتھ جو کچھ ڈپلائمنٹس میں ~1M ٹوکنز تک کو ممکن بناتے ہیں۔
ان پٹ موڈیلٹیز	متن + تصاویر (ہائی ریزولوشن) + طویل ویڈیو (ٹیمپورل ماڈلنگ/ٹائم اسٹیمپس) + OCR (کثیر لسانی).
آؤٹ پٹ موڈیلٹیز	متن (قدرتی زبان)، اسٹرکچرد ایکسٹریکشن (OCR/ٹیبل/چارٹ ایکسٹریکشن)، ویڈیو کے لیے ٹائم اسٹیمپس/سیگمنٹ سمریز؛ ٹول یوز/ایجنٹ کالز کی سپورٹ۔

Qwen3-VL-32B کیا ہے

Qwen3-VL-32B Alibaba کے Qwen3 ویژن-لینگوئج ماڈل فیملی میں 32 بلین پیرامیٹر والا ڈینس ویریئنٹ ہے۔ یہ ایک ملٹی موڈل (ویژن + لینگوئج + ویڈیو) ٹرانسفارمر ہے جو یونیفائیڈ پرسیپشن، لانگ-کانٹیکسٹ ریزننگ، مضبوط OCR اور ویژول گراؤنڈنگ، اور ایجنٹک/ٹولیفائیڈ ورک فلو کے لیے ڈیزائن کیا گیا ہے۔

اہم خصوصیات

بڑا ملٹی موڈل کانٹیکسٹ — 256K انٹرلیوڈ ٹوکنز (متن + امیج ریفرنسز) کی نیٹو سپورٹ اور آرکیٹیکچرل ہکس/ٹوولنگ جن کے ذریعے کچھ ڈپلائمنٹس میں مؤثر کانٹیکسٹ ~1M ٹوکنز تک بڑھایا جا سکتا ہے؛ کراس-ڈاکیومنٹ اور کراس-میڈیا ریٹریول اور ریزننگ کو ممکن بناتی ہے۔
متحد ویژول + لینگوئج پری ٹریننگ — ابتدائی مراحل سے مشترکہ تربیت جو ویژول ان پٹس کے ساتھ زبان کی گراؤنڈنگ بہتر کرتی ہے، نتیجتاً مضبوط کراس-موڈل نمائندگیوں تک پہنچتی ہے (VQA، OCR، اور ڈایاگرام ریزننگ کے لیے مفید)۔
ویڈیو کی سمجھ بوجھ اور ٹیمپورل الائنمنٹ — نیٹو ویڈیو ہینڈلنگ کے ساتھ ٹائم اسٹیمپس والے ٹیکسٹ الائنمنٹ اور طویل ویڈیو اسٹریمز کو باریک وقتی گرانولیریٹی پر خلاصہ یا انڈیکس کرنے کی صلاحیت۔
کثیر لسانی OCR اور ڈاکیومنٹ پارسنگ — کئی زبانوں میں اعلیٰ معیار کا OCR اور مضبوط ڈاکیومنٹ/لے آؤٹ فہم، ٹیبل اور چارٹ ایکسٹریکشن کے استعمالات کے لیے موزوں۔
Instruct بمقابلہ Thinking ویریئنٹس — الگ بلڈز جو ہدایت کی تعمیل (Instruct) کے لیے موزوں بنائے گئے ہیں بمقابلہ گہرے اندرونی chain-of-thought/ریزننگ تھروپٹ (Thinking)، تاکہ ایپلیکیشن کی ضروریات (سیفٹی/اختصار بمقابلہ مرحلہ وار ریزننگ) پوری ہوں۔
اسکیلنگ کے لیے MoE آپشنز — انتہائی کپیسٹی/کوریج کے لیے MoE ویریئنٹس (30B-A3B, 235B-A22B) دستیاب ہیں جو ایکسپرٹ راؤٹنگ کے ذریعے انفرنس کمپیوٹ کو قابو میں رکھنے کی کوشش کے ساتھ ریپریزنٹیشنل کپیسٹی بڑھاتے ہیں۔

Qwen3-VL-32B کن حالات میں موزوں ہے

بڑے پیمانے پر ڈاکیومنٹ اور فارم ایکسٹریکشن — زبانوں میں مضبوط OCR، ٹیبل اور چارٹ ایکسٹریکشن، اور طویل رپورٹس کی سیمینٹک خلاصہ سازی۔
پیچیدہ تصاویر کے لیے ویژول سوال-جواب — میڈیکل/انجینئرنگ ڈایاگرامز، حاشیہ نویسی شدہ تصاویر، یا ویژول ٹربل شوٹنگ جنہیں بصری شواہد کو مرحلہ وار متنی ریزننگ کے ساتھ یکجا کرنے کی ضرورت ہو۔
طویل ویڈیو کی انڈیکسنگ اور سمریزیشن — قابلِ تلاش ٹرانسکرپٹس تیار کرنا، اور گھنٹوں پر مشتمل ریکارڈنگز یا نگرانی/ویڈیو آرکائوز کے لیے سیکنڈ-لیول انڈیکسنگ اور سمریز۔
ملٹی موڈل ایجنٹس/ٹول چینز — ایسے ٹول کالز کی آرکسٹریشن جو ویژول پیلوڈز نکالنے کی متقاضی ہوں (مثلاً OCR→search→action)، ان ایجنٹ فریم ورکس کے لیے موزوں جو ادراک اور عمل کو یکجا کرتے ہیں۔
STEM ویژول ریزننگ اور ٹیوٹورنگ ٹولز — ڈایاگراماتی ریاضی اور مرحلہ وار حل جو تصاویر/گراف اور متنی وضاحت شامل کرتے ہیں (نوٹ کریں کہ تعلیمی سیٹنگز میں نتائج کی درستی کی توثیق ضروری ہے)۔

Qwen3 VL-32B API تک رسائی کا طریقہ

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کی ایکسس کریڈنشل API key حاصل کریں۔ personal center میں API token پر “Add Token” کلک کریں، ٹوکن کی: sk-xxxxx حاصل کریں اور جمع کرائیں۔

مرحلہ 2: Qwen3 VL-32B API کو ریکوئسٹ بھیجیں

API ریکوئسٹ بھیجنے کے لیے “Qwen3-VL-32B” اینڈ پوائنٹ منتخب کریں اور ریکوئسٹ باڈی سیٹ کریں۔ ریکوئسٹ میتھڈ اور ریکوئسٹ باڈی ہماری ویب سائٹ کی API دستاویزات سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ سے حقیقی CometAPI key سے تبدیل کریں۔ base url is Chat

اپنا سوال یا درخواست content فیلڈ میں درج کریں — ماڈل اسی کا جواب دے گا۔ جنریٹڈ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔

مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں

جنریٹڈ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

qwen3-vl-32b

Qwen3-VL-32B کیا ہے

اہم خصوصیات

Qwen3-VL-32B کن حالات میں موزوں ہے

Qwen3 VL-32B API تک رسائی کا طریقہ

مرحلہ 1: API Key کے لیے سائن اپ کریں

مرحلہ 2: Qwen3 VL-32B API کو ریکوئسٹ بھیجیں

مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں

qwen3-vl-32b کی قیمتیں

qwen3-vl-32b کے لیے نمونہ کوڈ اور API

Python Code Example

JavaScript Code Example

Curl Code Example