Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

جی ہاں۔ Qwen3.5-397B-A17B کے weights Apache-2.0 کے تحت Hugging Face اور ModelScope پر جاری کیے گئے ہیں، اور پراجیکٹ Transformers، vLLM، اور SGLang کے لیے سرونگ کے طریقہ کار فراہم کرتا ہے۔

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B اس بات کی نشاندہی کرتا ہے کہ ماڈل کے sparse routing ڈیزائن میں فی token تقریباً 17 billion active parameters (active experts) استعمال ہوتے ہیں، جبکہ عالمی ماڈل کی capacity تقریباً ~397 billion parameters ہے۔

What is the native context window and can I extend it for very long documents?

یہ ماڈل 262,144 tokens کی مقامی input sequence length کے ساتھ آتا ہے اور YaRN/RoPE scaling کے ذریعے context کو ~1,010,000 tokens تک بڑھانے کے لیے documented methods شامل ہیں، جو serving framework پر منحصر ہے۔

Which input modalities does Qwen3.5-397B-A17B support?

یہ early-fusion کے ساتھ تربیت یافتہ ایک unified vision-language model ہے؛ معاونت یافتہ ان پٹس میں متن، تصاویر، اور ویڈیو tokens شامل ہیں تاکہ multimodal reasoning اور generation ممکن ہو سکے۔

How does inference efficiency compare to a 17B dense model?

فی token inference compute sparse MoE routing کی بدولت 17B dense-class models کے مماثل ہے، لیکن model artifacts اور memory requirements زیادہ ہیں کیونکہ مکمل weights کو devices پر ذخیرہ اور تقسیم کرنا ضروری ہے۔

سستی qwen3.5-397b-a17b API | text-to-text

Qwen3.5-397B-A17B کی فنی خصوصیات

آئٹم	Qwen3.5-397B-A17B (open-weight post-trained)
ماڈل فیملی	Qwen3.5 (Tongyi Qwen series, Alibaba)
معماری	ہائبرڈ Mixture‑of‑Experts (MoE) + Gated DeltaNet؛ ابتدائی فیوژن کثیرالموڈ تربیت
کل پیرا میٹرز	~397 billion (مجموعی)
فعال پیرا میٹرز (A17B)	ہر ٹوکن پر ~17 billion فعال (اسپارس راؤٹنگ)
اِن پٹ اقسام	متن، تصویر، ویڈیو (ملٹی ماڈل ابتدائی فیوژن)
آؤٹ پٹ اقسام	متن (چیٹ، کوڈ، RAG آؤٹ پٹس)، تصویر سے متن، کثیرالموڈ جوابات
نیٹو کانٹیکسٹ ونڈو	262,144 ٹوکنز (native ISL)
قابلِ توسیع سیاق	YaRN/RoPE اسکیلنگ کے ذریعے ~1,010,000 ٹوکنز تک (پلیٹ فارم پر منحصر)
زیادہ سے زیادہ آؤٹ پٹ ٹوکنز	فریم ورک/سرونگ پر منحصر (رہنما دستاویزات میں مثالیں 81,920–131,072 دکھاتی ہیں)
زبانیں	200+ زبانیں اور بولیاں
اجرا کی تاریخ	16 فروری 2026 (اوپن ویٹ ریلیز)
لائسنس	Apache‑2.0 (Hugging Face / ModelScope پر اوپن ویٹس)

Qwen3.5-397B-A17B کیا ہے

Qwen3.5-397B-A17B، Alibaba کے Qwen3.5 فیملی میں پہلی اوپن ویٹ ریلیز ہے: ایک بڑا، کثیرالموڈ Mixture‑of‑Experts بنیاد ماڈل جسے ابتدائی فیوژن وژن–لینگوئج مقاصد کے ساتھ تربیت دیا گیا ہے اور ایجینٹک ورک فلوز کے لیے بہتر بنایا گیا ہے۔ یہ ماڈل 397B پیرا میٹر معماری کی مکمل گنجائش ظاہر کرتا ہے جبکہ اسپارس راؤٹنگ استعمال کرتا ہے (لاحقہ “A17B”) تاکہ ہر ٹوکن پر صرف ~17B پیرا میٹرز فعال رہیں—جس سے علم کی گنجائش اور اِنفرنس افادیت کے درمیان توازن ملتا ہے۔

یہ ریلیز ان محققین اور انجینیئرنگ ٹیموں کے لیے ہے جنہیں ایک اوپن، تعینات کیے جانے کے قابل، کثیرالموڈ بنیاد ماڈل درکار ہے جو طویل سیاق پر استدلال، بصری فہم، اور ریٹریول‑اگمینٹڈ/ایجینٹک ایپلیکیشنز کرنے کی صلاحیت رکھتا ہو۔

Qwen3.5-397B-A17B کی نمایاں خصوصیات

مضبوطی سے مؤثر Sparse MoE with active‑parameter efficiency: عالمی گنجائش بڑی (397B) جبکہ فی ٹوکن فعالیت 17B ڈینس ماڈل کے مساوی، جس سے فی ٹوکن FLOPS کم رہتے ہیں اور علمی تنوع برقرار رہتا ہے۔
نیٹو ملٹی موڈیلٹی (ابتدائی فیوژن): متن، تصاویر اور ویڈیو کو یکجا ٹوکنائزیشن اور اینکوڈر حکمت عملی کے ذریعے سنبھالنے کی تربیت، تاکہ کروس‑موڈل استدلال ممکن ہو۔
انتہائی طویل سیاق کی سپورٹ: 262K ٹوکنز کی نیٹو اِن پٹ سیکوئنس لمبائی اور RoPE/YARN اسکیلنگ کے ذریعے ~1M+ تک توسیع کے مستند راستے، ریٹریول اور طویل دستاویزی پائپ لائنز کے لیے موزوں۔
سوچنے کا موڈ اور ایجنٹ ٹولنگ: اندرونی استدلالی نشانات اور ایجینٹک ایکزیکیوشن پیٹرن کی سپورٹ؛ مثالوں میں ٹول کالز اور کوڈ انٹرپریٹر انٹیگریشن شامل ہیں۔
اوپن ویٹ اور وسیع مطابقت: Apache‑2.0 کے تحت Hugging Face اور ModelScope پر دستیاب، اور Transformers، vLLM، SGLang اور کمیونٹی فریم ورکس کے لیے پہلے فریق کی انٹیگریشن گائیڈز۔
کاروباری ماحول کے لیے موزوں زبانوں کی کوریج: 200+ زبانوں کی وسیع تربیت، اور بڑے پیمانے پر ڈپلائمنٹ کے لیے ہدایات و ترکیبیں۔

Qwen3.5-397B-A17B بمقابلہ منتخب ماڈلز

ماڈل	کانٹیکسٹ ونڈو (نیٹو)	طاقت	معمول کے ٹریڈ آف
Qwen3.5-397B-A17B	262K (نیٹو)	کثیرالموڈ MoE، اوپن ویٹس، 397B گنجائش کے ساتھ 17B فعال	بڑے ماڈل آرٹیفیکٹس، مکمل کارکردگی کے لیے ڈسٹری بیوٹڈ ہوسٹنگ درکار
GPT-5.2 (نمائندہ بند)	~400K (کچھ ویریئنٹس کے لیے رپورٹڈ)	سنگل ڈینس ماڈل میں اعلیٰ استدلالی درستی	بند ویٹس، بڑے پیمانے پر اِنفرنس لاگت زیادہ
LLaMA‑اسٹائل ڈینس 70B	~128K (مختلف)	سادہ اِنفرنس اسٹیک، ڈینس رن ٹائمز کے لیے کم VRAM	MoE کی عالمی معلومات کے مقابلے میں پیرا میٹر گنجائش کم

معلوم حدود اور عملی ملاحظات

میموری فٹ پرنٹ: اسپارس MoE کے باوجود بڑے ویٹ فائلز درکار؛ 17B ڈینس ہم شکل کے مقابلے میں میزبانی کے لیے زیادہ اسٹوریج اور ڈیوائس میموری کی ضرورت۔
انجینیئرنگ پیچیدگی: مثالی تھروپٹ کے لیے محتاط پیریللزم (ٹینسر/پائپ لائن) اور vLLM یا SGLang جیسے فریم ورکس درکار؛ سادہ سنگل‑GPU ہوسٹنگ غیر عملی۔
ٹوکن اکنامکس: فی ٹوکن کمپیوٹ کم ہونے کے باوجود، بہت طویل سیاق I/O، KV cache سائز اور منیجڈ پرووائیڈرز کے لیے بلنگ بڑھاتا ہے۔
سیفٹی اور گارڈ ریلز: اوپن ویٹس لچک بڑھاتے ہیں مگر سیفٹی فلٹرنگ، مانیٹرنگ، اور ڈپلائمنٹ گارڈ ریلز کی ذمہ داری آپریٹر پر آ جاتی ہے۔

نمائندہ استعمالات

تحقیق اور ماڈل تجزیہ: اوپن ویٹس قابلِ تجدید تحقیق اور کمیونٹی کی جانچ کو ممکن بناتے ہیں۔
آن‑پریمس کثیرالموڈ سروسز: ادارے جو ڈیٹا رہائش چاہتے ہیں وہ مقامی طور پر وژن+متن ورک لوڈز چلا سکتے ہیں۔
RAG اور طویل دستاویزی پائپ لائنز: نیٹو طویل سیاق سپورٹ بڑی کارپس پر سنگل‑پاس استدلال میں مدد دیتی ہے۔
کوڈ انٹیلیجنس اور ایجنٹ ٹولنگ: مونو ریپوز کا تجزیہ، پیچز جنریٹ کرنا، اور کنٹرولڈ ماحول میں ایجینٹک ٹول‑کال لوپس چلانا۔
کثیر لسانی ایپلیکیشنز: عالمی مصنوعات کے لیے وسیع زبانوں کی کوریج۔

Qwen3.5-397B-A17B تک رسائی اور انٹیگریشن کا طریقہ

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com میں لاگ ان کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن اِن کریں۔ انٹرفیس کا ایکسیس کریڈینشل API key حاصل کریں۔ پرسنل سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن کی: sk-xxxxx حاصل کریں اور سبمٹ کریں۔

مرحلہ 2: Qwen3.5-397B-A17B API کو ریکویسٹ بھیجیں

API ریکویسٹ بھیجنے کے لیے “Qwen3.5-397B-A17B” اینڈ پوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاک سے حاصل کیے جا سکتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ کے اصل CometAPI key سے تبدیل کریں۔ Where to call it: Chat فارمیٹ۔

اپنا سوال یا درخواست کنٹینٹ فیلڈ میں درج کریں—اسی پر ماڈل ردعمل دے گا . API ریسپانس پروسیس کر کے جنریٹڈ جواب حاصل کریں۔

مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں

API ریسپانس پروسیس کر کے جنریٹڈ جواب حاصل کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

qwen3.5-397b-a17b