Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

نعم. تم إصدار أوزان Qwen3.5-397B-A17B بموجب ترخيص Apache-2.0 على Hugging Face وModelScope، ويوفر المشروع وصفات تقديم لـ Transformers وvLLM وSGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

تشير A17B إلى أن تصميم التوجيه المتناثر للنموذج يستخدم نحو 17 مليار معلمة نشطة لكل رمز (خبراء نشطون)، بينما تبلغ السعة الإجمالية للنموذج ~397 مليار معلمة.

What is the native context window and can I extend it for very long documents?

يأتي النموذج بطول تسلسل إدخال أصلي يبلغ 262,144 رمزًا، ويتضمن طرقًا موثقة لتمديد السياق إلى ~1,010,000 رمز عبر تحجيم YaRN/RoPE، وذلك حسب إطار التقديم المستخدم.

Which input modalities does Qwen3.5-397B-A17B support?

إنه نموذج موحد للرؤية واللغة مدرب بأسلوب الدمج المبكر؛ وتشمل المدخلات المدعومة النصوص والصور ورموز الفيديو للاستدلال والتوليد متعدد الوسائط.

How does inference efficiency compare to a 17B dense model?

حساب الاستدلال لكل رمز مماثل للنماذج الكثيفة بحجم 17B بفضل توجيه MoE المتناثر، لكن ملفات النموذج ومتطلبات الذاكرة أكبر لأن الأوزان الكاملة يجب تخزينها وتوزيعها عبر الأجهزة.

واجهة برمجة تطبيقات qwen3.5-397b-a17b بأسعار معقولة | text-to-text

المواصفات التقنية لـ Qwen3.5-397B-A17B

العنصر	Qwen3.5-397B-A17B (مُدرَّب لاحقًا بأوزان مفتوحة)
عائلة النموذج	Qwen3.5 (سلسلة Tongyi Qwen، Alibaba)
البنية	خليط خبراء هجين (MoE) + Gated DeltaNet؛ تدريب متعدد الوسائط بالدمج المبكر
إجمالي المعاملات	~397 مليار (الإجمالي)
المعاملات النشطة (A17B)	~17 مليار نشطة لكل رمز (توجيه متفرق)
أنواع الإدخال	نص، صورة، فيديو (دمج مبكر متعدد الوسائط)
أنواع الإخراج	نص (دردشة، كود، مخرجات RAG)، تحويل الصورة إلى نص، استجابات متعددة الوسائط
نافذة السياق الأصلية	262,144 رمزًا (ISL أصلي)
سياق قابل للتوسعة	حتى ~1,010,000 رمز عبر تحجيم YaRN/ RoPE (يعتمد على المنصة)
الحد الأقصى لرموز الإخراج	يعتمد على الإطار/الخدمة (تُظهر الأدلة أمثلة بين 81,920–131,072)
اللغات	أكثر من 200 لغة ولهجة
تاريخ الإصدار	16 فبراير 2026 (إصدار بأوزان مفتوحة)
الترخيص	Apache‑2.0 (أوزان مفتوحة على Hugging Face / ModelScope)

ما هو Qwen3.5-397B-A17B

Qwen3.5-397B-A17B هو أول إصدار بأوزان مفتوحة ضمن عائلة Qwen3.5 من Alibaba: نموذج أساس كبير متعدد الوسائط قائم على خليط الخبراء، مُدرَّب على أهداف رؤية–لغة بالدمج المبكر ومُحسَّن لسير عمل قائم على الوكلاء. يوفّر النموذج السعة الكاملة لبنية ذات 397B من المعاملات مع استخدام التوجيه المتفرق (اللاحقة “A17B”) بحيث لا يكون نشطًا لكل رمز سوى نحو 17B من المعاملات—ما يحقق توازنًا بين سعة المعرفة وكفاءة الاستدلال.

هذا الإصدار موجّه للباحثين وفرق الهندسة الذين يحتاجون إلى نموذج أساس مفتوح وقابل للنشر ومتعدد الوسائط قادر على الاستدلال في سياقات طويلة، والفهم البصري، وتطبيقات مدعومة بالاسترجاع/القائمة على الوكلاء.

الميزات الرئيسية لـ Qwen3.5-397B-A17B

MoE متفرق بكفاءة المعاملات النشطة: سعة عالمية كبيرة (397B) مع نشاط لكل رمز قابل للمقارنة بنموذج كثيف 17B، ما يقلل FLOPS لكل رمز مع الحفاظ على تنوع المعرفة.
تعدد وسائط أصيل (دمج مبكر): مُدرَّب على التعامل مع النصوص والصور والفيديو عبر استراتيجية توحيد الترميز والمُرمِّز للاستدلال عبر الأنماط.
دعم سياقات طويلة جدًا: طول تسلسل إدخال أصلي يبلغ 262K رمزًا ومسارات موثقة للتمديد إلى ~1M+ رمز باستخدام تحجيم RoPE/YARN لسيناريوهات الاسترجاع وسلاسل المستندات الطويلة.
وضع التفكير وأدوات الوكيل: دعم آثار الاستدلال الداخلية ونمط تنفيذ قائم على الوكلاء؛ تشمل الأمثلة تمكين استدعاء الأدوات ودمج مفسّر الكود.
أوزان مفتوحة وتوافق واسع: يصدر بموجب Apache‑2.0 على Hugging Face وModelScope، مع أدلة تكامل رسمية لـ Transformers وvLLM وSGLang وأطر المجتمع.
تغطية لغوية مناسبة للمؤسسات: تدريب متعدد اللغات واسع (200+ لغة)، بالإضافة إلى إرشادات ووصفات للنشر على نطاق واسع.

Qwen3.5-397B-A17B مقابل نماذج مختارة

النموذج	نافذة السياق (أصلي)	نقطة القوة	المقايضات المعتادة
Qwen3.5-397B-A17B	262K (أصلي)	MoE متعدد الوسائط، أوزان مفتوحة، سعة 397B مع 17B نشطة	مخلفات نموذج كبيرة، يتطلب استضافة موزعة لتحقيق الأداء الكامل
GPT-5.2 (مغلق تمثيليًا)	~400K (مذكور لبعض المتغيرات)	دقة عالية للاستدلال في نموذج كثيف واحد	أوزان مغلقة، تكلفة استدلال أعلى على النطاق
LLaMA‑style dense 70B	~128K (يتغير)	حزمة استدلال أبسط، VRAM أقل لبيئات التنفيذ الكثيفة	سعة معاملات أقل مقارنة بمعرفة MoE العالمية

القيود المعروفة واعتبارات التشغيل

البصمة الذاكرية: لا يزال MoE المتفرق يتطلّب تخزين ملفات أوزان كبيرة؛ الاستضافة تتطلب سعة تخزين وذاكرة جهاز كبيرة مقارنة بنظير كثيف 17B.
تعقيد هندسي: يقتضي الإنتاجية المثلى تطبيق توازٍ مدروس (موتر/خط أنابيب) وأطرًا مثل vLLM أو SGLang؛ الاستضافة على GPU واحد بشكل ساذج غير عملية.
اقتصاديات الرموز: رغم انخفاض الحوسبة لكل رمز، فإن السياقات الطويلة جدًا ما تزال تزيد من الإدخال/الإخراج، وحجم مخزن KV المؤقت، والفوترة لدى مزوّدي الخدمات المُدارة.
السلامة والضوابط: تزيد الأوزان المفتوحة المرونة لكنها تنقل مسؤولية ترشيح السلامة والمراقبة وضوابط النشر إلى المُشغِّل.

حالات استخدام ممثلة

البحث وتحليل النماذج: تتيح الأوزان المفتوحة بحثًا قابلاً لإعادة الإنتاج وتقييمًا تقوده المجتمعات.
خدمات متعددة الوسائط محليّة: يمكن للمؤسسات التي تحتاج إلى إقامة البيانات نشر وتشغيل أحمال عمل الرؤية+النص محليًا.
سلاسل RAG والمستندات الطويلة: يساعد دعم السياقات الطويلة الأصلي على الاستدلال في مرور واحد عبر مجموعات نصية كبيرة.
استخبارات الكود وأدوات الوكلاء: تحليل مستودعات أحادية، توليد تصحيحات، وتشغيل حلقات استدعاء أدوات وكيلية في بيئات محكومة.
تطبيقات متعددة اللغات: دعم لغوي واسع التغطية للمنتجات العالمية.

كيفية الوصول إلى Qwen3.5-397B-A17B ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على مفتاح API لاعتماد الوصول للواجهة. انقر “Add Token” ضمن رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.

الخطوة 2: إرسال الطلبات إلى واجهة Qwen3.5-397B-A17B

اختر نقطة النهاية “Qwen3.5-397B-A17B” لإرسال طلب API واضبط جسم الطلب. تُستقى طريقة الطلب وجسمه من مستند واجهة برمجة التطبيقات على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. مكان استدعائه: صيغة الدردشة.

أدرج سؤالك أو طلبك في حقل content—فهذا ما سيرد عليه النموذج. عالج استجابة API للحصول على الإجابة المُولَّدة.

الخطوة 3: استرجاع النتائج والتحقق منها

عالج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تُرجع الواجهة حالة المهمة وبيانات المخرجات.

qwen3.5-397b-a17b