المواصفات التقنية لـ Qwen3.5-397B-A17B
| العنصر | Qwen3.5-397B-A17B (بأوزان مفتوحة بعد التدريب) |
|---|---|
| عائلة النموذج | Qwen3.5 (سلسلة Tongyi Qwen، Alibaba) |
| البنية | مزيج هجين من الخبراء (MoE) + Gated DeltaNet؛ تدريب متعدد الوسائط بدمج مبكر |
| إجمالي المعلمات | ~397 مليار (إجمالي) |
| المعلمات النشطة (A17B) | ~17 مليار نشطة لكل رمز (توجيه متفرق) |
| أنواع الإدخال | نص، صورة، فيديو (متعدد الوسائط بدمج مبكر) |
| أنواع الإخراج | نص (دردشة، كود، مخرجات RAG)، صورة إلى نص، استجابات متعددة الوسائط |
| نافذة السياق الأصلية | 262,144 رمزًا (ISL أصلي) |
| السياق القابل للتوسيع | حتى ~1,010,000 رمز عبر تحجيم YaRN/ RoPE (بحسب المنصة) |
| الحد الأقصى لرموز الإخراج | يعتمد على الإطار/الخدمة (تُظهر الأمثلة 81,920–131,072 في الأدلة) |
| اللغات | أكثر من 200 لغة ولهجة |
| تاريخ الإصدار | 16 فبراير 2026 (إصدار بأوزان مفتوحة) |
| الترخيص | Apache‑2.0 (أوزان مفتوحة على Hugging Face / ModelScope) |
ما هو Qwen3.5-397B-A17B
Qwen3.5-397B-A17B هو أول إصدار بأوزان مفتوحة في عائلة Qwen3.5 من Alibaba: نموذج تأسيسي كبير ومتعدد الوسائط قائم على مزيج من الخبراء، تم تدريبه بأهداف دمج مبكر بين الرؤية واللغة، ومُحسَّن لتدفقات العمل الوكيلة. يكشف النموذج عن السعة الكاملة لبنية تضم 397 مليار معلمة، مع استخدام التوجيه المتفرق (اللاحقة “A17B”) بحيث لا تكون سوى ~17 مليار معلمة نشطة لكل رمز—مما يحقق توازنًا بين سعة المعرفة وكفاءة الاستدلال.
هذا الإصدار موجَّه للباحثين وفرق الهندسة الذين يحتاجون إلى نموذج تأسيسي مفتوح وقابل للنشر ومتعدد الوسائط، وقادر على الاستدلال ضمن سياقات طويلة، وفهم المحتوى البصري، وتطبيقات الاسترجاع المعزز/الوكيلة.
الميزات الرئيسية لـ Qwen3.5-397B-A17B
- MoE متفرق مع كفاءة المعلمات النشطة: سعة عالمية كبيرة (397B) مع نشاط لكل رمز مماثل لنموذج كثيف بحجم 17B، مما يقلل FLOPS لكل رمز مع الحفاظ على تنوع المعرفة.
- تعدد وسائط أصلي (دمج مبكر): تم تدريبه للتعامل مع النصوص والصور والفيديو عبر استراتيجية موحدة للترميز المميز والمشفِّر من أجل الاستدلال العابر للوسائط.
- دعم سياق طويل جدًا: طول تسلسل إدخال أصلي يبلغ 262 ألف رمز، ومسارات موثقة للتوسيع إلى ~1M+ رمز باستخدام تحجيم RoPE/YARN لتطبيقات الاسترجاع ومسارات المستندات الطويلة.
- وضع التفكير وأدوات الوكلاء: دعم لمسارات الاستدلال الداخلية ونمط تنفيذ وكيل؛ وتشمل الأمثلة تمكين استدعاءات الأدوات وتكامل مفسر الكود.
- أوزان مفتوحة وتوافق واسع: صدر بموجب Apache‑2.0 على Hugging Face وModelScope، مع أدلة تكامل من الطرف الأول لـ Transformers وvLLM وSGLang وأطر المجتمع.
- تغطية لغوية ملائمة للمؤسسات: تدريب متعدد اللغات على نطاق واسع (أكثر من 200 لغة)، بالإضافة إلى تعليمات ووصفات للنشر على نطاق واسع.
Qwen3.5-397B-A17B مقارنةً بنماذج مختارة
| النموذج | نافذة السياق (أصلية) | نقاط القوة | التنازلات المعتادة |
|---|---|---|---|
| Qwen3.5-397B-A17B | 262K (أصلية) | MoE متعدد الوسائط، أوزان مفتوحة، سعة 397B مع 17B نشطة | ملفات نموذج كبيرة، ويتطلب استضافة موزعة لتحقيق الأداء الكامل |
| GPT-5.2 (مغلق تمثيلي) | ~400K (مُبلّغ عنها لبعض المتغيرات) | دقة عالية في الاستدلال الكثيف ضمن نموذج واحد | أوزان مغلقة، وتكلفة استدلال أعلى على نطاق واسع |
| LLaMA‑style dense 70B | ~128K (تختلف) | مكدس استدلال أبسط، وVRAM أقل لتشغيل النماذج الكثيفة | سعة معلمات أقل مقارنة بالمعرفة العالمية في MoE |
القيود المعروفة والاعتبارات التشغيلية
- البصمة الذاكرية: لا يزال MoE المتفرق يتطلب تخزين ملفات أوزان كبيرة؛ وتحتاج الاستضافة إلى مساحة تخزين وذاكرة أجهزة كبيرة مقارنةً بنسخة كثيفة بحجم 17B.
- التعقيد الهندسي: يتطلب تحقيق أفضل إنتاجية إعدادًا دقيقًا للتوازي (tensor/pipeline) وأطرًا مثل vLLM أو SGLang؛ والاستضافة الساذجة على GPU واحد غير عملية.
- اقتصاديات الرموز: رغم تقليل الحوسبة لكل رمز، فإن السياقات الطويلة جدًا لا تزال تزيد من I/O وحجم ذاكرة KV cache والفوترة لدى المزودين المُدارين.
- السلامة والضوابط: تزيد الأوزان المفتوحة من المرونة، لكنها تنقل مسؤولية تصفية السلامة والمراقبة وضوابط النشر إلى المشغِّل.
حالات استخدام تمثيلية
- البحث وتحليل النماذج: تُمكّن الأوزان المفتوحة من إجراء أبحاث قابلة لإعادة الإنتاج وتقييمات يقودها المجتمع.
- خدمات متعددة الوسائط داخل المؤسسة: يمكن للمؤسسات التي تحتاج إلى سيادة البيانات نشر أعباء عمل الرؤية+النص وتشغيلها محليًا.
- RAG ومسارات المستندات الطويلة: يساعد دعم السياق الطويل الأصلي على الاستدلال بتمرير واحد عبر مجموعات كبيرة من البيانات.
- ذكاء الكود وأدوات الوكلاء: تحليل monorepos، وتوليد التصحيحات، وتشغيل حلقات استدعاء أدوات وكيلة في بيئات مضبوطة.
- التطبيقات متعددة اللغات: دعم لغوي واسع التغطية للمنتجات العالمية.
كيفية الوصول إلى Qwen3.5-397B-A17B ودمجه
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على بيانات اعتماد الوصول، وهي مفتاح API الخاص بالواجهة. انقر على “Add Token” في قسم API token في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.
الخطوة 2: إرسال الطلبات إلى واجهة برمجة تطبيقات Qwen3.5-397B-A17B
حدّد نقطة النهاية “Qwen3.5-397B-A17B” لإرسال طلب API وقم بتعيين نص الطلب. يتم الحصول على طريقة الطلب ونص الطلب من وثائق API على موقعنا. كما يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. مكان الاستدعاء: تنسيق Chat.
أدرج سؤالك أو طلبك في حقل content—وهذا ما سيرد عليه النموذج. عالج استجابة API للحصول على الإجابة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
عالج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب API بحالة المهمة وبيانات الإخراج.