فك تشفير تدريب Qwen3: نظرة متعمقة

CometAPI
AnnaMay 28, 2025
فك تشفير تدريب Qwen3: نظرة متعمقة

لقد أعاد إطلاق Qwen3، أحدث نموذج لغة كبيرة (LLM) من علي بابا، رسم ملامح أبحاث وتطبيقات الذكاء الاصطناعي. وتستند قدراته المذهلة إلى عملية تدريب مُصممة بدقة، تشمل تدريبًا مسبقًا مكثفًا على بيانات متنوعة، وابتكارات معمارية، وخطة تدريب لاحقة متعددة المراحل. تشرح هذه المقالة كيف يتدرب Qwen3، استكشاف كل مرحلة من استيعاب البيانات الخام إلى الضبط الدقيق للتفكير والنشر، والإجابة على الأسئلة الرئيسية التي تحرك تصميمها وأدائها.

ما هي البيانات التي تدعم التدريب المسبق لـ Qwen3؟

توسع عدد الرموز: من تريليونات إلى عشرات التريليونات

تم بناء أساس Qwen3 على مجموعة غير مسبوقة من القوانين -أكثر من تريليون رمز تغطي أكثر من 119 لغة ولهجة. وهذا يمثل ضعف حجم الرموز المستخدمة في سابقتها، Qwen2.5، التي تدربت على 18 تريليون رمز. من خلال توسيع نطاق البيانات، تستوعب Qwen3 نسيجًا أغنى من الأنماط اللغوية، والمعرفة العالمية، والمحتوى الخاص بمجال محدد.

الاستفادة من مصادر البيانات المتنوعة: الويب وملفات PDF والمحتوى الاصطناعي

لتجميع هذه المجموعة الضخمة من البيانات، قامت علي بابا بدمج عمليات البحث على الويب مع مستندات تشبه PDF تمت معالجتها عبر Qwen2.5-VL، مما يضمن استخراجًا عالي الجودة للنصوص التقنية والمواد الأكاديمية. علاوة على ذلك، أدى توليد البيانات التركيبية المُستهدفة - بالاستفادة من Qwen2.5-Math وQwen2.5-Coder - إلى تعزيز المجموعة بملايين حلول المسائل الرياضية ومقاطع الأكواد البرمجية، مما عزز مهارات العلوم والتكنولوجيا والهندسة والرياضيات (STEM) والبرمجة.

كيف يتم تنظيم عملية التدريب المسبق لـ Qwen3؟

المرحلة 1: بناء المعرفة الأساسية

In المرحلة 1 (S1)، تم تدريب Qwen3 على أكثر من تريليون رمز باستخدام هيكل محول قياسي لسياق 4K. تُغرس هذه المرحلة فهمًا أساسيًا للغة والمعرفة العامة، على غرار "تعلم الأبجدية" لمحو الأمية البشرية.

المرحلة الثانية: إثراء القدرات المعرفية المكثفة

تحرك إلى المرحلة 2 (S2)، تتم إعادة موازنة مجموعة البيانات للتأكيد محتوى مكثف المعرفة—نصوص العلوم والتكنولوجيا والهندسة والرياضيات، وتحديات البرمجة، ومهام التفكير المنطقي. إضافة 5 تريليون توكينز يتم استيعابها، مما يؤدي إلى شحذ قدرة النموذج على معالجة المشاكل الأكاديمية والتقنية المعقدة.

المرحلة 3: توسيع طول السياق

وأخيرا، أ مرحلة ما قبل التدريب في سياق طويل يستخدم مستندات عالية الجودة لتوسيع نافذة السياق الأصلية لـ Qwen3 32 ألف رمز، مما يمكّنه من معالجة والتفكير في المدخلات الطويلة مثل أوراق البحث أو التعليمات متعددة الخطوات.

ما هي الابتكارات المعمارية التي تمكن Qwen3 من الأداء؟

النماذج الكثيفة مقابل نماذج مزيج الخبراء

يقدم Qwen3 كلاً من كثيف و خليط من الخبراء (MoE) تتراوح النماذج الكثيفة من 0.6 مليار إلى 32 مليار معلمة، في حين أن إصدارات MoE لا تنشط إلا جزءًا صغيرًا من الخبراء (على سبيل المثال، 8 من أصل 128) لكل رمز، مما يقلل الحوسبة النشطة بنسبة تصل إلى 90% دون التضحية بالأداء.

تحسينات الاهتمام والتطبيع

ابتكارات مثل تطبيع QK لكل رأس كما أن إعادة تصميم انحيازات الانتباه تُعزز الاستقرار على نطاق واسع. تُمكّن هذه التحسينات النماذج الأعمق (حتى 94 طبقة في Qwen3-235B-A22B) من التقارب بكفاءة، مما يضمن مكاسب ثابتة مع زيادة السعة.

كيف يقوم Qwen3 بتنفيذ التفكير الهجين؟

وضع التفكير مقابل وضع عدم التفكير

السمة المميزة لـ Qwen3 هي التفكير الهجين:

  • وضع التفكير:يستخدم التفكير المتسلسل (CoT)، ويقسم المشكلات إلى خطوات وسيطة قبل إنتاج إجابة نهائية.
  • وضع عدم التفكير:يقدم استجابات سريعة دون تفكير وسيط واضح.
    يمكن للمستخدمين تبديل الأوضاع عبر enable_thinking العلم أو العلامات المضمنة (/think, /no_think), تكييف الاستدلال مع تعقيد المهمة.

التحكم في ميزانيات الاستدلال

من خلال تخصيص "ميزانيات حسابية" لخطوات الاستدلال، يضمن Qwen3 توازن التكلفة والجودة. تُحفّز المهام الأصعب استدلالًا أعمق (مزيدًا من الحوسبة)، بينما تظل الاستعلامات الأبسط سريعة، مما يُتيح التحكم الدقيق في مقايضات الاستدلال .

ما الذي يتضمنه خط أنابيب ما بعد التدريب الخاص بـ Qwen3؟

الضبط الدقيق مع البداية الباردة المتسلسلة

(أراضي البوديساتفا) المرحلة الأولى بعد التدريب ضبط Qwen3 بدقة بيانات CoT الطويلة المتنوعةتشمل الرياضيات، وألغاز المنطق، ومسائل البرمجة. تُفعّل مرحلة "البداية الباردة" هذه قدرات التفكير المنطقي الصريح للنموذج قبل مرحلة التعلم التعزيزي.

التعلم التعزيزي للتفكير

المرحلة الثانية من توسيع نطاق الحوسبة **التعلم التعزيزي القائم على القواعد (RL)**باستخدام دوال مكافآت مصممة يدويًا لتوجيه استكشاف مسارات التفكير. يُحسّن هذا قدرة النموذج على توليد خطوات وسيطة متماسكة دون الانحراف عن مسار المهمة.

دمج نمط التفكير والتعزيز العام

في المرحلة الثالثة، يتم دمج البيانات المنطقية والبيانات الموجهة للتعليمات -اندماج نمط التفكير—دمج التفكير العميق مع اتباع التعليمات العامة. وأخيرًا، تُطبّق المرحلة الرابعة التعزيز على أكثر من ٢٠ مهمة عامة (مثل الالتزام بالتنسيق، والوظائف الوكيلة)، وتصحيح السلوكيات غير المرغوب فيها، وتحسين الطلاقة.

ما الفرق بين Qwen3 و Qwen2.5؟

في حين أن Qwen2.5 أسس لريادة علي بابا في برامج الماجستير في القانون المفتوحة، فإن Qwen3 يجلب العديد من التحسينات المحورية:

الميزاتكوين2.5كوين3
مقاييس المعلماتحتى 72B (كثيفة)حتى 235B (MoE) + خيارات كثيفة
نافذة السياق16 ألف رمز128 ألف رمز (معظم المتغيرات)
التغطية اللغوية۱٦ لغة119 لغة ولهجة
التكامل المنطقينموذج الاستدلال المنفصلأنماط التفكير/عدم التفكير الموحدة
توفر الوزن المفتوحنعم (أباتشي 2.0)نعم (أباتشي 2.0)

تؤدي هذه الترقيات إلى ظهور نماذج أكثر تنوعًا ودقة وسهولة الوصول إليها عالميًا.

كيف يتم تحسين Qwen3 للنشر في الوقت الفعلي؟

إلى جانب التدريب، يركز تصميم Qwen3 على الاستدلال منخفض الكمون والنشر القابل للتطوير لدعم الوكلاء والمساعدين من الدرجة الإنتاجية.

تسريع الأجهزة على Cerebras

لقد أثبتت Cerebras إمكانية التفكير في الوقت الفعلي باستخدام Qwen3-32B، حيث قدمت استجابات في غضون 1.2 ثانية - أسرع بما يصل إلى 60 مرة من نماذج التفكير المماثلة - من خلال الاستفادة من محركها على نطاق الرقاقة ونوى الاستدلال المتخصصة المحسّنة لهندسة Qwen3.

نشر السحابة والاستعداد لواجهة برمجة التطبيقات

تقدم Alibaba Cloud تقنية Qwen3 من خلال حزمة واجهات برمجة التطبيقات (APIs)، مع مجموعات وحدات معالجة رسومية (GPU) قابلة للتوسع تلقائيًا وعقد وحدة معالجة مركزية (CPU) مُحسّنة للاستدلال. يمكن للمطورين ضبط إصدارات Qwen3 ونشرها بدقة باستخدام دعم LoRA المدمج لتقليل استهلاك الموارد، مما يجعل خدمات الذكاء الاصطناعي واسعة النطاق فعّالة من حيث التكلفة ومتاحة بسهولة.

كيف يمكن للمطورين الاستفادة من Qwen3؟

أطلقت شركة علي بابا هاتف Qwen3 تحت أباتشي 2.0 الترخيص، ودعوة مجتمع البحث العالمي ومطوري المؤسسات إلى اعتماد وتكييف وتوسيع عائلة النموذج للتطبيقات المتخصصة.

ما هي المتغيرات المتوفرة؟

  • النماذج الكثيفة (0.6B، 3B، 22B، 32B)
    تعتبر هذه المتغيرات مثالية للنشر المحلي وسيناريوهات الحافة، حيث توفر إمكانيات قوية مع تكامل مباشر.
  • نماذج وزارة التعليم (235 مليار معلمة إجمالية؛ 22 مليار نشطة)
    تم تصميم هذه التكوينات الأكبر حجمًا للخدمات السحابية عالية الإنتاجية، وهي توفر أقصى عمق للتفكير وطلاقة متعددة اللغات مع الاستخدام الأمثل للموارد.

ما الفرق بين خيارات API والخيارات المحلية؟

يمكن للمطورين الاختيار بين:

  • واجهة برمجة تطبيقات Alibaba Cloud:نقطة نهاية مُدارة مع التوسع التلقائي، مما يتيح إنشاء النماذج الأولية السريعة والتوزيع العالمي.
  • النشر المستضاف ذاتيًا:يتم توفير حاويات Docker وبيانات Kubernetes، مما يسهل السيناريوهات التي تتطلب الامتثال بشكل كبير حيث تكون إقامة البيانات والأمان أمرًا بالغ الأهمية.
  • كوميت ايه بي اي:يمكن للمطورين الوصول إلى كوين 3 API من خلال كوميت ايه بي اييوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي.

ما هو الدعم المجتمعي والنظام البيئي الموجود؟

  • مستودع مفتوح المصدريستضيف موقع Qwen GitHub أوزان النماذج، وبرامج التدريب، ومجموعات أدوات الضبط الدقيق، مما يشجع الابتكار الذي يقوده المجتمع.
  • التكاملات المعدة مسبقًا:تعمل المكونات الإضافية لأطر عمل التعلم الآلي الشائعة (TensorFlow وPyTorch) والمنصات التابعة لجهات خارجية (LangChain وHugging Face) على تسريع وقت تحقيق القيمة.
  • التعاون البحثي:نشرت شركة علي بابا التقرير الفني الكامل لـ Qwen3 على arXiv، مما يوفر الشفافية في القرارات المعمارية ومنهجيات التدريب.

من خلال تدريب مسبق ضخم ومتعدد المراحل، وإنجازات معمارية متقدمة، ومسار تدريب لاحق متطور، يحقق Qwen3 معيارًا جديدًا في التفكير الهجين. أنماط تفكيره المرنة، ومتغيراته الفعّالة في نماذج الذكاء الاصطناعي، ومنظومة نشره الغنية، تضعه في طليعة الذكاء الاصطناعي مفتوح المصدر، مما يُمكّن الباحثين والمطورين من بناء الجيل القادم من الوكلاء الأذكياء.

كيف تبدأ

يوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي ضمن نقطة نهاية موحدة، مع إدارة مدمجة لمفاتيح واجهة برمجة التطبيقات، وحصص الاستخدام، ولوحات معلومات الفواتير. بدلاً من إدارة عناوين URL وبيانات اعتماد متعددة للموردين.

يمكن للمطورين الوصول كوين 3 API من خلال كوميت ايه بي اي.للبدء، استكشف قدرات النموذج في ساحة اللعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API.

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%