في ليلة رأس السنة القمرية (16–17 فبراير 2026)، أطلقت مجموعة Alibaba نموذجها من الجيل التالي، Qwen 3.5 — نموذج متعدد الوسائط وقادر على التصرف كوكلاء، متموضع لما تسميه الشركة عصر “الذكاء الاصطناعي القائم على الوكلاء”. سلّطت التغطيات الصناعية الضوء على ادعاءات تحقيق مكاسب كبيرة في الكفاءة والتكلفة، ودعم سريع من موردي العتاد والسحابة. يعدّ CometAPI خيارًا للمطورين الذين يريدون وصولًا مستضافًا عبر واجهة API أو تكاملًا متوافقًا مع OpenAI، بينما أعلنت AMD دعم وحدات معالجة الرسوميات من اليوم الأول للنموذج على خط Instinct لديها. تعد ByteDance أحد المنافسين المحليين الرئيسيين الذين أصدروا ترقيات في نفس نافذة العطلة. تظل OpenAI نقطة مرجعية للمقارنة في الاختبارات النقطية وأسلوب التكامل.
ما هو Qwen 3.5؟
Qwen 3.5 من Alibaba هو أحدث جيل من النماذج اللغوية الكبيرة متعددة الوسائط (LLM) لدى الشركة، موجه لعصر “الذكاء الاصطناعي القائم على الوكلاء” — نماذج لا تكتفي بالإجابة على الأسئلة، بل تستطيع تنظيم تدفقات عمل متعددة الخطوات، واستدعاء الأدوات، والعمل مع الصور/الفيديو، والتصرف عبر حدود التطبيقات. تم الإعلان عن النموذج علنًا خلال فترة رأس السنة القمرية (نافذة الإصدار المذكورة حوالي 16 فبراير 2026)، وهو توقيت استراتيجي للدعاية للمنتجات في الصين ولجذب انتباه المستخدمين خلال ذروة العطلات. يحقق Qwen 3.5 تحسينات كبيرة في التكلفة ومعدل المعالجة مقارنة بسابقيه، مع التركيز على السياقات الطويلة وأتمتة بأسلوب الوكلاء.
نظرة سريعة إلى أبرز الادعاءات التقنية والتجارية حول Qwen 3.5:
- بنية متعددة الوسائط أصلية تدعم إدخالات ومخرجات النص والصور والفيديو (تدفقات عمل قائمة على الوكلاء). قدرات جديدة داخل النموذج لاستدعاء الأدوات، والتصرف على محتوى المتصفح، وربط الخطوات (سلوك وكيل). تتيح هذه الميزات الأتمتة — تعبئة النماذج، تدفقات العمل الشاملة — لكنها تتطلب ضوابط أمان أقوى.
- بنية هجينة من نوع مزيج الخبراء (MoE) بإجمالي معلمات كبير جدًا لكن مجموعة أصغر نشطة في كل مرور أمامي — تشير الملاحظات التقنية العامة إلى معماريات مثل “397B إجماليًا / 17B نشطًا” لأحد متغيرات Qwen3.5 المستخدمة في تقديم فعال. ينتج عن هذا التصميم قدرة عالية مع كفاءة أفضل في الاستدلال.
- مقارنات معيارية تنافسية مقابل النماذج المغلقة الرائدة عالميًا، مع ادعاء Alibaba بأفضلية في التكلفة وتكافؤ أو تفوق في العديد من المهام العملية.
الإصدارات التي ستصادفها
- qwen3.5-397b-a17b(إصدار مفتوح/أوزان):نقاط تحقق قابلة للتنزيل وتفريعات مجتمعية (لعمليات النشر المحلية والمخصصة). راجع المستودعات الرسمية للمشروع والنسخ المرآة.
- qwen3.5-plus (متغير “Plus” المستضاف): مُدار بالكامل على Alibaba Cloud Model Studio مع أكبر نافذة سياق وأدوات مدمجة (استدعاء الأدوات، مساعد برمجي، استخراج الويب). هذا هو الإصدار الذي سيستدعيه عملاء المؤسسات عبر API للموثوقية والقابلية للتوسع.
ما أبرز ميزات Qwen-3.5؟
لمحات عن البنية والتدريب
فيما يلي جدول ميزات موجز مع الإصدار:
| الميزة | Qwen-3.5 (تفاصيل عامة) | الأثر العملي |
|---|---|---|
| البنية | هجين: انتباه خطي + MoE متناثر + ركائز محولات كثيفة كأساس. | معدل فك ترميز أعلى وكفاءة توسع أفضل مقارنة بالنماذج الكثيفة البحتة. |
| تعدد الوسائط | قدرات أصلية للرؤية–اللغة مع سلوك وكيل (اتخاذ إجراءات عبر واجهات المستخدم). | يتيح التحكم في التطبيقات/وكلاء متعددو الخطوات، وليس مجرد أسئلة وأجوبة نص-صورة. |
| سلسلة النماذج والأوزان المفتوحة | إصدار علني لواحد على الأقل من متغيرات “الأوزان المفتوحة” (مثل Qwen3.5-397B-A17B). | يتيح الضبط الدقيق محليًا ومن أطراف ثالثة؛ يسرّع التقييم المجتمعي. |
| اللغات | >200 لغة ولهجة (وفقًا لادعاءات الإصدار). | تغطية دولية واسعة للتوطين والوكلاء متعددَي اللغات. |
| التعلم المعزز/الوكلاء | توسيع بيئات التعلم المعزز على نطاق واسع ومسارات تدريب للوكلاء. | يحسن التخطيط بعيد المدى وتسلسل الإجراءات في المهام الواقعية. |
تعدد الوسائط وإجراءات الوكلاء
تم تصميم Qwen-3.5 صراحةً لتدفقات عمل قائمة على الوكلاء — أي أن النموذج مصمم ليس فقط للإجابة، بل للتخطيط، وربط الإجراءات (واجهات برمجة التطبيقات، تفاعلات الواجهة، عمليات الملفات)، ودمج المدخلات البصرية (لقطات شاشة، DOM، صور) في حلقة اتخاذ القرار. تسلط Alibaba الضوء على دمجًا أصيلاً بين الرؤية واللغة وخطافات تحكم أكثر إحكامًا لتنفيذ المهام عبر حدود تطبيقات الهواتف والمكاتب.
البنية الهجينة (تركيز على الكفاءة)
تشير مواد Alibaba والملخصات الصناعية إلى أن Qwen-3.5 يستخدم مزيجًا من آليات الانتباه الخطي مع توجيه MoE متناثر بحيث تكون المعلمات النشطة الفعلية للمطالبات الشائعة أقل بكثير من الرقم الرئيسي. الفائدة العملية: قدرة أعلى لكل وحدة حساب وتكلفة استدلال أقل — تدعي الشركة انخفاض تكلفة النشر حتى ~60% مقارنة بالإصدارات السابقة.
نافذة السياق والدعم متعدد اللغات
تشير الملاحظات العامة إلى نوافذ سياق موسعة (يُذكر 256k رمزًا لبعض متغيرات الأوزان المفتوحة عبر عائلة Qwen) وتغطية لغوية أوسع (وسّعت Alibaba باستمرار دعم اللغات/اللهجات عبر أجيال Qwen). النتيجة: مهام أفضل للوثائق الطويلة والوكلاء عبر اللغات.
كيف أصل إلى Qwen 3.5 عبر CometAPI؟
يوفر CometAPI بوابة موحدة متوافقة مع OpenAI لأكثر من 500 نموذج (بما في ذلك نقاط Qwen المستضافة أو نقاط أطراف ثالثة). يتيح هذا التجريد لشفرتك تبديل المزودين بأقل قدر من الاحتكاك بينما يقوم CometAPI بتطبيع الاستجابات وتقديم تحليلات الاستخدام وفوترة حسب الاستهلاك.
خطوة بخطوة: التدفق الأساسي لاستدعاء Qwen 3.5 عبر CometAPI
- سجّل واحصل على مفتاح API من لوحة تحكم CometAPI.
- اختر متغير Qwen 3.5 في قائمة نماذج CometAPI (مثل
qwen3.5-plusأوqwen3.5-397b-a17b). عادةً يعرِض CometAPI اسم النموذج الخاص بالمزود كسلسلة تمررها في الحقلmodel. - قدّم طلب Chat Completion باستخدام نقطة النهاية المتوافقة مع OpenAI (base URL examples:
https://api.cometapi.com/v1). يمكنك استخدام حزمة OpenAI أو HTTP الخام. تعرض وثائق CometAPI كلا النهجين وتوصي بربط عنوان الأساس لمكتبتك بنقطة CometAPI بحيث تعمل شيفرة OpenAI الحالية مع تغييرات قليلة أو دون تغيير.
أمثلة مصغّرة
cURL (مكالمة محادثة بسيطة)
export COMETAPI_KEY="sk-xxxx"
curl -s -X POST "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer $COMETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.5-plus",
"messages":[
{"role":"system","content":"You are a concise engineering assistant."},
{"role":"user","content":"Summarize the tradeoffs between retrieval-augmented generation and fine-tuning."}
],
"max_tokens": 512
}'
Python (OpenAI client with base_url override)
# Using the OpenAI-compatible client pattern many API hubs support:
from openai import OpenAI
client = OpenAI(api_key="YOUR_COMETAPI_KEY", base_url="https://api.cometapi.com/v1")
resp = client.chat.completions.create(
model="qwen3.5-plus",
messages=[
{"role":"system","content":"You are a concise engineering assistant."},
{"role":"user","content":"Explain how to implement streaming responses in production (short)."}
],
max_tokens=400
)
print(resp.choices[0].message.content)
ملاحظة: يقوم CometAPI بتطبيع العديد من اختلافات البائعين؛ راجع قائمة نماذج CometAPI لاختيار الاسم النصي الدقيق لكل متغير من Qwen.
استدعاء قدرات الصور/تعدد الوسائط عبر البوابة
إذا أردت استخدام ميزات الرؤية (صورة + نص)، يعرض CometAPI عادةً قدرات البائع عبر واجهة API واحدة ولكنه قد يتطلب إرفاق بيانات/صور ثنائية أو روابط موقعة. النمط العام هو تضمين input_image (أو معلمة خاصة بالبائع) وضبط model على متغير Qwen-3.5 المناسب متعدد الوسائط.
كم تبلغ تكلفة Qwen 3.5؟
تسعير واجهة API والرموز في Aliyun
| النموذج | الرموز المدخلة لكل طلب | سعر الإدخال (لكل 1M رمز) | سعر الإخراج (لكل 1M رمز) | الحصة المجانية (ملاحظة) | |
|---|---|---|---|---|---|
| وضع غير التفكير | وضع التفكير (CoT + استجابة) | ||||
| qwen3.5-plus | 0<Token≤256K | $0.4 | $2.4 | $2.4 | 1 million tokens eachValidity: 90 days after activating Model Studio |
| 256K<Token≤1M | $1.2 | $7.2 | $7.2 | ||
| qwen3.5-plus-2026-02-15 | 0<Token≤256K | $0.4 | $2.4 | $2.4 | |
| 256K<Token≤1M | $1.2 | $7.2 | $7.2 |
التسعير لـ qwen3.5-plus في CometAPI
يوفر CometAPI فوترة حسب الاستهلاك ويساعد على توحيد الفوترة عبر المزودين؛ تعتمد رسومه الدقيقة لكل رمز على المزود الأساسي وأي هامش/خصم تطبقه CometAPI. عمليًا، يُبسِّط استخدام بوابة مثل CometAPI عملية تبديل المزودين وتحليلات الاستخدام بتكلفة إضافية صغيرة — وهذا مفيد للفرق التي تريد تكرارًا متعدد المزودين أو تريد مقارنة الأداء مقابل السعر دون إعادة هندسة.
استكشف تسعيرًا تنافسيًا لـ qwen3.5-plus، مصممًا ليلائم ميزانيات واحتياجات استخدام متنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، ما يسهل التوسع مع نمو احتياجاتك. اكتشف كيف يمكن لـ qwen3.5-plus تعزيز مشاريعك مع إبقاء التكاليف قابلة للإدارة.
| سعر Comet (USD / M Tokens) | السعر الرسمي (USD / M Tokens) | الخصم |
|---|---|---|
| Input:$0.32/M; Output:$1.92/M | Input:$0.4/M; Output:$2.4/M | -20% |
هل يمكنني تشغيل Qwen 3.5 محليًا أو على بنية تحتية مخصصة؟
نعم، ولكن مع تحفّظات:
- المتغيرات الكبيرة (مئات المليارات من المعلمات) تتطلب عتادًا متخصصًا (عدة A100/H100 أو عناقيد AMD Instinct). دعم اليوم الأول لـ Qwen 3.5 على وحدات AMD Instinct؛ توفر مشاريع المجتمع (vLLM، HF) وصفات لنشر أُطر استدلال مُحسّنة. توقّع جهدًا هندسيًا كبيرًا وتكلفة عتاد مرتفعة للمقياس الإنتاجي.
- متغيرات عائلة Qwen الأخف (مجموعات معلمات أصغر، أوزان شبيهة بـ Qwen-Turbo) أسهل في الاستضافة ومفيدة للعديد من مهام الإنتاج مع مقايضات جودة/تكلفة مقبولة.
إذا فرضت الامتثال أو إقامة البيانات نشرًا محليًا، ففكّر في نهج هجين: شغّل التضمينات والاسترجاع محليًا، واستدعِ Qwen المستضاف للمهام متعددة الوسائط أو القائمة على الوكلاء المعقدة.
ما الخيارات السحابية أو المستضافة المتاحة؟
- Alibaba Cloud Model Studio: يوفر نقاط Qwen مستضافة، وواجهات متوافقة مع OpenAI، وأدوات تكامل (RAG، مجموعات أدوات). مناسب للفرق التي تستخدم Alibaba Cloud بالفعل.
- واجهات API من أطراف ثالثة (CometAPI، إلخ.): خيار سريع لتجارب متعددة النماذج، وتبديل محايد للبائعين، ومقارنة التكلفة.
- أوزان مفتوحة/استضافة ذاتية: إذا كنت تحتاج لمحلّية بيانات كاملة، نزّل الأوزان المفتوحة وقدمها على عنقودك (NCCL/ROCm أو CUDA).
العتاد: ما وحدات GPU والأطر؟
- دعم AMD من اليوم الأول: أعلنت AMD عن أدوات ROCm وحاويات من اليوم الأول لـ Qwen 3.5 على وحدات Instinct — مفيد إذا كنت تنشر على عتاد AMD. لمستخدمي NVIDIA، من المحتمل أن تظهر حاويات محسّنة ودعم Triton بسرعة.
- تحسينات الاستدلال: التكميم (INT8/4)، تقسيم الموترات، وتعديلات توجيه MoE تقلل متطلبات الذاكرة والحساب؛ اختر حجم النموذج وفقًا لذلك. للوكلاء في الزمن الحقيقي، فضّل النماذج الأقل معلمات مع تجميع عدواني وعروض شعاعية صغيرة.
أفضل الممارسات عند دمج Qwen 3.5
فيما يلي قواعد وأنماط هندسية عملية — مستخلصة من وثائق البائعين، والمراجعات المبكرة، وممارسات هندسة LLM القياسية — لبناء أنظمة متينة وقابلة للتوسع وفعّالة من حيث التكلفة.
الضبط الرسائلي ونظافة رسالة النظام
- استخدم رسائل system صريحة لضبط الشخصية، وميزانيات الرموز، وصيغ المخرجات.
- فضّل المطالبات القصيرة والبُنى المُهيكلة لمخرجات JSON أو الوظائف المتوقعة؛ واحصر مطالبات سلسلة التفكير الطويلة عند الضرورة فقط (تكلف أكثر وقد تزيد الكمون). اختر “غير التفكير” للاستجابات المباشرة الحتمية وانتقل إلى “التفكير” للاستدلال الثقيل.
إدارة الرموز والسياق (حرِج مع نوافذ 1M)
- قسّم الوثائق الطويلة واستخدم الاسترجاع بالتضمين للحفاظ على سياق نشط صغير؛ رغم أن Qwen Plus يدعم 1M رمزًا، فإن تمرير سياقات ضخمة في كل نداء مكلف. بدلًا من ذلك: قم بفهرسة الوثائق، وجلب المقاطع ذات الصلة، وضمّن المقتطفات الضرورية فقط.
- استخدم التضمينات + قواعد بيانات متجهية للاسترجاع أولًا؛ ثم استدعِ النموذج بالسياق المسترجع وتعليمات موجزة. يقلل نمط RAG هذا من تكاليف الرموز والكمون.
استراتيجيات تحسين التكلفة
- تحكّم في حجم المخرجات باستخدام
max_tokensوتعليمات صريحة مثل “أجب في N كلمات”. - استخدم وضع غير التفكير للقوالب والإجابات القصيرة؛ واحتفظ بسلسلة التفكير فقط عندما تبرر مكاسب الجودة التكلفة. توضح وثائق Alibaba صراحةً خرائط أوضاع تفكير هجينة لمقايضات التكلفة/الأداء.
- جمّع الطلبات حيثما أمكن (عدّة مطالبات في طلب واحد) لتخفيف النفقات العامة لأعباء العمل الموجهة للإنتاجية.
- تتبّع الرموز لكل طلب والكمون باستخدام تحليلات المزود (يوفر CometAPI لوحات استخدام). راقب أعلى N مطالبات حسب التكلفة لتحديد أهداف التحسين.
الموثوقية وحدود المعدل
- نفّذ تراجعات أسية مع اهتزاز لأخطاء 429/503.
- استخدم البوابة (CometAPI) أو لوحة البائع لمراقبة الحصص وتعيين التنبيهات. يوفر CometAPI تحليلات استخدام تساعدك على رصد طفرات التكلفة بسرعة.
استدعاء الوظائف/الأدوات/تصميم الوكيل
عامل استدعاءات الأدوات كمرحلة مميزة: يقترح النموذج أداة + معطيات، وأنت تتحقق/تُجيز ثم تنفّذ الأداة على الخادم. لا تنفّذ أبدًا تعليمات أدوات غير موثوقة بصورة عمياء. يروّج Qwen 3.5 لنماذج أدوات مدمجة؛ اعتمد تحققًا صارمًا من الإدخال وضوابط وصول.
منظور ختامي: ما الذي ينبغي مراقبته لاحقًا
إصدار Qwen 3.5 في رأس السنة القمرية استراتيجي: فهو يجمع ميزات وكيلة متقدمة، وتعاملًا مع سياقات كبيرة، وتكاليف تشغيل أقل في عروض أوزان مفتوحة ومستضافة. قصة المطورين الآنية قوية: طرق متعددة لتجربة النموذج (واجهات مستضافة مثل CometAPI، الاستضافة السحابية عبر Alibaba Cloud، أو أوزان مستضافة ذاتيًا) ودعم عتادي سريع (AMD).
يمكن للمطورين الوصول إلى Qwen 3.5 API عبر CometAPI الآن. للبدء، استكشف قدرات النموذج في Playground وراجع دليل API للحصول على إرشادات مفصلة. قبل الوصول، يرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. يقدّم CometAPI سعرًا أقل بكثير من السعر الرسمي لمساعدتك على الاندماج.
هل أنت جاهز للانطلاق؟→ سجّل للحصول على Qwen-3.5 اليوم !
إذا كنت تريد مزيدًا من النصائح والإرشادات والأخبار حول الذكاء الاصطناعي فاتبعنا على VK، وX وDiscord!
