الحقل	القيمة / الملاحظات
اسم النموذج	Qwen3-VL-32B (إصدارات Instruct / Thinking متاحة).
عائلة/معمارية النموذج	Qwen3-VL — محوِّل رؤية-لغة؛ هيكل متعدد الوسائط مع مُشفِّر بصري بأسلوب ViT + طبقات دمج LLM.
عدد المعاملات	يُصنَّف ضمن فئة "32B" (تذكر المصادر العامة نطاق ~32–33B من المعاملات للمتغير الكثيف 32B).
المتغيرات	الكثيف: 2B / 4B / 8B / 32B؛ MoE: 30B-A3B، 235B-A22B (تم أيضًا إصدار متغيرات MoE أكبر).
طول السياق الأصلي	256K رمزًا (سياق متعدد الوسائط متداخل أصلي)، مع أوضاع/تقنيات تمديد مُهندَسة تُمكّن حتى ~1M رمزًا في بعض عمليات النشر.
طرائق الإدخال	نص + صور (دقة عالية) + فيديو طويل (نمذجة زمنية/طوابع زمنية) + OCR (متعدد اللغات).
طرائق الإخراج	نص (لغة طبيعية)、 استخراج مُنظَّم (استخراج OCR/الجداول/المخططات)、 طوابع زمنية/ملخصات المقاطع للفيديو؛ يدعم استخدام الأدوات/استدعاءات الوكلاء.

ما هو Qwen3-VL-32B

Qwen3-VL-32B هو المتغير الكثيف ذو 32 مليار معامل ضمن عائلة نماذج الرؤية-اللغة Qwen3 من Alibaba. إنه محول متعدد الوسائط (رؤية + لغة + فيديو) مُصمم للإدراك الموحد، والاستدلال على سياقات طويلة، وOCR قوي وتأصيل بصري، وسير عمل وكيل/مُمَكَّن بالأدوات.

الميزات الرئيسية

سياق متعدد الوسائط كبير — دعم أصلي لـ 256K رمزًا متداخلًا (نص + مراجع صور) وخطافات معمارية/أدوات لتمديد السياق الفعّال إلى ~1M رمزًا للمستندات الطويلة ومقاطع الفيديو الطويلة؛ يُتيح الاسترجاع والاستدلال عبر المستندات وعبر الوسائط.
التدريب المُسبق الموحد للرؤية + اللغة — تدريب مشترك من المراحل المبكرة يُحسّن إرساء اللغة على المدخلات البصرية، ما يؤدي إلى تمثيلات أقوى عبر الوسائط (مفيد لـ VQA وOCR والاستدلال على المخططات).
فهم الفيديو والمحاذاة الزمنية — معالجة فيديو أصلية مع محاذاة نص ذات طوابع زمنية وإمكانية تلخيص أو فهرسة تدفقات الفيديو الطويلة بدقة زمنية دقيقة.
OCR متعدد اللغات وتحليل المستندات — OCR عالي الجودة عبر لغات عديدة وفهم قوي للمستند/التخطيط لاستخدامات استخراج الجداول والمخططات.
إصدارات Instruct مقابل Thinking — بناءات منفصلة مُحسَّنة للامتثال للتعليمات (Instruct) مقابل تدفق التفكير/الاستدلال الداخلي العميق (Thinking) لتناسب احتياجات التطبيقات (السلامة/الإيجاز مقابل الاستدلال خطوة بخطوة).
خيارات MoE للتوسعة — للسعة/التغطية القصوى توجد متغيرات MoE (30B-A3B، 235B-A22B) تزيد من القدرة التمثيلية مع محاولة ضبط حسابات الاستدلال عبر توجيه الخبراء.

المجالات الأنسب لاستخدام Qwen3-VL-32B

استخراج المستندات والنماذج على نطاق واسع — OCR قوي عبر اللغات، واستخراج الجداول والمخططات، والتلخيص الدلالي للتقارير الطويلة.
الإجابة على الأسئلة البصرية للصور المعقدة — مخططات طبية/هندسية، صور مع تعليقات توضيحية، أو استكشاف أخطاء بصري يتطلّب دمج الأدلة البصرية مع استدلال نصي تدريجي.
فهرسة وتلخيص الفيديو الطويل — إنشاء نصوص قابلة للبحث، وفهرسة وملخصات على مستوى الثواني للتسجيلات الممتدة لساعات أو لأرشيفات المراقبة/الفيديو.
وكلاء متعدد الوسائط/سلاسل أدوات — تنسيق استدعاءات الأدوات التي تتطلب استخراج حمولات بصرية (مثل OCR→بحث→إجراء)، مناسبة لأطر الوكلاء التي تجمع الإدراك مع الفعل.
الاستدلال البصري في مجالات STEM وأدوات التدريس — رياضيات تخطيطية وحلول تدريجية تُدمج الصور/الرسوم البيانية مع الشرح النصي (مع الإشارة إلى ضرورة التحقق من صحة المخرجات في البيئات التعليمية).

كيفية الوصول إلى واجهة برمجة تطبيقات Qwen3 VL-32B

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على مفتاح واجهة برمجة التطبيقات كبيانات اعتماد الوصول. انقر "Add Token" ضمن رمز واجهة برمجة التطبيقات في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.

الخطوة 2: إرسال الطلبات إلى واجهة برمجة تطبيقات Qwen3 VL-32B

اختر نقطة النهاية "Qwen3-VL-32B" لإرسال طلب واجهة البرمجة واضبط جسم الطلب. يتم الحصول على طريقة الطلب وجسم الطلب من وثائق واجهة البرمجة على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. عنوان الأساس هو Chat

أدرِج سؤالك أو طلبك في حقل المحتوى—فهذا ما سيستجيب له النموذج. عالج استجابة واجهة البرمجة للحصول على الإجابة المُولَّدة.

الخطوة 3: استرجاع النتائج والتحقق منها

عالج استجابة واجهة البرمجة للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب واجهة البرمجة بحالة المهمة وبيانات الإخراج.

qwen3-vl-32b

ما هو Qwen3-VL-32B

الميزات الرئيسية

المجالات الأنسب لاستخدام Qwen3-VL-32B

كيفية الوصول إلى واجهة برمجة تطبيقات Qwen3 VL-32B

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة برمجة تطبيقات Qwen3 VL-32B

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ qwen3-vl-32b

نموذج الكود وواجهة برمجة التطبيقات لـ qwen3-vl-32b

Python Code Example

JavaScript Code Example

Curl Code Example