أطلقت Alibaba Cloud نموذج Qwen-VLo متعدد الوسائط، وترقية إمكانية الصورة

CometAPI
AnnaJun 29, 2025
أطلقت Alibaba Cloud نموذج Qwen-VLo متعدد الوسائط، وترقية إمكانية الصورة

تم إطلاق قسم الذكاء الاصطناعي في Alibaba Cloud رسميًا كوين-VLo، أحدث إصدار من سلسلة نماذج Qwen متعددة الوسائط، يُمثل تقدمًا ملحوظًا في قدرات الرؤية واللغة الموحدة. أُعلن عن Qwen-VLo في 28 يونيو 2025، وهو يوفر وظائف الفهم والتوليد، متجاوزًا بذلك الإصدارات السابقة ليشمل إنشاء وتحرير صور عالية الدقة باستخدام إشارات اللغة الطبيعية والمدخلات البصرية.

بناءً على إصدارات سابقة مثل Qwen-VL وQwen2.5-VL، يُمثل Qwen-VLo ما تصفه علي بابا بأنه "ترقية شاملة" في مجال الذكاء الاصطناعي متعدد الوسائط. في حين ركز Qwen-VL بشكل أساسي على تفسير المعلومات المرئية، وعزز Qwen2.5-VL فهم السياقات الطويلة، يدمج Qwen-VLo هذه المزايا في إطار عمل واحد قادر على تنفيذ مهام ثنائية الاتجاه تعتمد على الرؤية واللغة. فهو يستوعب تعليمات مفتوحة، ويدعم لغات متعددة - بما في ذلك الصينية والإنجليزية - ويُحسّن مخرجاته لتُضاهي مخرجات الفنانين.

الميزات الرئيسية

توليد الصور التدريجي

يُنشئ Qwen-VLo الصور تدريجيًا - من اليسار إلى اليمين ومن الأعلى إلى الأسفل - ويُحسّن المحتوى المتوقع بشكل متكرر لضمان الاتساق والتناغم البصري. تُحسّن هذه الآلية كفاءة الإنتاج وتحكم المستخدم في العملية الإبداعية.

دعم الدقة الديناميكية

باستخدام تدريب الدقة الديناميكية، يُمكن للنموذج التعامل مع دقة إدخال/إخراج ونسب أبعاد عشوائية. يُمكن للمستخدمين إنشاء محتوى مُصمم خصيصًا لسيناريوهات مُتنوعة، مثل لافتات الويب، وأغلفة وسائل التواصل الاجتماعي، والملصقات عالية الدقة، دون التقيد بتنسيقات ثابتة.

تحرير التعليمات المفتوحة

باستخدام أوامر اللغة الطبيعية، يُمكن لـ Qwen VLo إجراء تعديلات متقدمة، مثل نقل الأنماط ("تطبيق أسلوب فان جوخ")، والتحويلات المركبة ("إضافة سماء مشمسة")، والتعديلات متعددة الجوانب، وذلك بتعليمة واحدة. كما يدعم استخراج وتحرير الإشارات المرئية التقليدية، مثل خرائط العمق، وأقنعة التجزئة، وخطوط الحواف.

التفاعل متعدد اللغات

ويتقبل النموذج الأوامر بعدة لغات - يدعم حاليًا اللغتين الصينية والإنجليزية - وبالتالي يلبي احتياجات قاعدة المستخدمين العالمية ويكسر الحواجز اللغوية في سير العمل الإبداعي.

التوافر والوصول

Qwen‑VLo متوفر حاليًا في معاينة عبر منصة Qwen Chat على chat.qwen.aiلاحظت علي بابا كلاود، كإصدار تجريبي، أن المستخدمين قد يواجهون أحيانًا تناقضات أو أخطاءً في الحقائق أثناء عملية التوليد. ويعمل فريق التطوير بنشاط على معالجة هذه القيود قبل إطلاقها على نطاق أوسع.

في جوهره، حسّن مهندسو الذكاء الاصطناعي في علي بابا نظام Qwen-VLo للاستخدام في كل من بيئات السحابة والحافة. ​​بالاستفادة من التكميم متعدد الدقة وتقنيات الضبط الدقيق المبتكرة عالية الكفاءة للمعلمات، يحافظ النموذج على أداء عالٍ في مساحة حوسبة صغيرة. كما دمجت علي بابا خطوط أنابيب استدلال تكيفية لموازنة زمن الوصول والجودة، مما يضمن قدرة Qwen-VLo على خدمة التطبيقات الحساسة لزمن الوصول - مثل أدوات التصميم التفاعلية - مع التوسع في أحمال العمل على مستوى المؤسسات على Alibaba Cloud.

قارن ب كوين-في إل-بلس/ماكس

البعد الوظيفيكوين-في إل-بلس/ماكسكوين في لو
فهم الصورةالتصنيف الأساسي والوصفالتعرف على البنية متعددة الأبعاد، وتعزيز الفهم السياقي
توليد الصوردعم أسلوب محدوددقة عالية، جيل متقدم، قدرات قوية للتحكم في الأسلوب
القدرة على تعدد المهاميتطلب إدخالًا محددًا للمهمةتعدد المهام الموحد، يدعم تعليمات اللغة المعقدة
التفاعل متعدد اللغاتدعم محدوددعم أصلي للغة الصينية والإنجليزية، وتحكم أكثر سلاسة في اللغة الطبيعية
القدرة على الحفاظ على التفاصيلاحتمال فقدان التفاصيل أثناء التوليدالتعرف الدقيق وإعادة بناء الهياكل والدلالات الرئيسية

كيف تبدأ

CometAPI هي منصة واجهات برمجة تطبيقات موحدة تجمع أكثر من 500 نموذج ذكاء اصطناعي من أبرز المزودين، مثل سلسلة GPT من OpenAI، وGemini من Google، وClaude من Anthropic، وMidjourney، وSuno، وغيرهم، في واجهة واحدة سهلة الاستخدام للمطورين. من خلال توفير مصادقة متسقة، وتنسيق الطلبات، ومعالجة الردود، تُبسط CometAPI بشكل كبير دمج قدرات الذكاء الاصطناعي في تطبيقاتك. سواء كنت تُنشئ روبوتات دردشة، أو مُولّدات صور، أو مُلحّنين موسيقيين، أو خطوط أنابيب تحليلات قائمة على البيانات، تُمكّنك CometAPI من التكرار بشكل أسرع، والتحكم في التكاليف، والاعتماد على مورد واحد فقط، كل ذلك مع الاستفادة من أحدث التطورات في منظومة الذكاء الاصطناعي.

للبدء، استكشف قدرات النماذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API.

ستظهر أحدث واجهة برمجة تطبيقات Qwen‑VLo للتكامل قريبًا على CometAPI، لذا ترقبوا ذلك! بينما ننتهي من تحميل نموذج Qwen‑VLo، استكشف نماذجنا الأخرى على صفحة النماذج أو جربهم في ملعب AI. أحدث طراز من Qwen في CometAPI هو واجهة برمجة تطبيقات Qwen 3(qwen3-235b-a22b;qwen3-30b-a3b;qwen3-8b) and qwen-vl-plus-latest.

أطلقت Alibaba Cloud نموذج Qwen-VLo متعدد الوسائط، وترقية إمكانية الصورة

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%