Q

qwen3-vl-235b-a22b

مدخل:$0.24/M
الإخراج:$0.96/M
سياق:2M
الحد الأقصى للإخراج:30K
qwen3-vl-235b-a22b هو نموذج متعدد الوسائط يجمع بين توليد نص قوي والفهم البصري للصور ومقاطع الفيديو. يعمل إصدار Instruct الخاص به على تحسين اتباع التعليمات للمهام العامة متعددة الوسائط. يتفوّق في إدراك الفئات الواقعية/الاصطناعية، والإرساء المكاني ثنائي/ثلاثي الأبعاد، والفهم البصري المطوّل، محققًا نتائج تنافسية في معايير قياسية متعددة الوسائط.
جديد
الاستخدام التجاري