Q

qwen3-vl-235b-a22b

Wejście:$0.24/M
Wyjście:$0.96/M
Kontekst:2M
Maks. wyjście:30K
qwen3-vl-235b-a22b to model multimodalny, który łączy silne generowanie tekstu z rozumieniem wizualnym obrazów i wideo. Jego wariant Instruct optymalizuje wykonywanie poleceń w ogólnych zadaniach multimodalnych. Wyróżnia się rozpoznawaniem kategorii rzeczywistych i syntetycznych, osadzeniem przestrzennym w 2D/3D oraz rozumieniem treści wizualnych w dłuższej formie, osiągając konkurencyjne wyniki w multimodalnych benchmarkach.
Nowy
Użycie komercyjne