Q

qwen3-vl-235b-a22b

Indtast:$0.24/M
Output:$0.96/M
Kontekst:2M
Maks Output:30K
qwen3-vl-235b-a22b er en multimodal model, der forener stærk tekstgenerering med visuel forståelse af billeder og videoer. Dens Instruct-variant optimerer efterlevelse af instruktioner til generelle multimodale opgaver. Den udmærker sig ved opfattelsen af virkelige og syntetiske kategorier, 2D/3D rumlig forankring og visuel forståelse af lange formater og opnår konkurrencedygtige resultater på multimodale benchmarks.
Ny
Kommersiel brug