Q

qwen3-vl-235b-a22b

Eingabe:$0.24/M
Ausgabe:$0.96/M
Kontext:2M
Maximale Ausgabe:30K
qwen3-vl-235b-a22b ist ein multimodales Modell, das leistungsstarke Textgenerierung mit visuellem Verständnis für Bilder und Videos vereint. Die Instruct-Variante ist auf das Befolgen von Anweisungen für allgemeine multimodale Aufgaben optimiert. Das Modell zeichnet sich durch die Erkennung realer und synthetischer Kategorien, 2D-/3D-räumliche Verortung und visuelles Verständnis längerer Inhalte aus und erzielt wettbewerbsfähige Ergebnisse auf multimodalen Benchmarks.
Neu
Kommerzielle Nutzung