X

mimo-v2-omni

Eingabe:$0.32/M
Ausgabe:$1.6/M
MiMo-V2-Omni ist ein wegweisendes omnimodales Modell, das Bild-, Video- und Audioeingaben nativ innerhalb einer einheitlichen Architektur verarbeitet. Es kombiniert starke multimodale Wahrnehmung mit agentischen Fähigkeiten – visuelle Verankerung, mehrstufige Planung, Werkzeugnutzung und Codeausführung – und eignet sich damit hervorragend für komplexe Aufgaben in der realen Welt, die mehrere Modalitäten umfassen. 256K-Kontextfenster.
Neu
Kommerzielle Nutzung