X

mimo-v2-omni

Entrada:$0.32/M
Salida:$1.6/M
MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada. Combina una sólida percepción multimodal con capacidad de agencia - anclaje visual, planificación multietapa, uso de herramientas y ejecución de código - lo que lo hace muy adecuado para tareas complejas del mundo real que abarcan varias modalidades. Ventana de contexto de 256K.
Nuevo
Uso comercial

Más modelos