MiMo-V2.5-Pro
X

MiMo-V2.5-Pro

Próximamente
Entrada:$60/M
Salida:$240/M
MiMo-V2.5-Pro es el modelo insignia de Xiaomi y sobresale en capacidades de agente de propósito general y en ingeniería de software compleja.
MiMo-V2.5
X

MiMo-V2.5

Próximamente
Entrada:$60/M
Salida:$240/M
MiMo-V2.5 es el modelo nativo completamente multimodal de Xiaomi. Logra un rendimiento de agente de nivel profesional con aproximadamente la mitad del costo de inferencia, mientras supera a MiMo-V2-Omni en percepción multimodal en tareas de comprensión de imágenes y video.
mimo-v2-pro
X

mimo-v2-pro

Entrada:$0.8/M
Salida:$2.4/M
MiMo-V2-Pro es el modelo fundacional insignia de Xiaomi, con más de 1T de parámetros totales y una longitud de contexto de 1M, profundamente optimizado para escenarios orientados a agentes. Es altamente adaptable a frameworks generales de agentes como OpenClaw. Se sitúa entre la élite mundial en los benchmarks estándar PinchBench y ClawBench, con un rendimiento percibido que se acerca al de Opus 4.6. MiMo-V2-Pro está diseñado para servir como el cerebro de los sistemas de agentes, orquestar flujos de trabajo complejos, impulsar tareas de ingeniería de producción y ofrecer resultados de manera fiable.
mimo-v2-omni
X

mimo-v2-omni

Entrada:$0.32/M
Salida:$1.6/M
MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada. Combina una sólida percepción multimodal con capacidad de agencia - anclaje visual, planificación multietapa, uso de herramientas y ejecución de código - lo que lo hace muy adecuado para tareas complejas del mundo real que abarcan varias modalidades. Ventana de contexto de 256K.