Modelos Xiaomi - CometAPI

X

MiMo-V2.5-Pro

Em breve

Entrada:$60/M

Saída:$240/M

MiMo-V2.5-Pro é o modelo principal da Xiaomi, destacando-se em capacidades de agentes de propósito geral e em engenharia de software complexa.

X

MiMo-V2.5

Em breve

Entrada:$60/M

Saída:$240/M

MiMo-V2.5 é o modelo nativo totalmente multimodal da Xiaomi. Ele atinge desempenho de agente de nível profissional a aproximadamente metade do custo de inferência, enquanto supera o MiMo-V2-Omni em percepção multimodal em tarefas de compreensão de imagens e vídeos.

X

mimo-v2-pro

Entrada:$0.8/M

Saída:$2.4/M

MiMo-V2-Pro é o modelo fundacional carro-chefe da Xiaomi, com mais de 1T de parâmetros no total e um comprimento de contexto de 1M, profundamente otimizado para cenários agentivos. Ele é altamente adaptável a frameworks de agentes gerais como o OpenClaw. Ele figura entre a elite global nos benchmarks padrão PinchBench e ClawBench, com desempenho percebido que se aproxima ao de Opus 4.6. MiMo-V2-Pro foi projetado para servir como o cérebro de sistemas de agentes, orquestrando fluxos de trabalho complexos, impulsionando tarefas de engenharia em produção e entregando resultados de forma confiável.

X

mimo-v2-omni

Entrada:$0.32/M

Saída:$1.6/M

MiMo-V2-Omni é um modelo omni-modal de ponta que processa nativamente entradas de imagem, vídeo e áudio em uma arquitetura unificada. Ele combina forte percepção multimodal com capacidade agêntica — grounding visual, planejamento em múltiplas etapas, uso de ferramentas e execução de código — tornando-o altamente adequado para tarefas complexas do mundo real que abrangem múltiplas modalidades. Janela de contexto de 256K.