X

mimo-v2-omni

Ingresso:$0.32/M
Uscita:$1.6/M
MiMo-V2-Omni è un modello omnimodale all'avanguardia che elabora nativamente input di immagini, video e audio all'interno di un'architettura unificata. Combina una solida percezione multimodale con capacità agentiche - grounding visivo, pianificazione a più fasi, uso di strumenti ed esecuzione di codice - risultando particolarmente adatto a compiti complessi del mondo reale che coinvolgono più modalità. Finestra di contesto da 256K.
Nuovo
Uso commerciale