X

mimo-v2-omni

Inndata:$0.32/M
Utdata:$1.6/M
MiMo-V2-Omni er en ledende omni-modal modell som naturlig behandler bilde-, video- og lydinnganger innenfor en enhetlig arkitektur. Den kombinerer sterk multimodal persepsjon med agentiske evner – visuell forankring, flertrinnsplanlegging, verktøybruk og kodekjøring – noe som gjør den godt egnet for komplekse oppgaver i den virkelige verden som spenner over flere modaliteter. Kontekstvindu på 256K.
Ny
Kommersiell bruk