X

mimo-v2-omni

Masukan:$0.32/M
Keluaran:$1.6/M
MiMo-V2-Omni ialah model omni-modal termaju yang memproses input imej, video dan audio secara natif dalam seni bina bersatu. Ia menggabungkan persepsi multimodal yang kukuh dengan keupayaan agentik - visual grounding, perancangan berbilang langkah, penggunaan alat dan pelaksanaan kod - menjadikannya sangat sesuai untuk tugasan dunia sebenar yang kompleks merentas modaliti. Tetingkap konteks 256K.
Baru
Penggunaan komersial

Lebih Banyak Model