X

mimo-v2-omni

Wejście:$0.32/M
Wyjście:$1.6/M
MiMo-V2-Omni to zaawansowany model omni-modalny, który natywnie przetwarza obrazy, wideo i dźwięk w ramach ujednoliconej architektury. Łączy silną percepcję multimodalną ze zdolnościami agentowymi — ugruntowaniem wizualnym, planowaniem wieloetapowym, korzystaniem z narzędzi i wykonywaniem kodu — dzięki czemu dobrze nadaje się do złożonych zadań w rzeczywistych warunkach, obejmujących wiele modalności. Okno kontekstowe 256K.
Nowy
Użycie komercyjne

Więcej modeli