X

mimo-v2-omni

입력:$0.32/M
출력:$1.6/M
MiMo-V2-Omni는 단일 통합 아키텍처 내에서 이미지, 비디오 및 오디오 입력을 네이티브로 처리하는 최첨단 옴니모달 모델입니다. 강력한 멀티모달 지각과 에이전트적 역량 - 시각적 그라운딩, 다단계 계획, 도구 사용, 코드 실행 - 의 결합으로, 여러 모달리티에 걸친 복잡한 현실 세계의 과제에 적합합니다. 256K 컨텍스트 윈도우.
새로운
상업적 사용

더 많은 모델