X

mimo-v2-omni

入力:$0.32/M
出力:$1.6/M
MiMo-V2-Omni は、統一されたアーキテクチャで画像・動画・音声入力をネイティブに処理する最先端のオムニモーダルモデルです。強力なマルチモーダル知覚とエージェント的能力(視覚的グラウンディング、マルチステップの計画、ツールの使用、コード実行)を組み合わせ、モダリティをまたぐ複雑な現実世界のタスクに適しています。256K のコンテキストウィンドウ。
新着
商用利用

その他のモデル