X

mimo-v2-omni

Đầu vào:$0.32/M
Đầu ra:$1.6/M
MiMo-V2-Omni là một mô hình omni-modal tiên tiến, có khả năng xử lý trực tiếp đầu vào hình ảnh, video và âm thanh trong một kiến trúc hợp nhất. Mô hình này kết hợp khả năng nhận thức đa phương thức mạnh mẽ với năng lực tác tử - định vị trực quan, lập kế hoạch nhiều bước, sử dụng công cụ và thực thi mã - khiến nó đặc biệt phù hợp với các tác vụ phức tạp trong thế giới thực trải dài trên nhiều phương thức. Cửa sổ ngữ cảnh 256K.
Mới
Sử dụng thương mại

Thêm mô hình