Đầu vào:$60/M
Đầu ra:$240/M
MiMo-V2.5-Pro là mẫu flagship của Xiaomi, xuất sắc trong năng lực tác nhân đa mục đích và kỹ thuật phần mềm phức tạp.Đầu vào:$60/M
Đầu ra:$240/M
MiMo-V2.5 là mô hình đa phương thức bản địa của Xiaomi. Nó đạt hiệu năng tác tử ở cấp độ chuyên nghiệp với chi phí suy luận chỉ khoảng một nửa, đồng thời vượt trội so với MiMo-V2-Omni về nhận thức đa phương thức trong các tác vụ hiểu hình ảnh và video.Đầu vào:$0.8/M
Đầu ra:$2.4/M
MiMo-V2-Pro là mô hình nền tảng chủ lực của Xiaomi, sở hữu hơn 1T tham số tổng và độ dài ngữ cảnh 1M, được tối ưu sâu cho các kịch bản tác tử. Nó thích ứng cao với các khung tác tử tổng quát như OpenClaw. Trên các benchmark chuẩn PinchBench và ClawBench, mô hình này nằm trong nhóm hàng đầu toàn cầu, với hiệu năng cảm nhận tiệm cận Opus 4.6. MiMo-V2-Pro được thiết kế để đóng vai trò bộ não của các hệ thống tác tử, điều phối các quy trình công việc phức tạp, thực thi các tác vụ kỹ thuật trong môi trường sản xuất và cung cấp kết quả một cách đáng tin cậy.Đầu vào:$0.32/M
Đầu ra:$1.6/M
MiMo-V2-Omni là một mô hình omni-modal tiên tiến, có khả năng xử lý trực tiếp đầu vào hình ảnh, video và âm thanh trong một kiến trúc hợp nhất. Mô hình này kết hợp khả năng nhận thức đa phương thức mạnh mẽ với năng lực tác tử - định vị trực quan, lập kế hoạch nhiều bước, sử dụng công cụ và thực thi mã - khiến nó đặc biệt phù hợp với các tác vụ phức tạp trong thế giới thực trải dài trên nhiều phương thức. Cửa sổ ngữ cảnh 256K.