MiniMax M2.1 là gì
MiniMax M2.1 là bản phát hành tiếp nối của dòng MiniMax M2, được MiniMax phát hành vào Dec 23, 2025. Sản phẩm được định vị là một mô hình mã nguồn mở, hướng môi trường sản xuất, được thiết kế chuyên cho lập trình, quy trình nhiều bước kiểu agent (sử dụng công cụ, lập kế hoạch nhiều lượt), và tạo ứng dụng full-stack (web, di động, backend). Bản phát hành nhấn mạnh khả năng lập trình đa ngôn ngữ được cải thiện, năng lực ứng dụng di động/native tốt hơn, phản hồi súc tích, và khả năng khái quát hóa công cụ/agent được nâng cao.
Các tính năng chính
- Hiệu suất MoE: Tổng số tham số lớn nhưng chỉ một tập con nhỏ hoạt động cho mỗi token (kiến trúc được thiết kế để đánh đổi năng lực đỉnh để lấy hiệu quả suy luận).
- Tối ưu hóa ưu tiên lập trình: Khả năng hiểu và sinh mã đa ngôn ngữ mạnh trên nhiều ngôn ngữ (Python, TypeScript, Rust, Go, C++, Java, Swift, ngôn ngữ native cho di động).
- Quy trình agent & công cụ: Thiết kế cho gọi công cụ, lập kế hoạch nhiều bước, và “tư duy đan xen” / thực thi xâu chuỗi theo các ràng buộc chỉ dẫn tổng hợp.
- Hỗ trợ ngữ cảnh lớn & đầu ra dài: Nhắm tới quy trình dài-ngữ-cảnh của nhà phát triển và dấu vết/lịch sử agent.
- Độ trễ thấp / thông lượng cao: Thực tiễn cho trợ lý lập trình tương tác và vòng lặp agent ở quy mô nhờ thiết kế kích hoạt có chọn lọc và tối ưu triển khai.
Năng lực kỹ thuật và thông số
- Kiến trúc: Thiết kế Mixture-of-Experts (MoE).
- Tham số: Thiết kế được công bố: ~230 tỷ tham số tổng với ~10 tỷ tham số hoạt động cho mỗi lần suy luận (tập con hoạt động của MoE). Đây là mô hình hiệu quả theo tham số hoạt động giống như trong dòng M2.
- Đặc tính suy luận: Được thiết kế cho sử dụng tương tác độ trễ thấp, suy luận theo lô thông lượng cao, và các vòng lặp agent với tần suất gọi công cụ cao.
- Streaming / gọi hàm: hỗ trợ phát trực tuyến token và các giao diện gọi hàm/công cụ nâng cao cho I/O có cấu trúc.
Hiệu năng điểm chuẩn
MiniMax đã công bố các kết quả so sánh benchmark và các bộ tổng hợp bên thứ ba đã báo cáo điểm số khi ra mắt; các con số tiêu biểu được công bố bao gồm:
Multi-SWE Bench / SWE-Bench (bộ bài kiểm tra lập trình/agent): danh mục của nhà cung cấp và bộ tổng hợp trích dẫn 49.4% trên Multi-SWE-Bench và 72.5% trên SWE-Bench Multilingual cho M2.1 (đây là các điểm tổng hợp cho nhiệm vụ sinh mã và lập luận về mã).
M2.1 cho thấy các cải tiến toàn diện so với M2 về tạo test case, tối ưu mã, rà soát mã và tuân thủ chỉ dẫn; M2.1 vượt trội M2 và thường tương đương hoặc vượt Claude Sonnet 4.5 trên nhiều tiểu tác vụ lập trình.

Trường hợp sử dụng tiêu biểu trong môi trường sản xuất
- Trợ lý mã trong IDE & refactoring: Refactor nhiều tệp, đề xuất rà soát mã, tạo test tự động và tạo bản vá trên nhiều ngôn ngữ.
- “Nhân viên số” kiểu agent: Tự động hóa quy trình công việc văn phòng lặp lại (tìm kiếm trong hệ thống ticket, tóm tắt tài liệu, tương tác với ứng dụng web qua lệnh dạng văn bản) bằng tích hợp công cụ và tư duy đan xen.
- Hỗ trợ kỹ thuật đa ngôn ngữ: Các đội ngũ duy trì codebase đa ngôn ngữ (Rust, Go, Java, C++, TypeScript) có thể dùng M2.1 để tổng hợp và chuyển đổi mã xuyên ngôn ngữ.
- Đánh giá mã tự động & tạo test: Tạo test case, chạy phân tích mã và đưa ra sửa lỗi hoặc đề xuất tối ưu như một phần của công cụ CI.
- Nghiên cứu và tùy chỉnh cục bộ/on‑prem: Các tổ chức cần kiểm soát on‑prem có thể fine-tune hoặc chạy M2.1 cục bộ bằng trọng số đã công bố và các ngăn xếp suy luận được khuyến nghị.
Cách truy cập và sử dụng MiniMax M2.1 API
Bước 1: Đăng ký API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới MiniMax M2.1 API
Chọn endpoint “minimax-m2.1” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên website của chúng tôi. Trang web của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn thuận tiện. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực từ tài khoản của bạn. Gọi ở đâu: Các API kiểu Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo ra.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo ra. Sau khi xử lý, API sẽ phản hồi với trạng thái tác vụ và dữ liệu đầu ra.