Thông số kỹ thuật của MiniMax M3
| Hạng mục | MiniMax M3 |
|---|---|
| Dòng mô hình | Mô hình nền tảng cấp độ tiên phong MiniMax M3 |
| Nhà cung cấp | MiniMax |
| Kiến trúc | MiniMax Sparse Attention (MSA) |
| Loại đầu vào | Văn bản, Hình ảnh, Video |
| Loại đầu ra | Văn bản |
| Cửa sổ ngữ cảnh | Lên đến 1,000,000 token (tối thiểu được đảm bảo 512K) |
| Thế mạnh chính | Lập trình, quy trình làm việc tác tử, suy luận đa phương thức, xử lý ngữ cảnh dài |
| Chế độ suy luận | Chế độ suy nghĩ bật/tắt |
| Sử dụng công cụ | Quy trình làm việc tác tử, gọi công cụ, thực thi tác vụ terminal |
| Triển khai | API, MiniMax Code, Token Plan, bản phát hành open-weight sắp ra mắt |
| Hỗ trợ đa phương thức | Tiền huấn luyện đa phương thức gốc ngay từ bước đầu |
| Ngày phát hành | Tháng 6 năm 2026 |
MiniMax M3 là gì?
MiniMax M3 là một mô hình AI ở quy mô tiên phong, được thiết kế xoay quanh ba năng lực vốn trước đây chủ yếu giới hạn ở các hệ thống đóng nguồn: hiệu năng lập trình nâng cao, xử lý ngữ cảnh hàng triệu token, và khả năng hiểu đa phương thức gốc. Khác với các mô hình bổ sung thị giác như một phần mở rộng về sau, M3 được huấn luyện như một mô hình đa phương thức ngay từ đầu, cho phép căn chỉnh sâu hơn giữa lập luận thị giác và văn bản.
Mô hình được xây dựng trên MiniMax Sparse Attention (MSA), một kiến trúc chú ý thưa được thiết kế để làm cho ngữ cảnh hàng triệu token khả thi về mặt tính toán đồng thời vẫn giữ vững hiệu năng trong các tác vụ lập trình, suy luận và tác tử.
Tính năng chính của MiniMax M3
- Cửa sổ ngữ cảnh 1M-token: Hỗ trợ các kho mã cực lớn, tập hợp tư liệu nghiên cứu dài, phân tích đa tài liệu và các phiên tác tử kéo dài.
- Kiến trúc định hướng tác tử: Được thiết kế cho tự động phân rã nhiệm vụ, gọi công cụ, lập kế hoạch lặp và thực thi nhiều bước.
- Đa phương thức gốc: Xử lý văn bản, hình ảnh, sơ đồ, ảnh chụp màn hình và video mà không cần một ngăn xếp thị giác tách biệt.
- Khả năng lập trình nâng cao: Hiệu năng mạnh trên các benchmark kỹ nghệ phần mềm bao gồm SWE-Bench Pro, Terminal-Bench và KernelBench.
- Thực thi tầm dài: Đã chứng minh các quy trình tự động kéo dài nhiều giờ, bao gồm tái hiện nghiên cứu và các dự án tối ưu hóa CUDA.
- Suy luận có thể cấu hình: Có thể bật chế độ suy nghĩ cho khối lượng suy luận sâu hơn hoặc tắt để có độ trễ thấp hơn.
Hiệu năng benchmark của MiniMax M3
MiniMax báo cáo các kết quả benchmark cấp độ tiên phong trên các tác vụ lập trình, thực thi tác tử và đánh giá đa phương thức. Các kết quả được báo cáo gồm:
| Benchmark | Điểm |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Công ty cũng báo cáo rằng M3 vượt GPT-5.5 và Gemini 3.1 Pro trên một số benchmark định hướng lập trình, đồng thời tiệm cận hiệu năng của Claude Opus 4.7 trong một số đánh giá chọn lọc. Các tuyên bố này xuất phát từ công bố benchmark nội bộ của MiniMax và nên được diễn giải cùng với các thử nghiệm độc lập từ bên thứ ba khi có sẵn.
Kiến trúc ngữ cảnh dài và MSA
MiniMax Sparse Attention (MSA) là đổi mới kiến trúc đằng sau khả năng ngữ cảnh hàng triệu token của M3. Thay vì áp dụng chú ý bậc hai đầy đủ trên toàn bộ chuỗi, MSA thực hiện định tuyến cấp khối và chú ý thưa trên các vùng ngữ cảnh được chọn.
Theo MiniMax, cách tiếp cận này giảm đáng kể yêu cầu tính toán ở độ dài ngữ cảnh lớn và mang lại:
- Hiệu suất prefill nhanh hơn trên 9× tại độ dài ngữ cảnh 1M
- Hiệu suất giải mã nhanh hơn trên 15×
- Xấp xỉ 1/20 chi phí tính toán trên mỗi token so với thế hệ trước ở quy mô ngữ cảnh 1M
Các cải tiến này nhằm biến lập trình ở quy mô kho mã và các quy trình tác tử tầm dài trở nên khả thi.
MiniMax M3 so với Claude Opus 4.7 và Gemini 3.1 Pro
| Năng lực | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Cửa sổ ngữ cảnh | Lên đến 1M | Các bậc ngữ cảnh công khai nhỏ hơn | Đa phương thức ngữ cảnh lớn |
| Huấn luyện đa phương thức gốc | Có | Có | Có |
| Trọng tâm lập trình tác tử | Rất mạnh | Rất mạnh | Mạnh |
| SWE-Bench Pro | 59.0% | Cao hơn theo báo cáo của MiniMax | Thấp hơn theo báo cáo của MiniMax |
| Khả dụng open-weight | Đã lên kế hoạch | Không | Không |
| Quy trình tác tử tầm dài | Trọng tâm thiết kế chính | Mạnh | Mạnh |
Hạn chế đã biết
- Phần lớn công bố benchmark hiện đến từ MiniMax thay vì các phòng thí nghiệm đánh giá độc lập.
- Tệp mô hình open-weight và báo cáo kỹ thuật đầy đủ đã được công bố nhưng chưa được phát hành rộng rãi tại thời điểm ra mắt.
- Độ tin cậy trong thực tế trên các môi trường sản xuất vẫn đang được cộng đồng nhà phát triển thẩm định.
- Khối lượng công việc ngữ cảnh hàng triệu token có thể phát sinh chi phí vận hành và độ trễ cao hơn so với các khối lượng suy luận tiêu chuẩn.
Trường hợp sử dụng tiêu biểu
Kỹ nghệ phần mềm ở quy mô kho mã
Phân tích các codebase lớn, thực hiện tái cấu trúc nhiều tệp, tạo bản vá, rà soát pull request và duy trì ngữ cảnh phát triển dài hạn.
Tác tử nghiên cứu tự động
Hỗ trợ tổng quan tài liệu, tổng hợp tài liệu, phân tích benchmark và các quy trình nghiên cứu chạy dài cần hàng trăm nghìn token.
Phân tích kỹ thuật đa phương thức
Diễn giải ảnh chụp màn hình, sơ đồ kiến trúc, biểu đồ, tài liệu kỹ thuật và nội dung video trong cùng một quy trình suy luận.
Tự động hóa Terminal và DevOps
Thực thi các quy trình kỹ thuật phức tạp bao gồm kiểm thử, điều phối triển khai, quản lý phụ thuộc và gỡ lỗi lặp.
Hệ thống tri thức doanh nghiệp
Tìm kiếm và suy luận trên các tập hợp lớn về chính sách, hợp đồng, tài liệu kỹ thuật và kho tri thức nội bộ.
Phiên bản mô hình và tính khả dụng
MiniMax M3 được giới thiệu chính thức vào Tháng 6 năm 2026 như người kế nhiệm chủ lực trong dòng mô hình MiniMax. Mô hình khả dụng thông qua hệ sinh thái MiniMax API và CometAPI.