Thông số kỹ thuật của MiniMax‑M2.5
| Trường | Tuyên bố / giá trị |
|---|---|
| Tên mô hình | MiniMax-M2.5 (bản phát hành sản xuất, 12 Tháng 2, 2026). |
| Kiến trúc | Mixture-of-Experts (MoE) Transformer (họ M2). |
| Tổng số tham số | ~230 tỷ (tổng dung lượng MoE). |
| Tham số hoạt động (mỗi lần suy luận) | ~10 tỷ tham số được kích hoạt mỗi lần suy luận (kích hoạt thưa). |
| Các loại đầu vào | Văn bản và mã (hỗ trợ gốc bối cảnh mã nhiều tệp), gọi công cụ / giao diện công cụ API (quy trình dạng tác tử). |
| Các loại đầu ra | Văn bản, đầu ra có cấu trúc (JSON/gọi công cụ), mã (nhiều tệp), tài liệu Office (PPT/Excel/Word qua chuỗi công cụ). |
| Biến thể / chế độ | M2.5 (độ chính xác/năng lực cao) và M2.5‑Lightning (chất lượng tương đương, độ trễ thấp hơn / TPS cao hơn). |
MiniMax‑M2.5 là gì?
MiniMax‑M2.5 là bản cập nhật hàng đầu của dòng M2.x, tập trung vào năng suất trong thế giới thực và các quy trình dạng tác tử. Bản phát hành nhấn mạnh cải thiện phân rã nhiệm vụ, tích hợp công cụ/tìm kiếm, độ trung thực trong sinh mã và hiệu quả token cho các bài toán kéo dài, nhiều bước. Mô hình được cung cấp dưới dạng tiêu chuẩn và biến thể “lightning” độ trễ thấp hơn, nhằm phục vụ các đánh đổi triển khai khác nhau.
Các tính năng chính của MiniMax‑M2.5
- Thiết kế ưu tiên tác tử: Lập kế hoạch và điều phối công cụ được cải thiện cho nhiệm vụ nhiều giai đoạn (tìm kiếm, gọi công cụ, khung thực thi mã).
- Hiệu quả token: Giảm lượng token tiêu thụ mỗi tác vụ so với M2.1, giúp giảm chi phí đầu-cuối cho các quy trình dài.
- Hoàn tất đầu‑cuối nhanh hơn: Báo cáo đo chuẩn từ nhà cung cấp cho thấy thời gian hoàn thành trung bình nhanh hơn ~37% so với M2.1 trong các đánh giá lập trình dạng tác tử.
- Khả năng hiểu mã mạnh mẽ: Được tinh chỉnh trên tập dữ liệu mã đa ngôn ngữ để thực hiện tái cấu trúc xuyên ngôn ngữ, chỉnh sửa nhiều tệp và lập luận ở quy mô kho mã.
- Phục vụ thông lượng cao: Nhắm tới triển khai sản xuất với hồ sơ token/giây cao; phù hợp cho khối lượng công việc tác tử liên tục.
- Biến thể cân bằng giữa độ trễ và hiệu năng: M2.5‑lightning mang lại độ trễ thấp hơn với chi phí và footprint thấp cho các kịch bản tương tác.
Hiệu năng điểm chuẩn (được báo cáo)
Điểm nổi bật do nhà cung cấp báo cáo — các chỉ số đại diện (bản phát hành):
- SWE‑Bench Verified: 80.2% (tỷ lệ vượt qua được báo cáo trên bộ khung điểm chuẩn của nhà cung cấp)
- BrowseComp (tìm kiếm & sử dụng công cụ): 76.3%
- Multi‑SWE‑Bench (lập trình đa ngôn ngữ): 51.3%
- Tốc độ / hiệu quả tương đối: ~37% nhanh hơn hoàn tất đầu‑cuối so với M2.1 trên SWE‑Bench Verified trong thử nghiệm của nhà cung cấp; ~20% ít vòng tìm kiếm/gọi công cụ hơn trong một số đánh giá.
Diễn giải: Những con số này đặt M2.5 ngang bằng hoặc tiệm cận các mô hình agentic/mã hàng đầu ngành trên các điểm chuẩn được dẫn. Các điểm chuẩn do nhà cung cấp báo cáo và được một số kênh trong hệ sinh thái tái hiện — hãy coi chúng được đo dưới bộ khung/cấu hình của nhà cung cấp trừ khi được tái hiện độc lập.
MiniMax‑M2.5 so với đối thủ (so sánh ngắn gọn)
| Khía cạnh | MiniMax‑M2.5 | MiniMax M2.1 | Ví dụ đối thủ (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (thay đổi theo bộ khung) | Tương đương (Opus được báo cáo đạt kết quả gần đầu bảng) |
| Tốc độ tác vụ tác tử | Nhanh hơn 37% so với M2.1 (thử nghiệm nhà cung cấp) | Mốc cơ sở | Tốc độ tương tự trên một số bộ khung cụ thể |
| Hiệu quả token | Cải thiện so với M2.1 (~ít token mỗi tác vụ) | Dùng nhiều token hơn | Cạnh tranh |
| Mục đích phù hợp nhất | Quy trình tác tử sản xuất, pipeline lập trình | Thế hệ trước cùng họ | Mạnh về lập luận đa phương thức và các tác vụ được điều chỉnh về an toàn |
Lưu ý từ nhà cung cấp: các so sánh bắt nguồn từ tài liệu phát hành và báo cáo điểm chuẩn của nhà cung cấp. Những khác biệt nhỏ có thể nhạy cảm với bộ khung, chuỗi công cụ và giao thức đánh giá.
Tình huống sử dụng tiêu biểu cho doanh nghiệp
- Tái cấu trúc ở quy mô kho và pipeline di trú — bảo toàn ý đồ xuyên suốt các chỉnh sửa nhiều tệp và các bản vá PR tự động.
- Điều phối dạng tác tử cho DevOps — điều phối chạy thử nghiệm, bước CI, cài đặt gói và chẩn đoán môi trường với tích hợp công cụ.
- Kiểm tra mã & khắc phục tự động — phân loại lỗ hổng, đề xuất bản sửa tối thiểu và chuẩn bị các trường hợp kiểm thử có thể tái hiện.
- Truy xuất thông tin dựa trên tìm kiếm — tận dụng năng lực tìm kiếm mức BrowseComp để thực hiện khám phá nhiều vòng và tóm tắt các kho tri thức kỹ thuật.
- Tác tử và trợ lý trong môi trường sản xuất — tác tử liên tục cần suy luận dài hạn ổn định, hiệu quả chi phí.
Cách truy cập và tích hợp MiniMax‑M2.5
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API minimax-m2.5
Chọn endpoint “minimax-m2.5” để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn thuận tiện. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. Gọi ở đâu: định dạng Chat.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.