Home/Models/MiniMax/MiniMax M2.5
M

MiniMax M2.5

Đầu vào:$0.24/M
Đầu ra:$0.96/M
MiniMax-M2.5 là một mô hình ngôn ngữ lớn SOTA được thiết kế cho năng suất trong thế giới thực. Được huấn luyện trong nhiều môi trường làm việc số phức tạp đa dạng của thế giới thực, M2.5 phát triển dựa trên chuyên môn lập trình của M2.1 để mở rộng sang công việc văn phòng nói chung, đạt mức thành thạo trong việc tạo và thao tác với các tệp Word, Excel và Powerpoint, chuyển đổi ngữ cảnh giữa các môi trường phần mềm đa dạng, và làm việc xuyên suốt giữa các nhóm tác tử và con người khác nhau.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

Thông số kỹ thuật của MiniMax‑M2.5

TrườngTuyên bố / giá trị
Tên mô hìnhMiniMax‑M2.5 (bản phát hành sản xuất, 12 tháng 2, 2026).
Kiến trúcTransformer Mixture‑of‑Experts (MoE) (họ M2).
Tổng số tham số~230 tỷ (tổng dung lượng MoE).
Tham số hoạt động (mỗi lần suy luận)~10 tỷ được kích hoạt mỗi lần suy luận (kích hoạt thưa).
Loại đầu vàoVăn bản và mã (hỗ trợ gốc bối cảnh mã đa tệp), gọi công cụ / giao diện công cụ API (quy trình tác tử).
Loại đầu raVăn bản, đầu ra có cấu trúc (JSON/lời gọi công cụ), mã (đa tệp), tạo phẩm Office (PPT/Excel/Word qua chuỗi công cụ).
Biến thể / chế độM2.5 (độ chính xác/năng lực cao) và M2.5‑Lightning (chất lượng tương đương, độ trễ thấp hơn / TPS cao hơn).

MiniMax‑M2.5 là gì?

MiniMax‑M2.5 là bản cập nhật chủ lực của họ M2.x, tập trung vào năng suất trong thực tế và các quy trình tác tử. Bản phát hành nhấn mạnh cải thiện phân rã nhiệm vụ, tích hợp công cụ/tìm kiếm, độ trung thực trong sinh mã và hiệu quả sử dụng token cho các bài toán mở rộng, nhiều bước. Mô hình được cung cấp dưới dạng biến thể tiêu chuẩn và biến thể “lightning” độ trễ thấp hơn, nhằm phục vụ các đánh đổi triển khai khác nhau.


Tính năng chính của MiniMax‑M2.5

  1. Thiết kế ưu tiên tác tử: Cải thiện lập kế hoạch và điều phối công cụ cho các tác vụ nhiều giai đoạn (tìm kiếm, gọi công cụ, khung thực thi mã).
  2. Hiệu quả token: Giảm mức tiêu thụ token trên mỗi tác vụ so với M2.1 (theo báo cáo), giúp giảm chi phí đầu‑cuối cho các quy trình dài.
  3. Hoàn thành đầu‑cuối nhanh hơn: Báo cáo đo chuẩn của nhà cung cấp cho thấy thời gian hoàn thành tác vụ trung bình nhanh hơn ~37% so với M2.1 trên các bài đánh giá mã hóa kiểu tác tử.
  4. Hiểu mã mạnh: Được tinh chỉnh trên kho mã đa ngôn ngữ để hỗ trợ tái cấu trúc xuyên ngôn ngữ, chỉnh sửa đa tệp và lập luận ở quy mô kho mã.
  5. Phục vụ thông lượng cao: Nhắm đến triển khai sản xuất với hồ sơ token/giây cao; phù hợp với tải tác vụ tác tử liên tục.
  6. Biến thể cân bằng độ trễ và năng lực: M2.5‑Lightning mang lại độ trễ thấp hơn với nhu cầu tính toán và dấu chân hệ thống nhỏ hơn cho các tình huống tương tác.

Hiệu năng đo chuẩn (được báo cáo)

Điểm nổi bật do nhà cung cấp báo cáo — các chỉ số đại diện (bản phát hành):

  • SWE‑Bench Verified: 80.2% (tỷ lệ đạt trên khung đo chuẩn của nhà cung cấp)
  • BrowseComp (tìm kiếm & sử dụng công cụ): 76.3%
  • Multi‑SWE‑Bench (mã hóa đa ngôn ngữ): 51.3%
  • Tốc độ / hiệu quả tương đối: ~37% nhanh hơn về hoàn thành đầu‑cuối so với M2.1 trên SWE‑Bench Verified trong các thử nghiệm của nhà cung cấp; ~20% ít vòng tìm kiếm/gọi công cụ hơn trong một số đánh giá.

Diễn giải: Những con số này đặt M2.5 ngang bằng hoặc tiệm cận các mô hình tác tử/mã hàng đầu ngành trên các bộ đo chuẩn được dẫn. Các đo chuẩn do nhà cung cấp báo cáo và được một số kênh trong hệ sinh thái tái hiện — hãy coi chúng được đo dưới khung/cấu hình của nhà cung cấp trừ khi được tái lập độc lập.


MiniMax‑M2.5 so với đối thủ (so sánh ngắn gọn)

Khía cạnhMiniMax‑M2.5MiniMax M2.1Ví dụ đối thủ (Anthropic Opus 4.6)
SWE‑Bench Verified80.2%~71–76% (thay đổi theo khung đo)Tương đương (Opus báo cáo kết quả gần dẫn đầu)
Tốc độ tác vụ kiểu tác tửNhanh hơn 37% so với M2.1 (thử nghiệm của nhà cung cấp)Mốc tham chiếuTốc độ tương tự trên một số khung đo cụ thể
Hiệu quả tokenCải thiện so với M2.1 (~ít token hơn mỗi tác vụ)Dùng nhiều token hơnCạnh tranh
Trường hợp dùng tốt nhấtQuy trình tác tử sản xuất, pipeline mã hóaThế hệ trước của cùng họMạnh về lập luận đa phương thức và các tác vụ được tinh chỉnh an toàn

Ghi chú từ nhà cung cấp: so sánh dựa trên tài liệu phát hành và báo cáo đo chuẩn của nhà cung cấp. Chênh lệch nhỏ có thể nhạy với bộ khung, chuỗi công cụ và giao thức đánh giá.

Trường hợp sử dụng doanh nghiệp tiêu biểu

  1. Tái cấu trúc quy mô kho mã & pipeline di trú — bảo toàn ý đồ xuyên suốt chỉnh sửa đa tệp và các bản vá PR tự động.
  2. Điều phối kiểu tác tử cho DevOps — điều phối chạy kiểm thử, các bước CI, cài đặt gói và chẩn đoán môi trường với tích hợp công cụ.
  3. Duyệt mã & khắc phục tự động — phân loại lỗ hổng, đề xuất bản sửa tối thiểu và chuẩn bị ca kiểm thử có thể tái tạo.
  4. Truy xuất thông tin định hướng tìm kiếm — tận dụng năng lực tìm kiếm cấp BrowseComp để thực hiện khám phá nhiều vòng và tóm tắt các kho tri thức kỹ thuật.
  5. Tác tử & trợ lý sản xuất — tác tử liên tục cần suy luận dài hạn ổn định, hiệu quả chi phí.

Cách truy cập và tích hợp MiniMax‑M2.5

Bước 1: Đăng ký API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API minimax-m2.5

Chọn endpoint “minimax-m2.5” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế trong tài khoản của bạn. Nơi gọi: định dạng Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là phần mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Câu hỏi thường gặp

What kind of tasks is MiniMax-M2.5 optimized for?

MiniMax-M2.5 được tối ưu cho năng suất trong thế giới thực và các quy trình tác tử — đặc biệt là lập trình phức tạp, lập kế hoạch nhiều giai đoạn, gọi công cụ, tìm kiếm và phát triển hệ thống đa nền tảng. Việc huấn luyện của nó nhấn mạnh khả năng xử lý toàn bộ vòng đời phát triển từ lập kế hoạch kiến trúc đến xem xét mã và kiểm thử.

How does MiniMax-M2.5 compare to previous versions like M2.1?

So với M2.1, M2.5 cho thấy những cải thiện đáng kể về phân rã nhiệm vụ, hiệu quả token và tốc độ — ví dụ hoàn thành một số benchmark tác tử nhanh hơn khoảng 37% và tiêu thụ ít token hơn cho mỗi nhiệm vụ.

What benchmarks does MiniMax-M2.5 achieve on coding and agentic tasks?

M2.5 đạt khoảng 80.2% trên SWE-Bench Verified, khoảng 51.3% trên Multi-SWE-Bench và khoảng 76.3% trên BrowseComp trong các bối cảnh có bật lập kế hoạch nhiệm vụ và tìm kiếm — các kết quả có tính cạnh tranh với các mô hình hàng đầu từ các nhà cung cấp khác.

Does MiniMax-M2.5 support multiple programming languages?

Có — M2.5 được huấn luyện trên hơn 10 ngôn ngữ lập trình bao gồm Python, Java, Rust, Go, TypeScript, C/C++, Ruby và Dart, cho phép nó xử lý đa dạng nhiệm vụ lập trình trên nhiều hệ sinh thái.

Is MiniMax-M2.5 suitable for full-stack and cross-platform development?

Có — MiniMax định vị M2.5 để xử lý các dự án full-stack trải rộng trên Web, Android, iOS, Windows và Mac, bao quát các giai đoạn thiết kế, triển khai, lặp và kiểm thử.

What are the main efficiency and cost advantages of MiniMax-M2.5?

M2.5 có thể chạy với thông lượng token cao (ví dụ, ~100 tokens/sec) với hiệu quả chi phí thấp hơn khoảng 10–20× so với nhiều mô hình tiên tiến xét theo giá đầu ra, cho phép triển khai các quy trình tác tử ở quy mô lớn.

How do I integrate MiniMax-M2.5 into my application?

MiniMax-M2.5 có sẵn thông qua các endpoint API (ví dụ, biến thể tiêu chuẩn và thông lượng cao) bằng cách chỉ định minimax-m2.5 là model trong các yêu cầu.

What are known limitations or ideal scenarios to avoid?

M2.5 vượt trội ở các nhiệm vụ lập trình và tác tử; nó có thể kém chuyên biệt hơn cho việc tạo nội dung tường thuật thuần túy so với các mô hình sáng tạo chuyên dụng, vì vậy với việc viết truyện hoặc hư cấu sáng tạo, các mô hình khác có thể phù hợp hơn.

Tính năng cho MiniMax M2.5

Khám phá các tính năng chính của MiniMax M2.5, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho MiniMax M2.5

Khám phá mức giá cạnh tranh cho MiniMax M2.5, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách MiniMax M2.5 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.24/M
Đầu ra:$0.96/M
Đầu vào:$0.3/M
Đầu ra:$1.2/M
-20%

Mã mẫu và API cho MiniMax M2.5

Truy cập mã mẫu toàn diện và tài nguyên API cho MiniMax M2.5 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của MiniMax M2.5 trong các dự án của mình.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Write a one-sentence introduction to MiniMax M2.5."},
    ],
)

print(completion.choices[0].message.content)

Thêm mô hình