API Minimax M2

CometAPI
AnnaOct 28, 2025
API Minimax M2

MiniMax M2 là một mã nguồn mở, tác nhân gốc mô hình ngôn ngữ lớn (LLM) được MiniMax phát hành vào ngày 27 Tháng Mười . Nó được thiết kế rõ ràng cho mã hóaquy trình làm việc của agentic (gọi công cụ, tự động hóa nhiều bước), ưu tiên độ trễ thấpchi phí-hiệu quả phục vụ trong khi cung cấp khả năng lập luận mạnh mẽ và sử dụng công cụ.

Đặc tính nổi bật

Điểm nổi bật - chuyên môn hóa mã hóa, quy trình làm việc của agentic, dấu chân tham số hoạt động thấp, hỗ trợ ngữ cảnh dài, API tương thích với OpenAI. Vị trí MiniMax Minimax M2 như là một mô hình MoE nhanh chóng, dễ triển khai dành cho các tác nhân nhiều bước, tạo và sửa mã, quy trình làm việc của thiết bị đầu cuối/IDE và gọi công cụ.

Những viên đạn đáng chú ý (nhanh):

  • Kiến trúc: Hỗn hợp chuyên gia (MoE) với tổng số tham số rất lớn và một kích hoạt tham số được đặt cho mỗi lần chuyển tiếp.
  • Dấu chân kích hoạt: ~10 tỷ tham số hoạt động (mỗi mã thông báo).
  • Tổng số tham số (đã báo cáo): được báo cáo giữa ~200B – 230B tùy thuộc vào nguồn/số liệu (xem Chi tiết kỹ thuật).
  • Cửa sổ ngữ cảnh: bối cảnh dài hạn ở quy mô doanh nghiệp; 204,800 mã thông báo ngữ cảnh tối đa.
  • Phương thức chính: văn bản (hỗ trợ gọi công cụ/gọi hàm).
  • Đại lý bản địa: được thiết kế để gọi công cụ nhiều bước (shell, trình duyệt, trình thông dịch python, công cụ MCP).
  • Tập trung mã hóa: được tối ưu hóa cho việc chỉnh sửa nhiều tệp, vòng lặp chạy-sửa lỗi và tác vụ CI/IDE.

Chi tiết kỹ thuật (kiến trúc & thông số kỹ thuật)

Ngành kiến ​​​​trúc - Hỗn hợp chuyên gia (MoE): Minimax M2 API sử dụng chiến lược MoE để mô hình có thể có tổng số tham số rất lớn trong khi chỉ kích hoạt một phần nhỏ cho mỗi bước suy luận. Điều này mang lại cải thiện tính toán hiệu quả, thông lượngchi phí cho mỗi mã thông báo cho tác nhân tương tác và vòng lặp mã hóa.

Độ chính xác và lượng tử hóa — các tệp mô hình và danh sách ngăn xếp nhà cung cấp định dạng FP32/BF16 và FP8 và nhiều bản dựng lượng tử (safetensor, FP8/E4M3, v.v.), cho phép triển khai cục bộ và đánh đổi hiệu quả.

Bối cảnh & I/O — các nhà cung cấp được triển khai xuất bản Mã thông báo 204,800 hỗ trợ ngữ cảnh và cài đặt đầu ra tối đa lớn. M2 là chỉ có văn bản hiện tại (nhiều bản phát hành có trọng lượng mở từ Trung Quốc đã nhấn mạnh vào khả năng văn bản/tác nhân trong khi đa phương thức vẫn là lĩnh vực của các bản phát hành khác).

Khuyến nghị về thời gian chạy / hướng dẫn đặc biệt — Minimax M2 API sử dụng một “suy nghĩ đan xen” định dạng đầu ra bao gồm lý luận nội bộ của mô hình trong <think>...</think> khối. Yêu cầu của MiniMax giữ nguyên nội dung suy nghĩ đó và truyền lại trong bối cảnh lịch sử để duy trì hiệu suất cho quy trình làm việc của tác nhân nhiều lượt.

Hiệu suất điểm chuẩn

Điểm chuẩn tổng hợp về trí thông minh và tác nhân — báo cáo đánh giá độc lập của Artificial Analysis cho thấy MiniMax-M2 đạt Chỉ số thông minh tốt nhất trong số các mẫu xe có trọng lượng mởvà xếp hạng trong số các mô hình nguồn mở hàng đầu về các số liệu thống kê trí thông minh tổng hợp, đặc biệt là trong sử dụng công cụ, hướng dẫn sau đây và nhiệm vụ của tác nhân. Phân tích nhân tạo làm nổi bật mô hình hiệu quả (rất ít tham số hoạt động) là động lực chính cho thứ hạng của nó.

API Minimax M2

Minimax M2  chương trình kết quả mạnh mẽ về mã hóa và bộ tác nhân (các loại tác vụ Terminal-Bench, SWE-Bench, BrowseComp, LiveCodeBench), trong đó kiến ​​trúc và ngân sách kích hoạt ưu tiên các vòng lặp lập kế hoạch → hành động → xác minh (chu trình biên dịch/chạy/kiểm tra, chỉnh sửa nhiều tệp và chuỗi công cụ).

API Minimax M2

So sánh: MiniMax M2 với các mẫu máy hiện đại khác

So với các đối thủ có trọng số mở (DeepSeek, Qwen3, Kimi, v.v.) — Minimax M2  được trình bày như đặc biệt hiệu quả trên ngân sách tham số hoạt động (≈10B) mang lại tỷ lệ thông minh trên mỗi tham số hoạt động cao; các mô hình mở khác có thể có số lượng tham số hoạt động cao hơn nhưng tổng tham số tương tự hoặc cao hơn.

Chống lại các mô hình biên giới thương mại (OpenAI / Anthropic / Google / xAI) — báo cáo địa điểm M2 dưới những mô hình thương mại hàng đầu về một số số liệu tổng quát nhưng cạnh tranh hoặc tiến bộ trên nhiều tiêu chuẩn về đại lý và mã hóa cho mức giá của nó.

Sự đánh đổi giữa chi phí và tốc độ — Chi phí cho mỗi mã thông báo chỉ bằng 8% so với Anthropic Claude Sonnet và tốc độ nhanh gấp khoảng hai lần.

Hạn chế và rủi ro

Hạn chế — tính dài dòng (sử dụng mã thông báo cao), chế độ chỉ văn bản, điểm yếu cụ thể của nhiệm vụvà các rủi ro thường gặp của LLM (ảo giác, tự tin thái quá, sai lệch dữ liệu). Phân tích Nhân tạo và MiniMax đều chỉ ra rằng M2 có thể hoạt động kém hiệu quả hơn một số mô hình tổng quát lớn trong một số tác vụ mở, ngay cả khi nó vượt trội trong các quy trình làm việc về tác nhân và mã hóa. Vì dựa trên MoE, cân nhắc triển khai (các khuôn khổ định tuyến, lượng tử hóa và suy luận của chuyên gia) rất quan trọng.

Những lưu ý khi vận hành — Minimax M2 'S suy nghĩ đan xen định dạng yêu cầu giữ lại đặc biệt <think>...</think> mã thông báo trong lịch sử để có hiệu suất tốt nhất; việc xóa nội dung đó có thể làm giảm hành vi của tác nhân. Ngoài ra, vì Minimax M2  rất dài dòng, chi phí cho mỗi nhiệm vụ là một hàm của cả hai giá mỗi tokentổng số mã thông báo được tạo ra.

Các trường hợp sử dụng chính

  • Điều phối tác nhân & quy trình làm việc dài — chuỗi công cụ nhiều bước, duyệt→truy xuất→thực hiện chu kỳ, khôi phục lỗikhả năng truy xuất bằng chứng trong các lần chạy tác nhân.
  • Trợ lý lập trình và năng suất của nhà phát triển — vòng lặp biên dịch-chạy-kiểm tra, chỉnh sửa nhiều tệp, sửa chữa đã được kiểm tra xác nhậnTích hợp IDE (Có các ví dụ về CLI Claude Code, Cursor, Codex, Grok).
  • Đội tàu tác nhân thông lượng cao / bot sản xuất — Ở đâu chi phí cho mỗi suy luậnđồng thời Vấn đề là, dấu chân tham số kích hoạt thấp của M2 có thể giảm chi phí cơ sở hạ tầng.

Cách gọi Minimax M2  API từ CometAPI

minimax-m2 Giá API trong CometAPI,giảm giá 20% so với giá chính thức:

  • Mã thông báo đầu vào: 0.24 triệu mã thông báo
  • Mã thông báo đầu ra: 0.96 đô la/M mã thông báo

Các bước cần thiết

  • Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước.
  • Đăng nhập vào Bảng điều khiển CometAPI.
  • Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.

API Minimax M2

Phương pháp sử dụng

  1. Chọn điểm cuối "minimax-m2" để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
  2. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận được câu trả lời đã tạo.

CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:

Tích hợp API & Ví dụ

Dưới đây là một Python đoạn mã minh họa cách gọi GLM‑4.6 thông qua API của CometAPI. Thay thế <API_KEY> và <PROMPT> phù hợp:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "minimax-m2",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Xem thêm Claude Haiku 4.5 API

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%