Spesifikasi teknikal MiniMax‑M2.5
| Field | Claim / value |
|---|---|
| Nama model | MiniMax-M2.5 (keluaran pengeluaran, 12 Feb 2026). |
| Seni bina | Transformer Mixture-of-Experts (MoE) (keluarga M2). |
| Jumlah parameter | ~230 bilion (jumlah kapasiti MoE). |
| Parameter aktif (setiap inferens) | ~10 bilion diaktifkan bagi setiap inferens (pengaktifan jarang). |
| Jenis input | Teks dan kod (sokongan asli untuk konteks kod berbilang fail), tool-calling / antara muka alat API (aliran kerja agentik). |
| Jenis output | Teks, output berstruktur (JSON/panggilan alat), kod (berbilang fail), artifak Office (PPT/Excel/Word melalui rantaian alat). |
| Varian / mod | M2.5 (ketepatan/keupayaan tinggi) dan M2.5-Lightning (kualiti sama, kependaman lebih rendah / TPS lebih tinggi). |
Apakah MiniMax‑M2.5?
MiniMax‑M2.5 ialah kemas kini utama keluarga M2.x yang memfokuskan pada produktiviti dunia sebenar dan aliran kerja agentik. Keluaran ini menekankan penguraian tugas yang dipertingkatkan, integrasi alat/carian, ketepatan penjanaan kod, dan kecekapan token untuk masalah berbilang langkah yang panjang. Model ini ditawarkan dalam varian standard dan varian “lightning” berkependaman lebih rendah yang ditujukan untuk pertukaran penggunaan yang berbeza.
Ciri utama MiniMax‑M2.5
- Reka bentuk agentik-dahulu: Perancangan dan orkestrasi alat yang dipertingkatkan untuk tugasan berperingkat (carian, panggilan alat, harness pelaksanaan kod).
- Kecekapan token: Pengurangan yang dilaporkan dalam penggunaan token bagi setiap tugasan berbanding M2.1, membolehkan kos hujung-ke-hujung yang lebih rendah untuk aliran kerja yang panjang.
- Penyelesaian hujung-ke-hujung yang lebih pantas: Penanda aras penyedia melaporkan purata masa penyelesaian tugasan ~37% lebih pantas daripada M2.1 pada penilaian pengekodan agentik.
- Pemahaman kod yang kukuh: Ditala pada korpus kod berbilang bahasa untuk refaktor rentas bahasa yang mantap, suntingan berbilang fail, dan penaakulan pada skala repositori.
- Penyajian berthroughput tinggi: Disasarkan untuk penggunaan pengeluaran dengan profil token/saat yang tinggi; sesuai untuk beban kerja ejen berterusan.
- Varian untuk pertukaran kependaman vs. kuasa: M2.5‑lightning menawarkan kependaman lebih rendah pada pengiraan dan jejak yang lebih rendah untuk senario interaktif.
Prestasi penanda aras (dilaporkan)
Sorotan yang dilaporkan penyedia — metrik wakil (keluaran):
- SWE‑Bench Verified: 80.2% (kadar lulus yang dilaporkan pada harness penanda aras penyedia)
- BrowseComp (carian & penggunaan alat): 76.3%
- Multi‑SWE‑Bench (pengekodan berbilang bahasa): 51.3%
- Kelajuan / kecekapan relatif: ~37% lebih pantas dalam penyelesaian hujung-ke-hujung berbanding M2.1 pada SWE‑Bench Verified dalam ujian penyedia; ~20% lebih sedikit pusingan carian/alat dalam sesetengah penilaian.
Tafsiran: Angka-angka ini meletakkan M2.5 setara atau hampir dengan model agentik/kod terkemuka industri pada penanda aras yang disebut. Penanda aras ini dilaporkan oleh penyedia dan dihasilkan semula oleh beberapa saluran ekosistem — anggap ia diukur di bawah harness/konfigurasi penyedia melainkan dihasilkan semula secara bebas.
MiniMax‑M2.5 berbanding pesaing (perbandingan ringkas)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | Peer example (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (berbeza mengikut harness) | Setanding (Opus dilaporkan hampir keputusan tertinggi) |
| Kelajuan tugasan agentik | 37% lebih pantas berbanding M2.1 (ujian penyedia) | Garis dasar | Kelajuan serupa pada harness tertentu |
| Kecekapan token | Dipertingkatkan berbanding M2.1 (~token lebih rendah setiap tugasan) | Penggunaan token lebih tinggi | Kompetitif |
| Kegunaan terbaik | Aliran kerja agentik pengeluaran, saluran pengekodan | Generasi terdahulu keluarga yang sama | Kuat dalam penaakulan multimodal dan tugasan yang ditala keselamatan |
Nota penyedia: perbandingan diperoleh daripada bahan keluaran dan laporan penanda aras vendor. Perbezaan kecil boleh sensitif kepada harness, rantaian alat, dan protokol penilaian.
Kes penggunaan perusahaan yang mewakili
- Refaktor skala repositori & saluran migrasi — mengekalkan niat merentas suntingan berbilang fail dan tampalan PR automatik.
- Orkestrasi agentik untuk DevOps — mengorkestrasi larian ujian, langkah CI, pemasangan pakej, dan diagnostik persekitaran dengan integrasi alat.
- Semakan kod automatik & pemulihan — menriage kerentanan, mencadangkan pembaikan minimum, dan menyediakan kes ujian yang boleh dihasilkan semula.
- Perolehan maklumat dipacu carian — memanfaatkan kecekapan carian tahap BrowseComp untuk melaksanakan penerokaan berbilang pusingan dan peringkasan pangkalan pengetahuan teknikal.
- Ejen & pembantu pengeluaran — ejen berterusan yang memerlukan inferens jangka panjang yang stabil dan cekap kos.
Cara mengakses dan mengintegrasikan MiniMax‑M2.5
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke Konsol CometAPI anda. Dapatkan kelayakan akses kunci API bagi antara muka tersebut. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke API minimax-m2.5
Pilih endpoint “minimax-m2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumentasi API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Tempat untuk memanggilnya: format Chat.
Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan diberikan respons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API memberikan respons dengan status tugasan dan data output.