Spesifikasi teknikal MiniMax‑M2.5
| Medan | Tuntutan / nilai |
|---|---|
| Nama model | MiniMax-M2.5 (keluaran produksi, 12 Feb, 2026). |
| Seni bina | Transformer Mixture-of-Experts (MoE) (keluarga M2). |
| Jumlah parameter | ~230 bilion (kapasiti MoE keseluruhan). |
| Parameter aktif (setiap inferens) | ~10 bilion diaktifkan bagi setiap inferens (pengaktifan jarang). |
| Jenis input | Teks dan kod (sokongan asli untuk konteks kod berbilang fail), pemanggilan alat / antara muka alat API (alur kerja beragen). |
| Jenis output | Teks, output berstruktur (JSON/panggilan alat), kod (berbilang fail), artifak Office (PPT/Excel/Word melalui rantaian alat). |
| Varian / mod | M2.5 (ketepatan/keupayaan tinggi) dan M2.5-Lightning (kualiti sama, latensi lebih rendah / TPS lebih tinggi). |
Apakah MiniMax‑M2.5?
MiniMax‑M2.5 ialah kemas kini perdana keluarga M2.x yang memfokus pada produktiviti dunia sebenar dan alur kerja beragen. Keluaran ini menekankan penambahbaikan penguraian tugas, integrasi carian/alat, ketepatan penjanaan kod, dan kecekapan token untuk masalah berlanjutan berbilang langkah. Model ini ditawarkan dalam varian standard dan varian “lightning” latensi lebih rendah bagi pertukaran keperluan penggunaan yang berbeza.
Ciri utama MiniMax‑M2.5
- Reka bentuk beragen sebagai keutamaan: Perancangan dan orkestrasi alat yang dipertingkat untuk tugas berbilang peringkat (carian, panggilan alat, rangka pelaksanaan kod).
- Kecekapan token: Pengurangan penggunaan token per tugas berbanding M2.1 yang dilaporkan, membolehkan kos hujung-ke-hujung lebih rendah untuk alur kerja panjang.
- Penyempurnaan hujung-ke-hujung lebih pantas: Laporan penanda aras penyedia menunjukkan masa penyiapan tugas purata ~37% lebih pantas berbanding M2.1 dalam penilaian pengkodan beragen.
- Kefahaman kod yang kukuh: Ditala pada korpus kod pelbagai bahasa untuk refaktor rentas bahasa yang mantap, suntingan berbilang fail, dan penaakulan skala repositori.
- Perkhidmatan ber-throughput tinggi: Disasarkan untuk penerapan produksi dengan profil token/saat yang tinggi; sesuai untuk beban kerja agen berterusan.
- Varian untuk kompromi latensi vs. kuasa: M2.5‑lightning menawarkan latensi lebih rendah dengan pengkomputeran dan jejak lebih kecil untuk senario interaktif.
Prestasi penanda aras (dilaporkan)
Sorotan dilaporkan penyedia — metrik perwakilan (keluaran):
- SWE‑Bench Verified: 80.2% (kadar lulus yang dilaporkan pada rangka penanda aras penyedia)
- BrowseComp (carian & penggunaan alat): 76.3%
- Multi‑SWE‑Bench (pengkodan pelbagai bahasa): 51.3%
- Kelajuan / kecekapan relatif: ~37% lebih pantas penyempurnaan hujung-ke-hujung berbanding M2.1 pada SWE‑Bench Verified dalam ujian penyedia; ~20% kurang pusingan carian/alat dalam beberapa penilaian.
Tafsiran: Angka ini meletakkan M2.5 setara atau hampir setara dengan model agen/kod terkemuka industri pada penanda aras yang disebut. Penanda aras dilaporkan oleh penyedia dan diulang oleh beberapa pihak ekosistem — anggap ia diukur di bawah rangka/konfigurasi penyedia melainkan diulang secara bebas.
MiniMax‑M2.5 vs rakan sebaya (perbandingan ringkas)
| Dimensi | MiniMax‑M2.5 | MiniMax M2.1 | Contoh rakan sebaya (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (berubah mengikut rangka) | Setanding (Opus dilapor keputusan hampir teratas) |
| Kelajuan tugas beragen | 37% lebih pantas vs M2.1 (ujian penyedia) | Asas | Kelajuan serupa pada rangka tertentu |
| Kecekapan token | Dipertingkat berbanding M2.1 (~token lebih rendah per tugas) | Penggunaan token lebih tinggi | Berdaya saing |
| Kegunaan terbaik | Alur kerja beragen produksi, saluran pengkodan | Generasi terdahulu keluarga sama | Kuat dalam penaakulan multimodal dan tugas ditala keselamatan |
Nota penyedia: perbandingan berpunca daripada bahan keluaran dan laporan penanda aras vendor. Perbezaan kecil boleh sensitif kepada rangka, rantaian alat, dan protokol penilaian.
Kes penggunaan perusahaan yang mewakili
- Refaktor skala repositori & saluran migrasi — mengekalkan niat merentas suntingan berbilang fail dan tampalan PR automatik.
- Orkestrasi beragen untuk DevOps — mengorkestrakan larian ujian, langkah CI, pemasangan pakej, dan diagnostik persekitaran dengan integrasi alat.
- Semakan kod automatik & pemulihan — menilai dan mengutamakan kelemahan keselamatan, mencadangkan pembaikan minimum, dan menyediakan kes ujian yang boleh dihasilkan semula.
- Pengambilan maklumat didorong carian — memanfaatkan kecekapan carian setaraf BrowseComp untuk melakukan penerokaan berbilang pusingan dan pemeringkasan pangkalan pengetahuan teknikal.
- Agen & pembantu produksi — agen berterusan yang memerlukan inferens jangka panjang yang stabil dan kos efektif.
Cara mengakses dan mengintegrasikan MiniMax‑M2.5
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kunci API bukti kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
Langkah 2: Hantar Permintaan ke API minimax-m2.5
Pilih titik akhir “minimax-m2.5” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Tempat untuk memanggilnya: format Chat.
Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan membalas dengan status tugas dan data output.