Spesifikasi Teknikal MiniMax M3
| Item | MiniMax M3 |
|---|---|
| Model family | MiniMax M3 frontier foundation model |
| Provider | MiniMax |
| Architecture | MiniMax Sparse Attention (MSA) |
| Input types | Teks, Imej, Video |
| Output types | Teks |
| Context window | Sehingga 1,000,000 token (minimum dijamin 512K) |
| Primary strengths | Pengaturcaraan, aliran kerja agen, penaakulan multimodal, pemprosesan konteks panjang |
| Reasoning mode | Mod pemikiran boleh dihidupkan/dimatikan |
| Tool use | Aliran kerja agen, pemanggilan alat, pelaksanaan tugas terminal |
| Deployment | API, MiniMax Code, Token Plan, keluaran open-weight akan datang |
| Multimodal support | Pra-latihan multimodal asli dari langkah sifar |
| Release date | Jun 2026 |
Apakah MiniMax M3?
MiniMax M3 ialah model AI skala frontier yang direka sekitar tiga keupayaan yang secara sejarahnya terhad kepada sistem sumber tertutup: prestasi pengaturcaraan lanjutan, pemprosesan konteks sejuta token, dan pemahaman multimodal asli. Tidak seperti model yang menambah visi sebagai lanjutan kemudian, M3 dilatih sebagai model multimodal sejak awal, membolehkan penjajaran yang lebih mendalam antara penaakulan visual dan tekstual.
Model ini dibina berasaskan MiniMax Sparse Attention (MSA), sebuah seni bina perhatian jarang yang direka untuk menjadikan konteks sejuta token praktikal dari segi pengiraan sambil mengekalkan prestasi pada tugas pengaturcaraan, penaakulan, dan agen.
Ciri Utama MiniMax M3
- Tetingkap konteks 1M token: Menyokong repositori yang sangat besar, korpus penyelidikan yang panjang, analisis berbilang dokumen, dan sesi agen jangka panjang.
- Seni bina berorientasikan agen: Direka untuk penguraian tugas autonomi, pemanggilan alat, perancangan berulang, dan pelaksanaan berbilang langkah.
- Multimodal asli: Memproses input teks, imej, rajah, tangkapan skrin, dan video tanpa bergantung pada timbunan visi berasingan.
- Keupayaan pengaturcaraan lanjutan: Prestasi kukuh pada penanda aras kejuruteraan perisian termasuk SWE-Bench Pro, Terminal-Bench, dan KernelBench.
- Pelaksanaan jangka panjang: Menunjukkan aliran kerja autonomi berbilang jam termasuk replikasi penyelidikan dan projek pengoptimuman CUDA.
- Penaakulan boleh dikonfigurasikan: Mod pemikiran boleh diaktifkan untuk beban kerja penaakulan yang lebih mendalam atau dinyahaktifkan untuk interaksi berpendam rendah.
Prestasi Penanda Aras MiniMax M3
MiniMax melaporkan keputusan penanda aras pada peringkat frontier merentas tugas pengaturcaraan, pelaksanaan berasaskan agen, dan penilaian multimodal. Keputusan yang dilaporkan termasuk:
| Benchmark | Skor |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Syarikat itu juga melaporkan bahawa M3 mengatasi GPT-5.5 dan Gemini 3.1 Pro pada beberapa penanda aras berorientasikan pengaturcaraan sambil menghampiri prestasi Claude Opus 4.7 dalam penilaian terpilih. Dakwaan ini berpunca daripada pendedahan penanda aras dalaman MiniMax dan harus ditafsirkan bersama ujian pihak ketiga bebas apabila tersedia.
Seni Bina Konteks Panjang dan MSA
MiniMax Sparse Attention (MSA) ialah inovasi seni bina di sebalik keupayaan konteks sejuta token M3. Daripada menggunakan perhatian kuadratik penuh merentas keseluruhan jujukan, MSA melaksanakan penghalaan peringkat blok dan perhatian jarang ke atas wilayah konteks terpilih.
Menurut MiniMax, ini mengurangkan keperluan pengiraan dengan ketara pada panjang konteks yang besar dan memberikan:
- Lebih 9× prestasi prefill yang lebih pantas pada panjang konteks 1M
- Lebih 15× prestasi penyahkodan yang lebih pantas
- Kira-kira 1/20 pengiraan per token generasi sebelumnya pada skala konteks 1M
Penambahbaikan ini bertujuan untuk menjadikan pengaturcaraan skala repositori dan aliran kerja agen jangka panjang lebih praktikal.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Keupayaan | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Tetingkap Konteks | Sehingga 1M | Lapisan konteks tersedia umum yang lebih kecil | Multimodal konteks besar |
| Latihan Multimodal Asli | Ya | Ya | Ya |
| Fokus Pengkodan Agen | Sangat kuat | Sangat kuat | Kuat |
| SWE-Bench Pro | 59.0% | Lebih tinggi menurut pelaporan MiniMax | Lebih rendah menurut pelaporan MiniMax |
| Ketersediaan Open-Weight | Dirancang | Tidak | Tidak |
| Aliran Kerja Agen Jangka Panjang | Fokus reka bentuk utama | Kuat | Kuat |
Batasan yang Diketahui
- Kebanyakan pendedahan penanda aras pada masa ini datang daripada MiniMax dan bukan makmal penilaian bebas.
- Fail model open-weight dan laporan teknikal penuh telah diumumkan tetapi belum dikeluarkan secara meluas semasa pelancaran.
- Kebolehpercayaan dunia sebenar merentas persekitaran produksi masih dalam proses pengesahan oleh komuniti pembangun.
- Beban kerja konteks sejuta token mungkin menyebabkan kos operasi dan kependaman yang lebih tinggi berbanding beban kerja inferens standard.
Kes Penggunaan Representatif
Kejuruteraan Perisian Skala Repositori
Menganalisis pangkalan kod besar, melakukan refaktor berbilang fail, menjana tampalan, menyemak permintaan tarik, dan mengekalkan konteks pembangunan jangka panjang.
Agen Penyelidikan Autonomi
Menyokong ulasan literatur, sintesis dokumen, analisis penanda aras, dan aliran kerja penyelidikan jangka panjang yang memerlukan ratusan ribu token.
Analisis Teknikal Multimodal
Mentafsir tangkapan skrin, rajah seni bina, carta, dokumen teknikal, dan kandungan video dalam aliran penaakulan yang sama.
Automasi Terminal dan DevOps
Melaksanakan aliran kerja kejuruteraan yang kompleks melibatkan pengujian, orkestrasi penyebaran, pengurusan kebergantungan, dan penyahpepijatan iteratif.
Sistem Pengetahuan Perusahaan
Mencari dan menalar ke atas koleksi besar polisi, kontrak, dokumentasi teknikal, dan repositori pengetahuan dalaman.
Versi Model dan Ketersediaan
MiniMax M3 diperkenalkan secara rasmi pada Jun 2026 sebagai pengganti utama dalam barisan model MiniMax. Model ini tersedia melalui ekosistem API MiniMax dan CometAPI.