Technische specificaties van MiniMax M3
| Kenmerk | MiniMax M3 |
|---|---|
| Modelfamilie | MiniMax M3 voorhoede-basismodel |
| Aanbieder | MiniMax |
| Architectuur | MiniMax Sparse Attention (MSA) |
| Invoertypen | Tekst, Afbeelding, Video |
| Uitvoertypen | Tekst |
| Contextvenster | Tot 1,000,000 tokens (minimaal gegarandeerd 512K) |
| Belangrijkste sterke punten | Coderen, agentgerichte workflows, multimodale redenering, verwerking van lange contexten |
| Redeneermodus | Denkmodus aan/uit |
| Toolgebruik | Agent-workflows, toolaanroepen, uitvoering van terminaltaken |
| Inzet | API, MiniMax Code, Token Plan, aankomende open-weight-release |
| Multimodale ondersteuning | Native multimodale pretraining vanaf stap nul |
| Releasedatum | Juni 2026 |
Wat is MiniMax M3?
MiniMax M3 is een AI-model op voorhoedeschaal, ontworpen rond drie mogelijkheden die historisch gezien beperkt waren tot closed-source systemen: geavanceerde codeerprestaties, miljoen-token contextverwerking en native multimodaal begrip. In tegenstelling tot modellen die vision later als uitbreiding toevoegen, is M3 vanaf het begin getraind als een multimodaal model, waardoor een diepere afstemming tussen visuele en tekstuele redenering mogelijk is.
Het model is gebouwd op MiniMax Sparse Attention (MSA), een sparse-attention-architectuur die is ontworpen om miljoentoken-contexten computationeel haalbaar te maken, terwijl de prestaties bij coderen, redeneren en agenttaken behouden blijven.
Belangrijkste kenmerken van MiniMax M3
- 1M-token contextvenster: Ondersteunt extreem grote repositories, omvangrijke onderzoeks-corpora, multidocumentanalyse en langdurige agentsessies.
- Agentgerichte architectuur: Ontworpen voor autonome taakdecompositie, toolaanroepen, iteratieve planning en uitvoering in meerdere stappen.
- Native multimodaliteit: Verwerkt tekst, afbeeldingen, diagrammen, screenshots en videoinvoer zonder te steunen op een aparte vision-stack.
- Geavanceerde codeercapaciteit: Sterke prestaties op software-engineeringbenchmarks, waaronder SWE-Bench Pro, Terminal-Bench en KernelBench.
- Uitvoering met lange horizon: Aangetoonde autonome workflows van meerdere uren, waaronder reproductie van onderzoek en CUDA-optimalisatieprojecten.
- Configureerbare redenering: De denkmodus kan worden ingeschakeld voor zwaardere redeneerworkloads of uitgeschakeld voor interacties met lagere latentie.
Benchmarkprestaties van MiniMax M3
MiniMax rapporteert benchmarkresultaten op voorhoedeniveau over coderen, agentische uitvoering en multimodale evaluatietaken. Gerapporteerde resultaten omvatten:
| Benchmark | Score |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Het bedrijf meldt tevens dat M3 GPT-5.5 en Gemini 3.1 Pro overtreft op verschillende op codering gerichte benchmarks, terwijl het in geselecteerde evaluaties de prestaties van Claude Opus 4.7 benadert. Deze claims zijn afkomstig uit MiniMax’ interne benchmarkpublicaties en dienen te worden geïnterpreteerd in samenhang met onafhankelijke tests door derden zodra deze beschikbaar komen.
Lange-contextarchitectuur en MSA
MiniMax Sparse Attention (MSA) is de architecturale innovatie achter de miljoentoken-contextcapaciteit van M3. In plaats van volledige kwadratische attention toe te passen over de hele sequentie, voert MSA routering op blokniveau en sparse attention uit over geselecteerde contextgebieden.
Volgens MiniMax vermindert dit de rekenvereisten aanzienlijk bij grote contextlengtes en levert het:
- Meer dan 9× snellere prefill-prestaties bij een contextlengte van 1M
- Meer dan 15× snellere decodeerprestaties
- Ongeveer 1/20 van de rekenkosten per token van de vorige generatie op 1M-contextschaal
Deze verbeteringen zijn bedoeld om coderen op repository-schaal en agentworkflows met lange horizon praktisch te maken.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Capaciteit | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Contextvenster | Tot 1M | Kleinere publiek beschikbare contextniveaus | Multimodaal met grote context |
| Native multimodale training | Ja | Ja | Ja |
| Agentgerichte focus op coderen | Zeer sterk | Zeer sterk | Sterk |
| SWE-Bench Pro | 59.0% | Hoger volgens rapportage van MiniMax | Lager volgens rapportage van MiniMax |
| Open-weight-beschikbaarheid | Gepland | Nee | Nee |
| Agentworkflows met lange horizon | Belangrijk ontwerpdoel | Sterk | Sterk |
Bekende beperkingen
- De meeste benchmarkpublicaties zijn momenteel afkomstig van MiniMax en niet van onafhankelijke evaluatielabs.
- Open-weight-modelbestanden en het volledige technische rapport zijn aangekondigd, maar waren bij lancering nog niet breed beschikbaar gesteld.
- Betrouwbaarheid in de praktijk, over productieomgevingen heen, wordt nog gevalideerd door de ontwikkelaarsgemeenschap.
- Werkbelastingen met miljoentoken-context kunnen hogere operationele kosten en latentie met zich meebrengen dan standaard inferentiewerkbelastingen.
Representatieve gebruiksscenario’s
Software-engineering op repositoryschaal
Analyseer grote codebases, voer refactors over meerdere bestanden uit, genereer patches, review pull requests en behoud langdurige ontwikkelingscontext.
Autonome onderzoeksagenten
Ondersteun literatuurstudie, documentsynthese, benchmarkanalyse en langlopende onderzoeksworkflows die honderdduizenden tokens vereisen.
Multimodale technische analyse
Interpreteer screenshots, architectuurdiagrammen, grafieken, technische documenten en videocontent binnen dezelfde redeneerworkflow.
Automatisering voor terminal en DevOps
Voer complexe engineeringworkflows uit met testen, deployment-orkestratie, afhankelijkheidsbeheer en iteratieve debugging.
Enterprise-kennissystemen
Zoek en redeneer over grote collecties beleid, contracten, technische documentatie en interne kennisrepositories.
Modelversie en beschikbaarheid
MiniMax M3 werd in juni 2026 officieel geïntroduceerd als de vlaggenschipopvolger binnen de MiniMax-modellijn. Het model is beschikbaar via het MiniMax API-ecosysteem en CometAPI.