Tekniske specifikationer for MiniMax M3
| Punkt | MiniMax M3 |
|---|---|
| Modelfamilie | MiniMax M3 frontier foundation model |
| Udbyder | MiniMax |
| Arkitektur | MiniMax Sparse Attention (MSA) |
| Inputtyper | Tekst, billede, video |
| Outputtyper | Tekst |
| Kontekstvindue | Op til 1,000,000 tokens (minimum garanteret 512K) |
| Primære styrker | Kodning, agentiske arbejdsgange, multimodal ræsonnering, langkontekst-behandling |
| Ræsonneringstilstand | Tænketilstand til/fra |
| Værktøjsanvendelse | Agent-arbejdsgange, værktøjskald, udførelse af terminalopgaver |
| Udrulning | API, MiniMax Code, Token Plan, kommende open-weight-udgivelse |
| Multimodal understøttelse | Naturlig multimodal fortræning fra første trin |
| Udgivelsesdato | juni 2026 |
Hvad er MiniMax M3?
MiniMax M3 er en AI-model i frontier-skala, designet omkring tre kapabiliteter, der historisk har været begrænset til lukkede kildekodesystemer: avanceret kodeydeevne, million-token-kontekstbehandling og naturlig multimodal forståelse. I modsætning til modeller, der tilføjer vision som en senere udvidelse, blev M3 trænet som en multimodal model fra begyndelsen, hvilket muliggør en dybere tilpasning mellem visuel og tekstuel ræsonnering.
Modellen er bygget på MiniMax Sparse Attention (MSA), en arkitektur med sparsom opmærksomhed, der er designet til at gøre million-token-kontekster beregningsmæssigt praktiske, samtidig med at ydeevnen på kodning, ræsonnering og agentiske opgaver bevares.
Hovedfunktioner i MiniMax M3
- 1M-token kontekstvindue: Understøtter ekstremt store repositories, omfattende forskningskorpora, multidokumentanalyse og langvarige agentsessioner.
- Agent-orienteret arkitektur: Designet til autonom opgaveopdeling, værktøjskald, iterativ planlægning og flertrins-udførelse.
- Naturlig multimodalitet: Behandler tekst, billeder, diagrammer, skærmbilleder og video-input uden at være afhængig af en separat vision-komponent.
- Avanceret kodeydeevne: Stærk ydeevne på softwareingeniør-benchmarks, herunder SWE-Bench Pro, Terminal-Bench og KernelBench.
- Langhorisont-udførelse: Demonstrerede fler-timers autonome arbejdsgange, inklusive reproduktion af forskning og CUDA-optimeringsprojekter.
- Konfigurerbar ræsonnering: Tænketilstand kan aktiveres for dybere ræsonneringsarbejdsbelastninger eller deaktiveres for lavere latenstid.
Benchmark-ydeevne for MiniMax M3
MiniMax rapporterer benchmarkresultater på frontier-niveau på tværs af kodning, agentisk udførelse og multimodale evalueringer. Rapporterede resultater omfatter:
| Benchmark | Score |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Virksomheden rapporterer også, at M3 overgår GPT-5.5 og Gemini 3.1 Pro på flere kodeorienterede benchmarks, samtidig med at den nærmer sig Claude Opus 4.7 i udvalgte evalueringer. Disse påstande stammer fra MiniMax' interne benchmark-offentliggørelser og bør tolkes sammen med uafhængige tredjepartstests, efterhånden som de bliver tilgængelige.
Langkontekst-arkitektur og MSA
MiniMax Sparse Attention (MSA) er den arkitektoniske innovation bag M3's million-token-kontekstkapacitet. I stedet for at anvende fuld kvadratisk opmærksomhed over hele sekvensen udfører MSA routing på blokniveau og sparsom opmærksomhed over udvalgte kontekstområder.
Ifølge MiniMax reducerer dette beregningskravene betydeligt ved store kontekster og leverer:
- Mere end 9× hurtigere prefill-ydeevne ved 1M kontekstlængde
- Mere end 15× hurtigere dekoderingsydeevne
- Omtrent 1/20 af forrige generations per-token-beregning ved 1M kontekstskala
Disse forbedringer har til formål at gøre kodning i repository-skala og langhorisont-agentarbejdsgange praktiske.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Funktion | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Kontekstvindue | Op til 1M | Mindre offentligt tilgængelige kontekstniveauer | Stor-kontekst multimodal |
| Naturlig multimodal træning | Ja | Ja | Ja |
| Agentisk kodefokus | Meget stærk | Meget stærk | Stærk |
| SWE-Bench Pro | 59.0% | Højere ifølge MiniMax' rapportering | Lavere ifølge MiniMax' rapportering |
| Open-weight-tilgængelighed | Planlagt | Nej | Nej |
| Langhorisont agent-arbejdsgange | Centralt designfokus | Stærk | Stærk |
Kendte begrænsninger
- De fleste benchmark-offentliggørelser kommer i øjeblikket fra MiniMax snarere end uafhængige evalueringslaboratorier.
- Open-weight model-filer og den fulde tekniske rapport blev annonceret, men var endnu ikke bredt frigivet ved lanceringen.
- Pålidelighed i virkelige produktionsmiljøer valideres stadig af udviklerfællesskabet.
- Million-token-kontekst-arbejdsbelastninger kan medføre højere driftsomkostninger og latenstid end standard inferens-arbejdsbelastninger.
Repræsentative anvendelsestilfælde
Softwareudvikling i repository-skala
Analysér store kodebaser, udfør refaktorisering på tværs af flere filer, generér patches, gennemgå pull requests og oprethold langsigtet udviklingskontekst.
Autonome forskningsagenter
Understøt litteraturgennemgang, dokumentsyntese, benchmarkanalyse og langvarige forskningsarbejdsgange, der kræver hundredtusinder af tokens.
Multimodal teknisk analyse
Fortolk skærmbilleder, arkitekturdiagrammer, grafer, tekniske dokumenter og videoinhold i samme ræsonneringsarbejdsgang.
Terminal- og DevOps-automatisering
Udfør komplekse ingeniørarbejdsgange, der omfatter test, udrulningsorkestrering, afhængighedsstyring og iterativ fejlsøgning.
Virksomhedsvidenssystemer
Søg i og ræsonnér over store samlinger af politikker, kontrakter, teknisk dokumentation og interne vidensarkiver.
Modelversion og tilgængelighed
MiniMax M3 blev officielt introduceret i juni 2026 som flagskibsefterfølgeren i MiniMax-modellinjen. Modellen er tilgængelig gennem MiniMax API-økosystemet og CometAPI.