Tekniske spesifikasjoner for MiniMax M3
| Punkt | MiniMax M3 |
|---|---|
| Modellfamilie | MiniMax M3 frontier-grunnmodell |
| Leverandør | MiniMax |
| Arkitektur | MiniMax Sparse Attention (MSA) |
| Inndatatyper | Tekst, Bilde, Video |
| Utdata-typer | Tekst |
| Kontekstvindu | Opptil 1,000,000 tokens (minimum garantert 512K) |
| Primære styrker | Koding, agentiske arbeidsflyter, multimodal resonnering, langkontekstbehandling |
| Resonneringsmodus | Tenkemodus på/av |
| Verktøybruk | Agent-arbeidsflyter, verktøykall, utførelse av terminal-oppgaver |
| Distribusjon | API, MiniMax Code, Token Plan, kommende open-weight-utgivelse |
| Multimodal støtte | Nativ multimodal forhåndstrening fra steg null |
| Lanseringsdato | Juni 2026 |
Hva er MiniMax M3?
MiniMax M3 er en AI-modell i frontier-skala, designet rundt tre kapabiliteter som historisk har vært begrenset til lukkede systemer: avansert kodeytelse, million-token kontekstbehandling og nativ multimodal forståelse. I motsetning til modeller som legger til visuell forståelse som en senere utvidelse, ble M3 trent som en multimodal modell fra starten av, noe som muliggjør dypere samsvar mellom visuell og tekstlig resonnering.
Modellen er bygget på MiniMax Sparse Attention (MSA), en sparse-attention-arkitektur designet for å gjøre million-token-kontekster beregningsmessig praktiske, samtidig som ytelsen på koding, resonnering og agentiske oppgaver bevares.
Hovedfunksjoner i MiniMax M3
- 1M-token-kontekstvindu: Støtter svært store repositorier, omfattende forskningskorpora, multidokumentanalyse og langvarige agentsesjoner.
- Agent-orientert arkitektur: Designet for autonom oppgavedekomponering, verktøykall, iterativ planlegging og flerstegsutførelse.
- Nativ multimodalitet: Behandler tekst, bilder, diagrammer, skjermbilder og video-inndata uten å være avhengig av en separat visjonsstakk.
- Avanserte kodeferdigheter: Sterk ytelse på programvareingeniør-benchmarker, inkludert SWE-Bench Pro, Terminal-Bench og KernelBench.
- Lang-horisont-utførelse: Dokumenterte autonome arbeidsflyter over flere timer, inkludert reproduksjon av forskning og CUDA-optimaliseringsprosjekter.
- Konfigurerbar resonnering: Tenkemodus kan aktiveres for dypere resonneringsarbeidslaster eller deaktiveres for lavere latens i interaksjoner.
Benchmark-ytelse for MiniMax M3
MiniMax rapporterer benchmark-resultater på frontier-nivå innen koding, agentisk utførelse og multimodale evalueringer. Rapporterte resultater inkluderer:
| Benchmark | Poengsum |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Selskapet rapporterer også at M3 overgår GPT-5.5 og Gemini 3.1 Pro på flere kodeorienterte benchmarks, samtidig som den nærmer seg ytelsen til Claude Opus 4.7 i utvalgte evalueringer. Disse påstandene stammer fra MiniMax' interne benchmark-offentliggjøringer og bør tolkes sammen med uavhengig tredjepartstesting etter hvert som den blir tilgjengelig.
Langkontekst-arkitektur og MSA
MiniMax Sparse Attention (MSA) er den arkitektoniske innovasjonen bak M3s million-token-kontekstevne. I stedet for å bruke full kvadratisk oppmerksomhet over hele sekvensen, utfører MSA ruting på blokknivå og sparsom oppmerksomhet over utvalgte kontekstområder.
Ifølge MiniMax reduserer dette beregningskravene betydelig ved store kontekstlengder og gir:
- Mer enn 9× raskere prefill-ytelse ved 1M kontekstlengde
- Mer enn 15× raskere dekoderingsytelse
- Omtrent 1/20 av forrige generasjons beregning per token ved 1M kontekstskala
Disse forbedringene er ment å gjøre koding i repositorie-skala og agent-arbeidsflyter med lang horisont praktiske.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Kapasitet | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Kontekstvindu | Opptil 1M | Mindre offentlig tilgjengelige kontekstnivåer | Stor-kontekst multimodal |
| Nativ multimodal opplæring | Ja | Ja | Ja |
| Agentisk koding-fokus | Svært sterk | Svært sterk | Sterk |
| SWE-Bench Pro | 59.0% | Høyere ifølge MiniMax-rapportering | Lavere ifølge MiniMax-rapportering |
| Tilgjengelighet av open-weight | Planlagt | Nei | Nei |
| Agent-arbeidsflyter med lang horisont | Hovedfokus i design | Sterk | Sterk |
Kjente begrensninger
- De fleste benchmark-offentliggjøringer kommer for øyeblikket fra MiniMax snarere enn fra uavhengige evalueringslaboratorier.
- Open-weight-modellfiler og den fullstendige tekniske rapporten ble annonsert, men var ennå ikke bredt utgitt ved lansering.
- Reell pålitelighet på tvers av produksjonsmiljøer valideres fortsatt av utviklerfellesskapet.
- Arbeidslaster med million-token-kontekst kan medføre høyere driftskostnader og latens enn standard inferens-arbeidslaster.
Representative bruksområder
Programvareutvikling i repositorie-skala
Analyser store kodebaser, utfør refaktoriseringer over flere filer, generer patcher, gjennomgå pull requests og oppretthold langsiktig utviklingskontekst.
Autonome forskningsagenter
Støtt litteraturgjennomgang, dokumentsyntese, benchmark-analyse og langvarige forskningsarbeidsflyter som krever hundretusener av tokens.
Multimodal teknisk analyse
Tolk skjermbilder, arkitekturdiagrammer, diagrammer, tekniske dokumenter og videoinnhold innenfor samme resonneringsarbeidsflyt.
Terminal- og DevOps-automatisering
Utfør komplekse ingeniørarbeidsflyter som involverer testing, distribusjonsorkestrering, avhengighetsstyring og iterativ feilsøking.
Kunnskapssystemer for virksomheter
Søk og resonner over store samlinger av retningslinjer, kontrakter, teknisk dokumentasjon og interne kunnskapsrepositorier.
Modellversjon og tilgjengelighet
MiniMax M3 ble offisielt introdusert i Juni 2026 som flaggskip-etterfølgeren i MiniMax-modellserien. Modellen er tilgjengelig gjennom MiniMax API-økosystemet og CometAPI.