Technische Spezifikationen von MiniMax M3
| Parameter | MiniMax M3 |
|---|---|
| Modellfamilie | MiniMax M3 Frontier-Grundlagenmodell |
| Anbieter | MiniMax |
| Architektur | MiniMax Sparse Attention (MSA) |
| Eingabetypen | Text, Bild, Video |
| Ausgabetypen | Text |
| Kontextfenster | Bis zu 1,000,000 Token (mindestens garantiert 512K) |
| Primäre Stärken | Coding, agentenbasierte Workflows, multimodales Reasoning, Langkontext-Verarbeitung |
| Reasoning-Modus | Denkmodus an/aus |
| Tool-Nutzung | Agenten-Workflows, Tool-Aufrufe, Terminal-Aufgabenausführung |
| Bereitstellung | API, MiniMax Code, Token Plan, bevorstehende Open-Weight-Veröffentlichung |
| Multimodale Unterstützung | Natives multimodales Vortraining ab Schritt Null |
| Veröffentlichungsdatum | Juni 2026 |
Was ist MiniMax M3?
MiniMax M3 ist ein KI-Modell im Frontier-Maßstab, das auf drei Fähigkeiten ausgerichtet ist, die historisch auf Closed-Source-Systeme beschränkt waren: fortgeschrittene Coding-Leistung, Verarbeitung von Million-Token-Kontexten und natives multimodales Verständnis. Im Gegensatz zu Modellen, die Vision später als Erweiterung hinzufügen, wurde M3 von Beginn an als multimodales Modell trainiert, was eine tiefere Abstimmung zwischen visuellem und textbasiertem Reasoning ermöglicht.
Das Modell basiert auf MiniMax Sparse Attention (MSA), einer Sparse-Attention-Architektur, die Million-Token-Kontexte rechnerisch praktikabel machen soll, während die Leistung bei Coding-, Reasoning- und agentenbasierten Aufgaben erhalten bleibt.
Hauptfunktionen von MiniMax M3
- 1M-Token-Kontextfenster: Unterstützt äußerst große Repositories, umfangreiche Forschungskorpora, Multidokument-Analysen und lang laufende Agentensitzungen.
- Agentenorientierte Architektur: Konzipiert für autonome Aufgabenzerlegung, Tool-Aufrufe, iterative Planung und mehrstufige Ausführung.
- Native Multimodalität: Verarbeitet Text, Bilder, Diagramme, Screenshots und Videoeingaben ohne separaten Vision-Stack.
- Erweiterte Coding-Fähigkeiten: Starke Leistung auf Software-Engineering-Benchmarks wie SWE-Bench Pro, Terminal-Bench und KernelBench.
- Ausführung über lange Horizonte: Nachgewiesene mehrstündige autonome Workflows, darunter Reproduktionsstudien und CUDA-Optimierungsprojekte.
- Konfigurierbares Reasoning: Denkmodus kann für tiefere Reasoning-Workloads aktiviert oder für Interaktionen mit niedrigerer Latenz deaktiviert werden.
Benchmark-Leistung von MiniMax M3
MiniMax berichtet von Benchmark-Ergebnissen auf Frontier-Niveau in den Bereichen Coding, agentische Ausführung und multimodale Evaluierung. Gemeldete Ergebnisse umfassen:
| Benchmark | Punktzahl |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Das Unternehmen berichtet außerdem, dass M3 GPT-5.5 und Gemini 3.1 Pro auf mehreren coding-orientierten Benchmarks übertrifft und sich in ausgewählten Evaluierungen der Leistung von Claude Opus 4.7 annähert. Diese Aussagen stammen aus internen Benchmark-Offenlegungen von MiniMax und sollten im Kontext unabhängiger Drittanbieter-Tests interpretiert werden, sobald diese verfügbar sind.
Langkontext-Architektur und MSA
MiniMax Sparse Attention (MSA) ist die architektonische Innovation hinter der Million-Token-Kontextfähigkeit von M3. Anstatt über die gesamte Sequenz volle quadratische Attention anzuwenden, führt MSA Block-Routing und Sparse Attention über ausgewählte Kontextbereiche aus.
Laut MiniMax senkt dies die Rechenanforderungen bei großen Kontextlängen erheblich und bietet:
- Mehr als 9× schnellere Prefill-Leistung bei 1M-Kontextlänge
- Mehr als 15× schnellere Decoding-Leistung
- Etwa 1/20 des pro-Token-Rechenaufwands der vorherigen Generation im 1M-Kontextmaßstab
Diese Verbesserungen sollen Coding im Repository-Maßstab und agentenbasierte Workflows mit langem Horizont praktikabel machen.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Fähigkeit | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Kontextfenster | Bis zu 1M | Kleinere öffentlich verfügbare Kontextstufen | Großkontext-multimodal |
| Natives multimodales Training | Ja | Ja | Ja |
| Fokus auf agentenbasiertes Coding | Sehr stark | Sehr stark | Stark |
| SWE-Bench Pro | 59.0% | Höher laut MiniMax-Berichten | Niedriger laut MiniMax-Berichten |
| Open-Weight-Verfügbarkeit | Geplant | Nein | Nein |
| Agenten-Workflows mit langem Zeithorizont | Zentraler Designfokus | Stark | Stark |
Bekannte Einschränkungen
- Die meisten Benchmark-Offenlegungen stammen derzeit von MiniMax und nicht von unabhängigen Evaluationslaboren.
- Open-Weight-Modelldateien und der vollständige technische Bericht wurden angekündigt, waren zum Start jedoch noch nicht breit verfügbar.
- Die Zuverlässigkeit in realen Produktionsumgebungen wird noch von der Entwicklergemeinschaft validiert.
- Workloads mit Million-Token-Kontext können höhere Betriebskosten und Latenzen verursachen als Standard-Inferenz-Workloads.
Repräsentative Anwendungsfälle
Softwareentwicklung im Repository-Maßstab
Große Codebasen analysieren, Multi-Datei-Refactorings durchführen, Patches generieren, Pull Requests reviewen und langfristigen Entwicklungskontext bewahren.
Autonome Forschungsagenten
Literaturrecherche, Dokumentsynthese, Benchmark-Analysen und lang laufende Forschungs-Workflows mit Hunderttausenden von Token unterstützen.
Multimodale technische Analyse
Screenshots, Architekturdiagramme, Diagramme, technische Dokumente und Videoinhalte im selben Reasoning-Workflow interpretieren.
Terminal- und DevOps-Automatisierung
Komplexe Engineering-Workflows ausführen, die Tests, Bereitstellungsorchestrierung, Abhängigkeitsmanagement und iteratives Debugging umfassen.
Wissenssysteme für Unternehmen
In großen Sammlungen von Richtlinien, Verträgen, technischer Dokumentation und internen Wissens-Repositorien suchen und darüber schlussfolgern.
Modellversion und Verfügbarkeit
MiniMax M3 wurde im Juni 2026 offiziell als Flaggschiff-Nachfolger innerhalb der MiniMax-Modellreihe vorgestellt. Das Modell ist über das MiniMax-API-Ökosystem und CometAPI verfügbar.