Spécifications techniques de MiniMax M3
| Élément | MiniMax M3 |
|---|---|
| Famille de modèles | MiniMax M3 frontier foundation model |
| Fournisseur | MiniMax |
| Architecture | MiniMax Sparse Attention (MSA) |
| Types d'entrée | Text, Image, Video |
| Types de sortie | Text |
| Fenêtre de contexte | Up to 1,000,000 tokens (minimum guaranteed 512K) |
| Forces principales | Coding, agentic workflows, multimodal reasoning, long-context processing |
| Mode de raisonnement | Thinking on/off modes |
| Utilisation d’outils | Agent workflows, tool invocation, terminal-task execution |
| Déploiement | API, MiniMax Code, Token Plan, upcoming open-weight release |
| Prise en charge multimodale | Native multimodal pretraining from step zero |
| Date de sortie | June 2026 |
Qu’est-ce que MiniMax M3 ?
MiniMax M3 est un modèle d’IA de pointe conçu autour de trois capacités qui étaient historiquement limitées aux systèmes propriétaires : performances avancées en codage, traitement de contextes d’un million de tokens et compréhension multimodale native. Contrairement aux modèles qui ajoutent la vision comme une extension ultérieure, M3 a été entraîné comme un modèle multimodal dès le départ, permettant un alignement plus étroit entre le raisonnement visuel et textuel.
Le modèle est construit sur MiniMax Sparse Attention (MSA), une architecture d’attention clairsemée conçue pour rendre les contextes d’un million de tokens pratiquement exploitables sur le plan computationnel tout en préservant les performances en codage, raisonnement et tâches agentiques.
Principales fonctionnalités de MiniMax M3
- Fenêtre de contexte de 1M tokens : prend en charge des dépôts extrêmement volumineux, de longs corpus de recherche, l’analyse multi-documents et des sessions d’agent de longue durée.
- Architecture orientée agents : conçue pour la décomposition autonome des tâches, l’appel d’outils, la planification itérative et l’exécution multi-étapes.
- Multimodalité native : traite des textes, images, diagrammes, captures d’écran et vidéos sans s’appuyer sur une pile de vision séparée.
- Capacités avancées en codage : fortes performances sur des benchmarks d’ingénierie logicielle, notamment SWE-Bench Pro, Terminal-Bench et KernelBench.
- Exécution à long horizon : workflows autonomes de plusieurs heures démontrés, y compris la reproduction de résultats de recherche et des projets d’optimisation CUDA.
- Raisonnement configurable : le mode de réflexion peut être activé pour des charges de travail nécessitant un raisonnement plus profond ou désactivé pour des interactions à plus faible latence.
Performances de MiniMax M3 sur les benchmarks
MiniMax rapporte des résultats de niveau frontier sur des tâches d’évaluation en codage, exécution agentique et multimodalité. Les résultats rapportés incluent :
| Benchmark | Score |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
La société indique également que M3 dépasse GPT-5.5 et Gemini 3.1 Pro sur plusieurs benchmarks orientés codage tout en se rapprochant des performances de Claude Opus 4.7 dans certaines évaluations. Ces affirmations proviennent des divulgations internes de MiniMax sur les benchmarks et doivent être interprétées parallèlement aux tests indépendants de tiers dès qu’ils seront disponibles.
Architecture pour longs contextes et MSA
MiniMax Sparse Attention (MSA) est l’innovation architecturale derrière la capacité de M3 à gérer des contextes d’un million de tokens. Au lieu d’appliquer une attention quadratique complète sur l’ensemble de la séquence, MSA réalise un routage au niveau des blocs et une attention clairsemée sur des régions de contexte sélectionnées.
Selon MiniMax, cela réduit substantiellement les besoins de calcul sur de grandes longueurs de contexte et offre :
- Plus de 9× de performances de préremplissage à une longueur de contexte de 1M
- Plus de 15× de performances de décodage
- Environ 1/20 du calcul par token par rapport à la génération précédente à l’échelle 1M de contexte
Ces améliorations visent à rendre pratique le codage à l’échelle des dépôts et les workflows d’agents à long horizon.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Capacité | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Fenêtre de contexte | Up to 1M | Smaller publicly available context tiers | Large-context multimodal |
| Entraînement multimodal natif | Yes | Yes | Yes |
| Focalisation sur le codage agentique | Very strong | Very strong | Strong |
| SWE-Bench Pro | 59.0% | Higher according to MiniMax reporting | Lower according to MiniMax reporting |
| Disponibilité en poids ouverts | Planned | No | No |
| Workflows d’agents de longue durée | Major design focus | Strong | Strong |
Limites connues
- La plupart des divulgations de benchmarks proviennent actuellement de MiniMax plutôt que de laboratoires d’évaluation indépendants.
- Les fichiers de modèle à poids ouverts et le rapport technique complet ont été annoncés mais n’étaient pas encore largement publiés au lancement.
- La fiabilité en conditions réelles à travers des environnements de production est encore en cours de validation par la communauté des développeurs.
- Les charges de travail avec un contexte d’un million de tokens peuvent entraîner des coûts opérationnels et une latence plus élevés que les charges d’inférence standard.
Cas d’usage représentatifs
Ingénierie logicielle à l’échelle des dépôts
Analyser de grands bases de code, effectuer des refactorisations multi-fichiers, générer des correctifs, relire des pull requests et maintenir un contexte de développement à long terme.
Agents de recherche autonomes
Soutenir la revue de littérature, la synthèse de documents, l’analyse de benchmarks et des workflows de recherche de longue durée nécessitant des centaines de milliers de tokens.
Analyse technique multimodale
Interpréter des captures d’écran, des diagrammes d’architecture, des graphiques, des documents techniques et du contenu vidéo au sein du même workflow de raisonnement.
Automatisation Terminal et DevOps
Exécuter des workflows d’ingénierie complexes impliquant tests, orchestration de déploiement, gestion des dépendances et débogage itératif.
Systèmes de connaissances d’entreprise
Rechercher et raisonner sur de vastes collections de politiques, contrats, documentation technique et référentiels de connaissances internes.
Version du modèle et disponibilité
MiniMax M3 a été officiellement présenté en June 2026 comme le successeur phare de la gamme de modèles MiniMax. Le modèle est disponible via l’écosystème d’API MiniMax et CometAPI.