Especificaciones técnicas de MiniMax M3
| Elemento | MiniMax M3 |
|---|---|
| Familia de modelos | Modelo fundacional de frontera MiniMax M3 |
| Proveedor | MiniMax |
| Arquitectura | MiniMax Sparse Attention (MSA) |
| Tipos de entrada | Texto, Imagen, Video |
| Tipos de salida | Texto |
| Ventana de contexto | Up to 1,000,000 tokens (minimum guaranteed 512K) |
| Fortalezas principales | Coding, agentic workflows, multimodal reasoning, long-context processing |
| Modo de razonamiento | Thinking on/off modes |
| Uso de herramientas | Agent workflows, tool invocation, terminal-task execution |
| Implementación | API, MiniMax Code, Token Plan, próximo lanzamiento de pesos abiertos |
| Compatibilidad multimodal | Preentrenamiento multimodal nativo desde el paso cero |
| Fecha de lanzamiento | junio de 2026 |
¿Qué es MiniMax M3?
MiniMax M3 es un modelo de IA de frontera a gran escala diseñado en torno a tres capacidades que históricamente han estado limitadas a sistemas de código cerrado: rendimiento avanzado en programación, procesamiento de contextos de un millón de tokens y comprensión multimodal nativa. A diferencia de los modelos que añaden visión como una extensión posterior, M3 fue entrenado como un modelo multimodal desde el principio, lo que permite una alineación más profunda entre el razonamiento visual y textual.
El modelo se basa en MiniMax Sparse Attention (MSA), una arquitectura de atención dispersa diseñada para hacer que los contextos de millones de tokens sean computacionalmente prácticos, preservando al mismo tiempo el rendimiento en tareas de programación, razonamiento y agentes.
Características principales de MiniMax M3
- Ventana de contexto de 1M de tokens: Admite repositorios extremadamente grandes, corpus de investigación extensos, análisis multidocumento y sesiones de agente de larga duración.
- Arquitectura orientada a agentes: Diseñada para descomposición autónoma de tareas, llamadas a herramientas, planificación iterativa y ejecución en múltiples pasos.
- Multimodalidad nativa: Procesa texto, imágenes, diagramas, capturas de pantalla y video sin depender de una pila de visión separada.
- Capacidad avanzada de programación: Sólido rendimiento en benchmarks de ingeniería de software, incluidos SWE-Bench Pro, Terminal-Bench y KernelBench.
- Ejecución de horizonte largo: Demostrados flujos de trabajo autónomos de varias horas, incluida la reproducción de investigaciones y proyectos de optimización CUDA.
- Razonamiento configurable: El modo de pensamiento se puede activar para cargas de trabajo de razonamiento más profundas o desactivar para interacciones de menor latencia.
Rendimiento en benchmarks de MiniMax M3
MiniMax informa resultados de nivel frontera en benchmarks de programación, ejecución agentic y tareas de evaluación multimodal. Las cifras informadas incluyen:
| Benchmark | Puntuación |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
La empresa también informa que M3 supera a GPT-5.5 y Gemini 3.1 Pro en varios benchmarks orientados a programación, mientras se acerca al rendimiento de Claude Opus 4.7 en evaluaciones seleccionadas. Estas afirmaciones provienen de las divulgaciones internas de benchmarks de MiniMax y deben interpretarse junto con las pruebas independientes de terceros a medida que estén disponibles.
Arquitectura de largo contexto y MSA
MiniMax Sparse Attention (MSA) es la innovación arquitectónica detrás de la capacidad de contexto de un millón de tokens de M3. En lugar de aplicar atención cuadrática completa a toda la secuencia, MSA realiza enrutamiento a nivel de bloques y atención dispersa sobre regiones seleccionadas del contexto.
Según MiniMax, esto reduce sustancialmente los requisitos de cómputo en longitudes de contexto grandes y ofrece:
- Más de 9× mayor rendimiento de prefill a longitud de contexto de 1M
- Más de 15× mayor rendimiento de decodificación
- Aproximadamente 1/20 del cómputo por token de la generación anterior a escala de contexto de 1M
Estas mejoras están destinadas a hacer práctica la programación a escala de repositorio y los flujos de trabajo de agentes de horizonte largo.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Capacidad | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Ventana de contexto | Hasta 1M | Niveles de contexto públicos más pequeños | Multimodal con gran contexto |
| Entrenamiento multimodal nativo | Sí | Sí | Sí |
| Enfoque en codificación orientada a agentes | Muy fuerte | Muy fuerte | Fuerte |
| SWE-Bench Pro | 59.0% | Superior según los informes de MiniMax | Inferior según los informes de MiniMax |
| Disponibilidad de pesos abiertos | Planificada | No | No |
| Flujos de trabajo de agentes de horizonte largo | Enfoque principal de diseño | Fuerte | Fuerte |
Limitaciones conocidas
- La mayoría de las divulgaciones de benchmarks provienen actualmente de MiniMax en lugar de laboratorios de evaluación independientes.
- Los archivos del modelo con pesos abiertos y el informe técnico completo se anunciaron, pero aún no se habían publicado ampliamente en el lanzamiento.
- La fiabilidad en el mundo real en entornos de producción todavía está siendo validada por la comunidad de desarrolladores.
- Las cargas de trabajo con contexto de un millón de tokens pueden conllevar costos operativos y latencia más altos que las cargas de inferencia estándar.
Casos de uso representativos
Ingeniería de software a escala de repositorio
Analizar grandes bases de código, realizar refactorizaciones en múltiples archivos, generar parches, revisar pull requests y mantener el contexto de desarrollo a largo plazo.
Agentes de investigación autónomos
Respaldar la revisión de literatura, la síntesis de documentos, el análisis de benchmarks y flujos de trabajo de investigación de larga duración que requieren cientos de miles de tokens.
Análisis técnico multimodal
Interpretar capturas de pantalla, diagramas de arquitectura, gráficos, documentos técnicos y contenido de video dentro del mismo flujo de razonamiento.
Automatización de terminal y DevOps
Ejecutar flujos de trabajo de ingeniería complejos que incluyen pruebas, orquestación de despliegues, gestión de dependencias y depuración iterativa.
Sistemas de conocimiento empresariales
Buscar y razonar sobre grandes colecciones de políticas, contratos, documentación técnica y repositorios de conocimiento internos.
Versión y disponibilidad del modelo
MiniMax M3 se presentó oficialmente en junio de 2026 como el sucesor insignia dentro de la línea de modelos de MiniMax. El modelo está disponible a través del ecosistema de API de MiniMax y CometAPI.