Can MiniMax M3 process a full software repository in a single context window?

Sí. MiniMax M3 admite hasta una ventana de contexto de 1,000,000 tokens, lo que permite analizar repositorios grandes, conjuntos de documentación y sesiones de agentes de larga duración dentro de una sola conversación.

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 se aproxima a Claude Opus 4.7 en varios benchmarks de codificación y de agentes, mientras ofrece una ventana de contexto de 1M tokens y una disponibilidad de pesos abiertos planificada. Las comparaciones independientes de terceros aún están surgiendo.

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 introduce la arquitectura MiniMax Sparse Attention (MSA), entrenamiento multimodal nativo, capacidades de agente más sólidas y un soporte de contexto significativamente mayor que los modelos de la serie M2 anteriores.

Does the MiniMax M3 API support multimodal inputs?

Sí. MiniMax M3 es multimodal de forma nativa y admite la comprensión de imágenes y video, además de entradas basadas en texto.

What benchmark scores has MiniMax M3 achieved?

MiniMax reporta 59.0% en SWE-Bench Pro, 66.0% en Terminal-Bench 2.1, 74.2% en MCP Atlas y 83.5 en BrowseComp, posicionando a M3 entre los modelos líderes enfocados en codificación y agentes.

Is MiniMax M3 suitable for autonomous AI agents?

Sí. El modelo fue específicamente optimizado para flujos de trabajo de agentes de largo horizonte, incluidos la planificación, el uso de herramientas, la descomposición de tareas, la ejecución en terminal y la resolución de problemas en múltiples pasos.

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

MiniMax M3 es especialmente atractivo cuando las prioridades son ventanas de contexto extremadamente largas, flujos de trabajo con alta carga de programación u opciones de implementación con pesos abiertos. Gemini 3.1 Pro puede seguir siendo preferible para equipos ya estandarizados en el ecosistema de Google.

API de MiniMax-M3 Asequible | text-to-text

Especificaciones técnicas de MiniMax M3

Elemento	MiniMax M3
Familia de modelos	Modelo fundacional de frontera MiniMax M3
Proveedor	MiniMax
Arquitectura	MiniMax Sparse Attention (MSA)
Tipos de entrada	Texto, imagen, vídeo
Tipos de salida	Texto
Ventana de contexto	Hasta 1,000,000 tokens (mínimo garantizado 512K)
Fortalezas principales	Programación, flujos de trabajo con agentes, razonamiento multimodal, procesamiento de contextos largos
Modo de razonamiento	Modos de pensamiento activado/desactivado
Uso de herramientas	Flujos de trabajo con agentes, invocación de herramientas, ejecución de tareas en terminal
Despliegue	API, MiniMax Code, Token Plan, próximo lanzamiento con pesos abiertos
Compatibilidad multimodal	Preentrenamiento multimodal nativo desde el primer paso
Fecha de lanzamiento	junio de 2026

¿Qué es MiniMax M3?

MiniMax M3 es un modelo de IA a escala de frontera diseñado en torno a tres capacidades que históricamente han estado limitadas a sistemas de código cerrado: rendimiento avanzado en programación, procesamiento de contextos de un millón de tokens y comprensión multimodal nativa. A diferencia de los modelos que añaden visión como una extensión posterior, M3 se entrenó como un modelo multimodal desde el principio, lo que permite una alineación más profunda entre el razonamiento visual y textual.

El modelo se basa en MiniMax Sparse Attention (MSA), una arquitectura de atención dispersa diseñada para hacer prácticos a nivel computacional los contextos de un millón de tokens, manteniendo el rendimiento en tareas de programación, razonamiento y trabajo con agentes.

Características principales de MiniMax M3

Ventana de contexto de 1M tokens: Admite repositorios extremadamente grandes, extensos corpus de investigación, análisis de múltiples documentos y sesiones de agentes de larga duración.
Arquitectura orientada a agentes: Diseñada para la descomposición autónoma de tareas, invocación de herramientas, planificación iterativa y ejecución en múltiples pasos.
Multimodalidad nativa: Procesa texto, imágenes, diagramas, capturas de pantalla y entradas de vídeo sin depender de una pila de visión separada.
Capacidades avanzadas de programación: Rendimiento sólido en benchmarks de ingeniería de software, incluidos SWE-Bench Pro, Terminal-Bench y KernelBench.
Ejecución de largo horizonte: Ha demostrado flujos de trabajo autónomos de varias horas, incluyendo reproducción de investigaciones y proyectos de optimización de CUDA.
Razonamiento configurable: El modo de pensamiento puede activarse para cargas de trabajo de razonamiento más profundas o desactivarse para interacciones de menor latencia.

Rendimiento en benchmarks de MiniMax M3

MiniMax informa resultados de nivel frontera en codificación, ejecución con agentes y tareas de evaluación multimodal. Los resultados reportados incluyen:

Benchmark	Puntuación
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

La empresa también informa que M3 supera a GPT-5.5 y Gemini 3.1 Pro en varios benchmarks orientados a programación, a la vez que se acerca al rendimiento de Claude Opus 4.7 en evaluaciones seleccionadas. Estas afirmaciones provienen de las divulgaciones internas de benchmarks de MiniMax y deben interpretarse junto con pruebas independientes de terceros a medida que estén disponibles.

Arquitectura de largo contexto y MSA

MiniMax Sparse Attention (MSA) es la innovación arquitectónica detrás de la capacidad de contexto de un millón de tokens de M3. En lugar de aplicar atención cuadrática completa en toda la secuencia, MSA realiza enrutamiento a nivel de bloques y atención dispersa sobre regiones seleccionadas del contexto.

Según MiniMax, esto reduce sustancialmente los requisitos de cómputo en grandes longitudes de contexto y ofrece:

Más de 9× mayor rendimiento de prefill a longitud de contexto de 1M
Más de 15× mayor rendimiento de decodificación
Aproximadamente 1/20 del cómputo por token de la generación anterior a escala de contexto de 1M

Estas mejoras están destinadas a hacer viables la programación a escala de repositorio y los flujos de trabajo de agentes de largo horizonte.

MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Capacidad	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
Ventana de contexto	Hasta 1M	Niveles de contexto disponibles públicamente más pequeños	Multimodal de gran contexto
Entrenamiento multimodal nativo	Sí	Sí	Sí
Enfoque en programación con agentes	Muy fuerte	Muy fuerte	Fuerte
SWE-Bench Pro	59.0%	Más alto según los informes de MiniMax	Más bajo según los informes de MiniMax
Disponibilidad de pesos abiertos	Planificada	No	No
Flujos de trabajo de agentes de largo horizonte	Enfoque de diseño principal	Fuerte	Fuerte

Limitaciones conocidas

La mayoría de las divulgaciones de benchmarks actualmente provienen de MiniMax en lugar de laboratorios de evaluación independientes.
Se anunciaron los archivos del modelo con pesos abiertos y el informe técnico completo, pero aún no se habían publicado ampliamente en el lanzamiento.
La fiabilidad en el mundo real en distintos entornos de producción todavía está siendo validada por la comunidad de desarrolladores.
Las cargas de trabajo con contextos de un millón de tokens pueden implicar mayores costos operativos y latencia que las cargas de inferencia estándar.

Casos de uso representativos

Ingeniería de software a escala de repositorio

Analizar grandes bases de código, realizar refactorizaciones en múltiples archivos, generar parches, revisar pull requests y mantener un contexto de desarrollo a largo plazo.

Agentes de investigación autónomos

Apoyar la revisión bibliográfica, la síntesis de documentos, el análisis de benchmarks y flujos de trabajo de investigación de larga duración que requieren cientos de miles de tokens.

Análisis técnico multimodal

Interpretar capturas de pantalla, diagramas de arquitectura, gráficos, documentos técnicos y contenido de vídeo dentro del mismo flujo de razonamiento.

Automatización de terminal y DevOps

Ejecutar flujos de trabajo de ingeniería complejos que implican pruebas, orquestación de despliegues, gestión de dependencias y depuración iterativa.

Sistemas de conocimiento empresarial

Buscar y razonar sobre grandes colecciones de políticas, contratos, documentación técnica y repositorios de conocimiento internos.

Versión del modelo y disponibilidad

MiniMax M3 se presentó oficialmente en junio de 2026 como el sucesor insignia dentro de la línea de modelos de MiniMax. El modelo está disponible a través del ecosistema de API de MiniMax y CometAPI.

Precios para MiniMax-M3

Explora precios competitivos para MiniMax-M3, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo MiniMax-M3 puede mejorar tus proyectos mientras mantienes los costos manejables.

Model	Comet Price (USD / M Tokens)	Official Price (USD / M Tokens)	Discount
minimax-m3	Entrada:$0.48/M Salida:$1.92/M	Entrada:$0.6/M Salida:$2.4/M	-20%

Código de ejemplo y API para MiniMax-M3

Accede a código de muestra completo y recursos de API para MiniMax-M3 para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de MiniMax-M3 en tus proyectos.

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.

Context: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.

Output format:
Return a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

cURL Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Versiones de MiniMax-M3

La razón por la cual MiniMax-M3 tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.

Version
minimax-m3

MiniMax-M3

Playground para MiniMax-M3