Especificaciones técnicas de MiniMax‑M2.5
| Campo | Afirmación / valor |
|---|---|
| Nombre del modelo | MiniMax-M2.5 (versión de producción, 12 de febrero de 2026). |
| Arquitectura | Transformer Mixture-of-Experts (MoE) (familia M2). |
| Parámetros totales | ~230 mil millones (capacidad total de MoE). |
| Parámetros activos (por inferencia) | ~10 mil millones activados por inferencia (activación dispersa). |
| Tipos de entrada | Texto y código (compatibilidad nativa con contextos de código de varios archivos), invocación de herramientas / interfaces de herramientas de API (flujos de trabajo basados en agentes). |
| Tipos de salida | Texto, salidas estructuradas (JSON/llamadas a herramientas), código (varios archivos), artefactos de Office (PPT/Excel/Word mediante cadenas de herramientas). |
| Variantes / modos | M2.5 (alta precisión/capacidad) y M2.5-Lightning (misma calidad, menor latencia / mayor TPS). |
¿Qué es MiniMax‑M2.5?
MiniMax‑M2.5 es la actualización insignia de la familia M2.x centrada en la productividad del mundo real y los flujos de trabajo basados en agentes. La versión enfatiza una mejor descomposición de tareas, integración de herramientas/búsqueda, fidelidad en la generación de código y eficiencia de tokens para problemas extensos y de múltiples pasos. El modelo se ofrece en una variante estándar y una variante de menor latencia “lightning” destinada a distintos compromisos de implementación.
Características principales de MiniMax‑M2.5
- Diseño con prioridad en agentes: planificación y orquestación de herramientas mejoradas para tareas en múltiples etapas (búsqueda, llamadas a herramientas, arneses de ejecución de código).
- Eficiencia de tokens: se reportan reducciones en el consumo de tokens por tarea en comparación con M2.1, lo que permite menores costos de extremo a extremo para flujos de trabajo largos.
- Finalización de extremo a extremo más rápida: los análisis del proveedor informan tiempos de finalización de tareas ~37% más rápidos que M2.1 en evaluaciones de codificación basadas en agentes.
- Sólida comprensión de código: ajustado con corpus multilingüe de código para refactorizaciones entre lenguajes, ediciones en múltiples archivos y razonamiento a escala de repositorio.
- Servicio de alto rendimiento: orientado a despliegues en producción con perfiles altos de tokens/seg; adecuado para cargas continuas de agentes.
- Variantes para compensaciones entre latencia y potencia: M2.5‑lightning ofrece menor latencia con menor cómputo y huella para escenarios interactivos.
Rendimiento en benchmarks (reportado)
Aspectos destacados reportados por el proveedor — métricas representativas (versión):
- SWE‑Bench Verified: 80.2% (tasa de aprobación reportada en los arneses de benchmark del proveedor)
- BrowseComp (búsqueda y uso de herramientas): 76.3%
- Multi‑SWE‑Bench (codificación multilenguaje): 51.3%
- Velocidad / eficiencia relativa: ~37% más rápido en la finalización de extremo a extremo vs. M2.1 en SWE‑Bench Verified en pruebas del proveedor; ~20% menos rondas de búsqueda/herramientas en algunas evaluaciones.
Interpretación: Estas cifras sitúan a M2.5 en paridad con, o cerca de, los modelos líderes de la industria en agentes/código en los benchmarks citados. Los benchmarks son reportados por el proveedor y reproducidos por varios medios del ecosistema; considérelos medidos bajo el banco de pruebas/configuración del proveedor a menos que se reproduzcan de forma independiente.
MiniMax‑M2.5 frente a sus pares (comparación concisa)
| Dimensión | MiniMax‑M2.5 | MiniMax M2.1 | Ejemplo de par (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (varía según el arnés) | Comparable (Opus reportó resultados cercanos a la cima) |
| Velocidad en tareas basadas en agentes | 37% más rápido vs. M2.1 (pruebas del proveedor) | Referencia | Velocidad similar en arneses específicos |
| Eficiencia de tokens | Mejorada vs. M2.1 (~menos tokens por tarea) | Mayor uso de tokens | Competitivo |
| Mejor uso | Flujos de trabajo basados en agentes en producción, canalizaciones de código | Generación anterior de la misma familia | Destacado en razonamiento multimodal y tareas ajustadas para seguridad |
Nota del proveedor: las comparaciones se derivan de materiales de lanzamiento e informes de benchmarks de proveedores. Diferencias pequeñas pueden ser sensibles al arnés, la cadena de herramientas y el protocolo de evaluación.
Casos de uso empresariales representativos
- Refactorizaciones a escala de repositorio y canalizaciones de migración — preservar la intención en ediciones multiarchivo y parches de PR automatizados.
- Orquestación basada en agentes para DevOps — orquestar ejecuciones de pruebas, pasos de CI, instalaciones de paquetes y diagnósticos de entorno con integraciones de herramientas.
- Revisión y remediación de código automatizadas — priorizar vulnerabilidades, proponer correcciones mínimas y preparar casos de prueba reproducibles.
- Recuperación de información impulsada por búsqueda — aprovechar la competencia de búsqueda a nivel BrowseComp para realizar exploración multirronda y resumir bases de conocimiento técnicas.
- Agentes y asistentes de producción — agentes continuos que requieren inferencia de larga duración rentable y estable.
Cómo acceder e integrar MiniMax‑M2.5
Paso 1: Regístrese para obtener una clave de API
Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su Consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíela.
Paso 2: Envíe solicitudes a la API minimax-m2.5
Seleccione el endpoint “minimax-m2.5” para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona prueba en Apifox para su comodidad. Reemplace <YOUR_API_KEY> con su clave real de CometAPI de su cuenta. Dónde llamarlo: formato de Chat.
Inserte su pregunta o solicitud en el campo content; esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupere y verifique los resultados
Procese la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.