API de MiniMax M2.5 Asequible | text-to-text

Especificaciones técnicas de MiniMax‑M2.5

Campo	Afirmación / valor
Nombre del modelo	MiniMax-M2.5 (versión de producción, 12 de febrero de 2026).
Arquitectura	Transformer Mixture-of-Experts (MoE) (familia M2).
Parámetros totales	~230 mil millones (capacidad total de MoE).
Parámetros activos (por inferencia)	~10 mil millones activados por inferencia (activación dispersa).
Tipos de entrada	Texto y código (compatibilidad nativa con contextos de código de varios archivos), invocación de herramientas / interfaces de herramientas de API (flujos de trabajo basados en agentes).
Tipos de salida	Texto, salidas estructuradas (JSON/llamadas a herramientas), código (varios archivos), artefactos de Office (PPT/Excel/Word mediante cadenas de herramientas).
Variantes / modos	M2.5 (alta precisión/capacidad) y M2.5-Lightning (misma calidad, menor latencia / mayor TPS).

¿Qué es MiniMax‑M2.5?

MiniMax‑M2.5 es la actualización insignia de la familia M2.x centrada en la productividad del mundo real y los flujos de trabajo basados en agentes. La versión enfatiza una mejor descomposición de tareas, integración de herramientas/búsqueda, fidelidad en la generación de código y eficiencia de tokens para problemas extensos y de múltiples pasos. El modelo se ofrece en una variante estándar y una variante de menor latencia “lightning” destinada a distintos compromisos de implementación.

Características principales de MiniMax‑M2.5

Diseño con prioridad en agentes: planificación y orquestación de herramientas mejoradas para tareas en múltiples etapas (búsqueda, llamadas a herramientas, arneses de ejecución de código).
Eficiencia de tokens: se reportan reducciones en el consumo de tokens por tarea en comparación con M2.1, lo que permite menores costos de extremo a extremo para flujos de trabajo largos.
Finalización de extremo a extremo más rápida: los análisis del proveedor informan tiempos de finalización de tareas ~37% más rápidos que M2.1 en evaluaciones de codificación basadas en agentes.
Sólida comprensión de código: ajustado con corpus multilingüe de código para refactorizaciones entre lenguajes, ediciones en múltiples archivos y razonamiento a escala de repositorio.
Servicio de alto rendimiento: orientado a despliegues en producción con perfiles altos de tokens/seg; adecuado para cargas continuas de agentes.
Variantes para compensaciones entre latencia y potencia: M2.5‑lightning ofrece menor latencia con menor cómputo y huella para escenarios interactivos.

Rendimiento en benchmarks (reportado)

Aspectos destacados reportados por el proveedor — métricas representativas (versión):

SWE‑Bench Verified: 80.2% (tasa de aprobación reportada en los arneses de benchmark del proveedor)
BrowseComp (búsqueda y uso de herramientas): 76.3%
Multi‑SWE‑Bench (codificación multilenguaje): 51.3%
Velocidad / eficiencia relativa: ~37% más rápido en la finalización de extremo a extremo vs. M2.1 en SWE‑Bench Verified en pruebas del proveedor; ~20% menos rondas de búsqueda/herramientas en algunas evaluaciones.

Interpretación: Estas cifras sitúan a M2.5 en paridad con, o cerca de, los modelos líderes de la industria en agentes/código en los benchmarks citados. Los benchmarks son reportados por el proveedor y reproducidos por varios medios del ecosistema; considérelos medidos bajo el banco de pruebas/configuración del proveedor a menos que se reproduzcan de forma independiente.

MiniMax‑M2.5 frente a sus pares (comparación concisa)

Dimensión	MiniMax‑M2.5	MiniMax M2.1	Ejemplo de par (Anthropic Opus 4.6)
SWE‑Bench Verified	80.2%	~71–76% (varía según el arnés)	Comparable (Opus reportó resultados cercanos a la cima)
Velocidad en tareas basadas en agentes	37% más rápido vs. M2.1 (pruebas del proveedor)	Referencia	Velocidad similar en arneses específicos
Eficiencia de tokens	Mejorada vs. M2.1 (~menos tokens por tarea)	Mayor uso de tokens	Competitivo
Mejor uso	Flujos de trabajo basados en agentes en producción, canalizaciones de código	Generación anterior de la misma familia	Destacado en razonamiento multimodal y tareas ajustadas para seguridad

Nota del proveedor: las comparaciones se derivan de materiales de lanzamiento e informes de benchmarks de proveedores. Diferencias pequeñas pueden ser sensibles al arnés, la cadena de herramientas y el protocolo de evaluación.

Casos de uso empresariales representativos

Refactorizaciones a escala de repositorio y canalizaciones de migración — preservar la intención en ediciones multiarchivo y parches de PR automatizados.
Orquestación basada en agentes para DevOps — orquestar ejecuciones de pruebas, pasos de CI, instalaciones de paquetes y diagnósticos de entorno con integraciones de herramientas.
Revisión y remediación de código automatizadas — priorizar vulnerabilidades, proponer correcciones mínimas y preparar casos de prueba reproducibles.
Recuperación de información impulsada por búsqueda — aprovechar la competencia de búsqueda a nivel BrowseComp para realizar exploración multirronda y resumir bases de conocimiento técnicas.
Agentes y asistentes de producción — agentes continuos que requieren inferencia de larga duración rentable y estable.

Cómo acceder e integrar MiniMax‑M2.5

Paso 1: Regístrese para obtener una clave de API

Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su Consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíela.

Paso 2: Envíe solicitudes a la API `minimax-m2.5`

Seleccione el endpoint “minimax-m2.5” para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona prueba en Apifox para su comodidad. Reemplace <YOUR_API_KEY> con su clave real de CometAPI de su cuenta. Dónde llamarlo: formato de Chat.

Inserte su pregunta o solicitud en el campo content; esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.

Paso 3: Recupere y verifique los resultados

Procese la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.

MiniMax-M2.5 está optimizado para la productividad del mundo real y flujos de trabajo basados en agentes — especialmente la programación compleja, la planificación en múltiples etapas, la invocación de herramientas, la búsqueda y el desarrollo de sistemas multiplataforma. Su entrenamiento enfatiza el manejo de ciclos de vida completos de desarrollo, desde la planificación de la arquitectura hasta la revisión de código y las pruebas.

En comparación con M2.1, M2.5 muestra mejoras significativas en la descomposición de tareas, la eficiencia de tokens y la velocidad — por ejemplo, completa ciertos benchmarks basados en agentes alrededor de un 37% más rápido y con menos tokens consumidos por tarea.

M2.5 alcanza alrededor del 80.2% en SWE-Bench Verified, aproximadamente el 51.3% en Multi-SWE-Bench y cerca del 76.3% en BrowseComp en contextos donde la planificación de tareas y la búsqueda están habilitadas — resultados competitivos frente a los modelos insignia de otros proveedores.

Sí — M2.5 se entrenó con más de 10 lenguajes de programación, incluidos Python, Java, Rust, Go, TypeScript, C/C++, Ruby y Dart, lo que le permite manejar tareas de programación diversas en distintos ecosistemas.

Sí — MiniMax posiciona M2.5 para manejar proyectos full-stack que abarcan Web, Android, iOS, Windows y Mac, cubriendo las fases de diseño, implementación, iteración y pruebas.

M2.5 puede ejecutarse con un alto rendimiento de tokens (p. ej., ~100 tokens/sec) con eficiencias de costo alrededor de 10–20× menores que las de muchos modelos de frontera, en términos de precio por salida, lo que permite el despliegue escalable de flujos de trabajo basados en agentes.

MiniMax-M2.5 está disponible a través de endpoints de API (p. ej., variantes estándar y de alto rendimiento) especificando minimax-m2.5 como el modelo en las solicitudes.

M2.5 destaca en tareas de programación y basadas en agentes; puede estar menos especializado en la generación narrativa puramente creativa en comparación con modelos creativos dedicados, por lo que para la escritura de historias o ficción creativa podrían ser preferibles otros modelos.

Precio de Comet (USD / M Tokens)	Precio Oficial (USD / M Tokens)	Descuento
Entrada:$0.24/M Salida:$0.96/M	Entrada:$0.3/M Salida:$1.2/M	-20%