Spécifications techniques de MiniMax‑M2.5
| Champ | Valeur / énoncé |
|---|---|
| Nom du modèle | MiniMax-M2.5 (version de production, 12 février 2026). |
| Architecture | Transformer à mélange d’experts (MoE) (famille M2). |
| Paramètres totaux | ~230 milliards (capacité totale du MoE). |
| Paramètres actifs (par inférence) | ~10 milliards activés par inférence (activation clairsemée). |
| Types d’entrée | Texte et code (prise en charge native des contextes de code multi‑fichiers), appels d’outils / interfaces d’outils API (workflows agentiques). |
| Types de sortie | Texte, sorties structurées (JSON/appels d’outils), code (multi‑fichiers), artefacts Office (PPT/Excel/Word via chaînes d’outils). |
| Variantes / modes | M2.5 (haute précision/capacité) et M2.5-Lightning (même qualité, latence plus faible / TPS plus élevé). |
Qu’est-ce que MiniMax‑M2.5 ?
MiniMax‑M2.5 est la mise à jour phare de la famille M2.x, axée sur la productivité dans le monde réel et les workflows agentiques. Cette version met l’accent sur une meilleure décomposition des tâches, l’intégration recherche/outils, la fidélité de génération de code et l’efficacité en jetons pour des problèmes étendus et multi‑étapes. Le modèle est proposé en variante standard et en variante « lightning » à latence réduite, destinées à différents compromis de déploiement.
Principales fonctionnalités de MiniMax‑M2.5
- Conception axée agents : planification et orchestration d’outils améliorées pour des tâches en plusieurs étapes (recherche, appels d’outils, cadres d’exécution du code).
- Efficacité en jetons : réductions rapportées de la consommation de jetons par tâche par rapport à M2.1, permettant des coûts de bout en bout plus faibles pour les workflows longs.
- Achèvement de bout en bout plus rapide : les bancs d’essai du fournisseur indiquent des temps d’achèvement moyens ~37% plus rapides que M2.1 sur des évaluations de codage agentiques.
- Solide compréhension du code : ajusté sur des corpus de code multilingues pour des refactorings interlangages robustes, des éditions multi‑fichiers et un raisonnement à l’échelle du dépôt.
- Capacité de service à haut débit : ciblé pour des déploiements de production avec des profils élevés en jetons/s ; adapté aux charges d’agents continues.
- Variantes pour arbitrages latence vs performance : M2.5‑lightning offre une latence plus faible avec moins de calcul et d’empreinte pour des scénarios interactifs.
Performances sur benchmarks (rapportées)
Faits saillants rapportés par le fournisseur — métriques représentatives (version) :
- SWE‑Bench Verified : 80.2% (taux de réussite rapporté sur les bancs d’essai du fournisseur)
- BrowseComp (recherche et utilisation d’outils) : 76.3%
- Multi‑SWE‑Bench (codage multilingue) : 51.3%
- Vitesse / efficacité relatives : ~37% d’achèvement de bout en bout plus rapide vs M2.1 sur SWE‑Bench Verified dans les tests du fournisseur ; ~20% de cycles recherche/outils en moins dans certaines évaluations.
Interprétation : Ces chiffres placent M2.5 à parité avec, ou proche des modèles agentiques/de code de tête du secteur sur les benchmarks cités. Les benchmarks sont rapportés par le fournisseur et reproduits par plusieurs acteurs de l’écosystème — à considérer comme mesurés avec le banc d’essai/la configuration du fournisseur, sauf reproduction indépendante.
MiniMax‑M2.5 vs concurrents (comparaison concise)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | Exemple de concurrent (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (varie selon le banc d’essai) | Comparable (Opus a rapporté des résultats proches du meilleur niveau) |
| Vitesse des tâches agentiques | 37% plus rapide vs M2.1 (tests du fournisseur) | Référence | Vitesse similaire sur certains bancs d’essai |
| Efficacité en jetons | Améliorée vs M2.1 (~moins de jetons par tâche) | Utilisation de jetons plus élevée | Compétitif |
| Meilleure utilisation | Workflows agentiques de production, pipelines de codage | Génération antérieure de la même famille | Solide en raisonnement multimodal et pour des tâches optimisées pour la sécurité |
Note du fournisseur : les comparaisons proviennent des documents de publication et des rapports de benchmark du fournisseur. De petites différences peuvent être sensibles au banc d’essai, à la chaîne d’outils et au protocole d’évaluation.
Cas d’usage entreprise représentatifs
- Refactorings à l’échelle du dépôt et pipelines de migration — préserver l’intention à travers des modifications multi‑fichiers et des correctifs de PR automatisés.
- Orchestration agentique pour DevOps — orchestrer des exécutions de tests, des étapes de CI, des installations de paquets et des diagnostics d’environnement avec des intégrations d’outils.
- Revue et remédiation de code automatisées — trier les vulnérabilités, proposer des corrections minimales et préparer des cas de test reproductibles.
- Récupération d’informations pilotée par la recherche — exploiter une compétence de recherche de niveau BrowseComp pour effectuer des explorations en plusieurs tours et des synthèses de bases de connaissances techniques.
- Agents et assistants de production — agents continus nécessitant une inférence durable, stable et rentable.
Comment accéder à et intégrer MiniMax‑M2.5
Étape 1 : S’inscrire pour obtenir une clé API
Connectez‑vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez‑vous à votre console CometAPI. Obtenez la clé API d’identification d’accès de l’interface. Cliquez sur « Add Token » dans la section du jeton API de l’espace personnel, récupérez la clé du jeton : sk-xxxxx et soumettez.
Étape 2 : Envoyer des requêtes à l’API minimax-m2.5
Sélectionnez l’endpoint « minimax-m2.5 » pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site Web. Notre site fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. Où l’appeler : format Chat.
Insérez votre question ou demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API renvoie l’état de la tâche et les données de sortie.