Can MiniMax M3 process a full software repository in a single context window?

Oui. MiniMax M3 prend en charge une fenêtre de contexte pouvant aller jusqu'à 1,000,000 de jetons, ce qui permet d'analyser de grands dépôts, des ensembles de documentation et des sessions d'agent de longue durée au sein d'une seule conversation.

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 se rapproche de Claude Opus 4.7 sur plusieurs benchmarks de programmation et d'agents, tout en offrant une fenêtre de contexte de 1M de jetons et une disponibilité à poids ouverts prévue. Des comparaisons indépendantes de tiers sont encore en train d'émerger.

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 introduit l'architecture MiniMax Sparse Attention (MSA), un entraînement multimodal natif, des capacités d'agent renforcées et une prise en charge du contexte nettement plus large que celle des modèles de la série M2 précédents.

Does the MiniMax M3 API support multimodal inputs?

Oui. MiniMax M3 est nativement multimodal et prend en charge la compréhension d'images et de vidéos en plus des entrées basées sur du texte.

What benchmark scores has MiniMax M3 achieved?

MiniMax indique 59.0% sur SWE-Bench Pro, 66.0% sur Terminal-Bench 2.1, 74.2% sur MCP Atlas et 83.5 sur BrowseComp, plaçant M3 parmi les modèles de premier plan axés sur le codage et les agents.

Is MiniMax M3 suitable for autonomous AI agents?

Oui. Le modèle a été spécialement optimisé pour des flux de travail d'agents à long horizon, y compris la planification, l'utilisation d'outils, la décomposition des tâches, l'exécution via le terminal et la résolution de problèmes en plusieurs étapes.

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

MiniMax M3 est particulièrement attrayant lorsque des fenêtres de contexte extrêmement longues, des flux de travail fortement axés sur le codage ou des options de déploiement à poids ouverts sont prioritaires. Gemini 3.1 Pro peut rester préférable pour les équipes déjà standardisées sur l'écosystème de Google.

API MiniMax-M3 Abordable | text-to-text

Playground pour MiniMax-M3

Explorez le Playground de MiniMax-M3 — un environnement interactif pour tester les modèles et exécuter des requêtes en temps réel. Essayez des invites, ajustez les paramètres et itérez instantanément pour accélérer le développement et valider les cas d'utilisation.

Spécifications techniques de MiniMax M3

Élément	MiniMax M3
Famille de modèles	MiniMax M3 frontier foundation model
Fournisseur	MiniMax
Architecture	MiniMax Sparse Attention (MSA)
Types d'entrée	Texte, Image, Vidéo
Types de sortie	Texte
Fenêtre de contexte	Jusqu'à 1,000,000 tokens (minimum garanti 512K)
Atouts principaux	Codage, flux de travail agentiques, raisonnement multimodal, traitement de longs contextes
Mode de raisonnement	Modes de réflexion activés/désactivés
Utilisation d'outils	Flux de travail d'agents, invocation d'outils, exécution de tâches en terminal
Déploiement	API, MiniMax Code, Token Plan, publication open-weight à venir
Prise en charge multimodale	Pré-entraînement multimodal natif dès l'étape zéro
Date de sortie	juin 2026

Qu'est-ce que MiniMax M3 ?

MiniMax M3 est un modèle d’IA de classe frontière conçu autour de trois capacités historiquement limitées aux systèmes propriétaires : des performances avancées en codage, le traitement de contextes d’un million de jetons et une compréhension multimodale native. Contrairement aux modèles qui ajoutent la vision comme extension ultérieure, M3 a été entraîné comme modèle multimodal dès le départ, permettant un alignement plus étroit entre le raisonnement visuel et textuel.

Le modèle repose sur MiniMax Sparse Attention (MSA), une architecture d’attention clairsemée conçue pour rendre les contextes à un million de jetons praticables sur le plan computationnel tout en préservant les performances en codage, en raisonnement et sur les tâches agentiques.

Principales fonctionnalités de MiniMax M3

Fenêtre de contexte de 1 M de jetons : Prend en charge des dépôts extrêmement volumineux, des corpus de recherche longs, des analyses multi‑documents et des sessions d’agents de longue durée.
Architecture orientée agents : Conçue pour la décomposition autonome des tâches, l’appel d’outils, la planification itérative et l’exécution multi‑étapes.
Multimodalité native : Traite le texte, les images, les schémas, les captures d’écran et les entrées vidéo sans dépendre d’une pile de vision distincte.
Capacités de codage avancées : Excellentes performances sur des benchmarks d’ingénierie logicielle, notamment SWE-Bench Pro, Terminal-Bench et KernelBench.
Exécution à long horizon : Flux de travail autonomes de plusieurs heures démontrés, incluant la reproduction de recherches et des projets d’optimisation CUDA.
Raisonnement configurable : Le mode de réflexion peut être activé pour des charges de raisonnement plus poussées ou désactivé pour des interactions à plus faible latence.

Performances de MiniMax M3 sur benchmarks

MiniMax rapporte des résultats de niveau frontière sur des tâches de codage, d’exécution agentique et d’évaluation multimodale. Les résultats déclarés incluent :

Benchmark	Score
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

L’entreprise indique également que M3 dépasse GPT-5.5 et Gemini 3.1 Pro sur plusieurs benchmarks orientés codage, tout en s’approchant des performances de Claude Opus 4.7 dans certaines évaluations. Ces affirmations proviennent des divulgations internes de MiniMax et doivent être interprétées à la lumière de tests indépendants tiers lorsqu’ils seront disponibles.

Architecture de long contexte et MSA

MiniMax Sparse Attention (MSA) est l’innovation architecturale derrière la capacité de contexte d’un million de jetons de M3. Au lieu d’appliquer une attention quadratique complète sur toute la séquence, MSA effectue un routage au niveau des blocs et une attention clairsemée sur des régions de contexte sélectionnées.

Selon MiniMax, cela réduit considérablement les besoins en calcul sur de grandes longueurs de contexte et offre :

Préremplissage plus de 9× plus rapide à une longueur de contexte de 1 M
Plus de 15× plus rapide en décodage
Environ 1/20 de la consommation de calcul par jeton des générations précédentes à l’échelle 1 M de contexte

Ces améliorations visent à rendre le codage à l’échelle d’un dépôt et les flux de travail d’agents à long horizon praticables.

MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Capacité	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
Fenêtre de contexte	Jusqu’à 1 M	Paliers de contexte publics plus petits	Multimodal à grand contexte
Entraînement multimodal natif	Oui	Oui	Oui
Focalisation sur le codage agentique	Très forte	Très forte	Forte
SWE-Bench Pro	59.0%	Plus élevé selon les rapports de MiniMax	Plus faible selon les rapports de MiniMax
Disponibilité open-weight	Prévue	Non	Non
Flux de travail d’agents à long horizon	Axe majeur de conception	Forts	Forts

Limites connues

La plupart des divulgations de benchmarks proviennent actuellement de MiniMax plutôt que de laboratoires d’évaluation indépendants.
Les fichiers de modèle open-weight et le rapport technique complet ont été annoncés, mais n’étaient pas encore largement publiés au lancement.
La fiabilité en conditions réelles, sur divers environnements de production, est encore en cours de validation par la communauté des développeurs.
Les charges de travail à un million de jetons peuvent entraîner des coûts opérationnels et une latence plus élevés que les charges d’inférence standard.

Cas d’usage représentatifs

Ingénierie logicielle à l’échelle d’un dépôt

Analyser de vastes bases de code, effectuer des refactorisations multi‑fichiers, générer des correctifs, examiner des pull requests et maintenir un contexte de développement à long terme.

Agents de recherche autonomes

Soutenir la revue de littérature, la synthèse de documents, l’analyse de benchmarks et des flux de recherche de longue durée nécessitant des centaines de milliers de jetons.

Analyse technique multimodale

Interpréter des captures d’écran, des diagrammes d’architecture, des graphiques, des documents techniques et des contenus vidéo au sein du même flux de raisonnement.

Automatisation du terminal et DevOps

Exécuter des flux d’ingénierie complexes impliquant tests, orchestration de déploiement, gestion des dépendances et débogage itératif.

Systèmes de connaissances d’entreprise

Rechercher et raisonner sur de vastes collections de politiques, contrats, documentation technique et référentiels de connaissances internes.

Version du modèle et disponibilité

MiniMax M3 a été officiellement présenté en juin 2026 comme le successeur phare de la gamme de modèles MiniMax. Le modèle est disponible via l’écosystème d’API MiniMax et CometAPI.

FAQ

Tarification pour MiniMax-M3

Découvrez des tarifs compétitifs pour MiniMax-M3, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment MiniMax-M3 peut améliorer vos projets tout en maîtrisant les coûts.

Prix de Comet (USD / M Tokens)	Prix officiel (USD / M Tokens)	Remise
Entrée:$0.48/M Sortie:$1.92/M	Entrée:$0.6/M Sortie:$2.4/M	-20%

Exemple de code et API pour MiniMax-M3

Accédez à des exemples de code complets et aux ressources API pour MiniMax-M3 afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de MiniMax-M3 dans vos projets.

POST

/v1/chat/completions

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.

"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.

"
                "Output format:
"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Curl Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Uptime

Taux de succès des requêtes sur les 30 derniers jours, reflétant la fiabilité de chaque fournisseur de modèles. CometAPI surveille tous les fournisseurs connectés en temps réel, 24h/24 et 7j/7.

RespondLIVE

782msAvg. Response

UptimeLIVE

100.0%Avg. Uptime

Versions de MiniMax-M3

La raison pour laquelle MiniMax-M3 dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.

version
minimax-m3