Especificações técnicas do MiniMax M3
| Item | MiniMax M3 |
|---|---|
| Model family | MiniMax M3 frontier foundation model |
| Provider | MiniMax |
| Architecture | MiniMax Sparse Attention (MSA) |
| Input types | Texto, Imagem, Vídeo |
| Output types | Texto |
| Context window | Até 1,000,000 tokens (mínimo garantido 512K) |
| Primary strengths | Programação, fluxos de trabalho orientados a agentes, raciocínio multimodal, processamento de longo contexto |
| Reasoning mode | Modos de pensamento ligado/desligado |
| Tool use | Fluxos de trabalho de agentes, invocação de ferramentas, execução de tarefas em terminal |
| Deployment | API, MiniMax Code, Token Plan, lançamento com pesos abertos previsto |
| Multimodal support | Pré-treinamento multimodal nativo desde o início |
| Release date | Junho de 2026 |
O que é o MiniMax M3?
MiniMax M3 é um modelo de IA em escala de ponta, projetado em torno de três capacidades que historicamente têm sido limitadas a sistemas de código fechado: desempenho avançado em programação, processamento de contexto de um milhão de tokens e compreensão multimodal nativa. Diferentemente de modelos que adicionam visão como uma extensão posterior, o M3 foi treinado como um modelo multimodal desde o início, permitindo um alinhamento mais profundo entre o raciocínio visual e textual.
O modelo é construído sobre o MiniMax Sparse Attention (MSA), uma arquitetura de atenção esparsa projetada para tornar contextos de um milhão de tokens computacionalmente práticos, preservando o desempenho em tarefas de programação, raciocínio e orientadas a agentes.
Principais recursos do MiniMax M3
- Janela de contexto de 1M tokens: oferece suporte a repositórios extremamente grandes, corpora de pesquisa extensos, análise multidocumento e sessões de agentes de longa duração.
- Arquitetura orientada a agentes: projetada para decomposição autônoma de tarefas, chamadas de ferramentas, planejamento iterativo e execução em múltiplas etapas.
- Multimodalidade nativa: processa texto, imagens, diagramas, capturas de tela e entradas de vídeo sem depender de uma pilha de visão separada.
- Capacidade avançada de programação: forte desempenho em benchmarks de engenharia de software, incluindo SWE-Bench Pro, Terminal-Bench e KernelBench.
- Execução de longo prazo: fluxos de trabalho autônomos de várias horas demonstrados, incluindo reprodução de pesquisas e projetos de otimização CUDA.
- Raciocínio configurável: o modo de pensamento pode ser habilitado para cargas de trabalho de raciocínio mais profundo ou desabilitado para interações de menor latência.
Desempenho em benchmarks do MiniMax M3
A MiniMax relata resultados de nível de ponta em benchmarks de programação, execução orientada a agentes e avaliação multimodal. Os resultados relatados incluem:
| Benchmark | Pontuação |
|---|---|
| SWE-Bench Pro | 59,0% |
| Terminal-Bench 2.1 | 66,0% |
| SWE-fficiency | 34,8% |
| KernelBench Hard | 28,8% |
| MCP Atlas | 74,2% |
| BrowseComp | 83,5 |
| PostTrainBench | 37,1 |
A empresa também relata que o M3 supera o GPT-5.5 e o Gemini 3.1 Pro em vários benchmarks voltados à programação, ao mesmo tempo que se aproxima do desempenho do Claude Opus 4.7 em avaliações selecionadas. Essas alegações têm origem nas divulgações internas de benchmarks da MiniMax e devem ser interpretadas juntamente com testes independentes de terceiros à medida que se tornarem disponíveis.
Arquitetura de longo contexto e MSA
MiniMax Sparse Attention (MSA) é a inovação arquitetural por trás da capacidade de contexto de um milhão de tokens do M3. Em vez de aplicar atenção quadrática completa em toda a sequência, o MSA realiza roteamento em nível de bloco e atenção esparsa sobre regiões selecionadas do contexto.
Segundo a MiniMax, isso reduz substancialmente os requisitos de computação em comprimentos de contexto grandes e oferece:
- Mais de 9× mais desempenho de prefill em comprimento de contexto de 1M
- Mais de 15× mais desempenho de decodificação
- Aproximadamente 1/20 do custo computacional por token da geração anterior em escala de contexto de 1M
Essas melhorias visam tornar prática a programação em escala de repositório e os fluxos de trabalho de agentes de longo prazo.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Capacidade | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Janela de contexto | Até 1M | Camadas de contexto publicamente disponíveis menores | Multimodal de grande contexto |
| Treinamento multimodal nativo | Sim | Sim | Sim |
| Foco em programação orientada a agentes | Muito forte | Muito forte | Forte |
| SWE-Bench Pro | 59,0% | Maior segundo relatórios da MiniMax | Menor segundo relatórios da MiniMax |
| Disponibilidade de pesos abertos | Planejada | Não | Não |
| Fluxos de trabalho de agentes de longo prazo | Foco principal de design | Forte | Forte |
Limitações conhecidas
- A maioria das divulgações de benchmarks atualmente vem da MiniMax, e não de laboratórios independentes de avaliação.
- Os arquivos de pesos abertos e o relatório técnico completo foram anunciados, mas ainda não haviam sido amplamente lançados no lançamento.
- A confiabilidade no mundo real em ambientes de produção ainda está sendo validada pela comunidade de desenvolvedores.
- Cargas de trabalho com contexto de um milhão de tokens podem incorrer em custos operacionais e latência mais elevados do que cargas de trabalho de inferência padrão.
Casos de uso representativos
Engenharia de software em escala de repositório
Analisar bases de código grandes, realizar refatorações em vários arquivos, gerar patches, revisar pull requests e manter contexto de desenvolvimento de longo prazo.
Agentes de pesquisa autônomos
Apoiar revisão de literatura, síntese de documentos, análise de benchmarks e fluxos de trabalho de pesquisa de longa duração que exigem centenas de milhares de tokens.
Análise técnica multimodal
Interpretar capturas de tela, diagramas de arquitetura, gráficos, documentos técnicos e conteúdo de vídeo dentro do mesmo fluxo de raciocínio.
Automação de Terminal e DevOps
Executar fluxos de trabalho de engenharia complexos envolvendo testes, orquestração de implantação, gerenciamento de dependências e depuração iterativa.
Sistemas de conhecimento corporativo
Pesquisar e raciocinar sobre grandes coleções de políticas, contratos, documentação técnica e repositórios de conhecimento internos.
Versão do modelo e disponibilidade
O MiniMax M3 foi oficialmente apresentado em junho de 2026 como o sucessor carro-chefe dentro da linha de modelos MiniMax. O modelo está disponível por meio do ecossistema de API da MiniMax e do CometAPI.