Технические характеристики MiniMax M3
| Параметр | MiniMax M3 |
|---|---|
| Семейство моделей | MiniMax M3 frontier foundation model |
| Поставщик | MiniMax |
| Архитектура | MiniMax Sparse Attention (MSA) |
| Типы ввода | Текст, Изображение, Видео |
| Типы вывода | Текст |
| Окно контекста | До 1,000,000 токенов (минимально гарантировано 512K) |
| Ключевые сильные стороны | Программирование, агентные рабочие процессы, мультимодальное рассуждение, обработка длинного контекста |
| Режим рассуждений | Режимы мышления вкл./выкл. |
| Использование инструментов | Агентные рабочие процессы, вызов инструментов, выполнение задач в терминале |
| Развертывание | API, MiniMax Code, Token Plan, запланированный выпуск открытых весов |
| Мультимодальная поддержка | Нативное мультимодальное предобучение с нулевого шага |
| Дата релиза | Июнь 2026 |
Что такое MiniMax M3?
MiniMax M3 — это модель ИИ передового уровня, ориентированная на три возможности, которые исторически были присущи закрытым системам: продвинутая производительность в программировании, обработка контекста в миллион токенов и нативное мультимодальное понимание. В отличие от моделей, где зрение добавляется как позднее расширение, M3 обучалась как мультимодальная с самого начала, что позволяет глубже согласовать визуальное и текстовое рассуждение.
Модель основана на MiniMax Sparse Attention (MSA) — архитектуре разреженного внимания, призванной сделать миллионные контексты вычислительно практичными при сохранении производительности в задачах программирования, рассуждения и агентных сценариях.
Основные возможности MiniMax M3
- Окно контекста на 1M токенов: Поддерживает чрезвычайно большие репозитории, объемные исследовательские корпуса, анализ нескольких документов и долгие сессии агентов.
- Агентно-ориентированная архитектура: Спроектирована для автономной декомпозиции задач, вызова инструментов, итеративного планирования и многошагового выполнения.
- Нативная мультимодальность: Обрабатывает текст, изображения, диаграммы, скриншоты и видео без отдельного vision-стека.
- Продвинутая способность к программированию: Высокие результаты на инженерных бенчмарках, включая SWE-Bench Pro, Terminal-Bench и KernelBench.
- Дальнодействующее выполнение: Демонстрирует многочасовые автономные процессы, включая воспроизведение исследований и проекты по оптимизации CUDA.
- Конфигурируемые рассуждения: Режим мышления можно включить для более глубоких нагрузок на рассуждение или отключить для меньшей задержки.
Результаты бенчмарков MiniMax M3
MiniMax сообщает о результатах передового уровня в задачах программирования, агентного выполнения и мультимодальной оценки. Сообщаемые результаты включают:
| Бенчмарк | Балл |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
Компания также сообщает, что M3 превосходит GPT-5.5 и Gemini 3.1 Pro на ряде бенчмарков, ориентированных на программирование, и приближается к производительности Claude Opus 4.7 в отдельных оценках. Эти заявления основаны на внутренних публикациях MiniMax по бенчмаркам и должны рассматриваться вместе с независимым тестированием третьих сторон по мере его появления.
Архитектура длинного контекста и MSA
MiniMax Sparse Attention (MSA) — архитектурное нововведение, стоящее за возможностью контекста в миллион токенов у M3. Вместо применения полной квадратичной внимания ко всей последовательности MSA выполняет маршрутизацию на уровне блоков и разреженное внимание по выбранным областям контекста.
По данным MiniMax, это существенно снижает вычислительные требования при больших длинах контекста и обеспечивает:
- Более чем в 9 раз более высокую скорость предзаполнения при длине контекста 1M
- Более чем в 15 раз более быструю скорость декодирования
- Примерно 1/20 вычислений на токен по сравнению с предыдущим поколением при масштабе 1M контекста
Эти улучшения призваны сделать практичными программирование в масштабе репозитория и агентные рабочие процессы с большим горизонтом.
MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Возможность | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Окно контекста | До 1M | Меньшие общедоступные уровни контекста | Большой контекст, мультимодальная |
| Нативное мультимодальное обучение | Да | Да | Да |
| Фокус на агентном кодинге | Очень сильный | Очень сильный | Сильный |
| SWE-Bench Pro | 59.0% | Выше, по данным MiniMax | Ниже, по данным MiniMax |
| Доступность открытых весов | Запланировано | Нет | Нет |
| Агентные процессы с длинным горизонтом | Ключевой фокус дизайна | Сильные | Сильные |
Известные ограничения
- Большинство раскрытий по бенчмаркам в настоящее время исходят от MiniMax, а не от независимых лабораторий оценки.
- Файлы модели с открытыми весами и полный технический отчет были анонсированы, но на момент запуска широко не выпущены.
- Реальная надежность в продуктивных средах все еще проверяется сообществом разработчиков.
- Нагрузки с контекстом в миллион токенов могут приводить к более высоким операционным затратам и задержкам по сравнению со стандартным выводом.
Представительные варианты использования
Инжиниринг ПО в масштабе репозитория
Анализировать крупные кодовые базы, выполнять многофайловые рефакторинги, генерировать патчи, проверять pull request'ы и поддерживать долгосрочный контекст разработки.
Автономные исследовательские агенты
Поддерживать обзор литературы, синтез документов, анализ бенчмарков и длительные исследовательские процессы, требующие сотен тысяч токенов.
Мультимодальный технический анализ
Интерпретировать скриншоты, архитектурные диаграммы, графики, технические документы и видео в рамках одного процесса рассуждения.
Автоматизация терминала и DevOps
Выполнять сложные инженерные процессы, включающие тестирование, оркестрацию развертывания, управление зависимостями и итеративную отладку.
Корпоративные системы знаний
Осуществлять поиск и рассуждение по большим коллекциям политик, контрактов, технической документации и внутренних хранилищ знаний.
Версия модели и доступность
MiniMax M3 официально представлена в июне 2026 года как флагманский преемник в линейке моделей MiniMax. Модель доступна через экосистему MiniMax API и CometAPI.