Технические характеристики MiniMax‑M2.5
| Поле | Заявление / значение |
|---|---|
| Название модели | MiniMax-M2.5 (production release, 12 февр. 2026). |
| Архитектура | Mixture-of-Experts (MoE) Transformer (семейство M2). |
| Общее количество параметров | ~230 миллиардов (общая ёмкость MoE). |
| Активные параметры (на инференс) | ~10 миллиардов активируются на один инференс (разреженная активация). |
| Типы входных данных | Текст и код (нативная поддержка многофайловых контекстов кода), tool-calling / интерфейсы API-инструментов (agentic workflows). |
| Типы выходных данных | Текст, структурированные выходные данные (JSON/tool calls), код (многофайловый), артефакты Office (PPT/Excel/Word через цепочки инструментов). |
| Варианты / режимы | M2.5 (высокая точность/возможности) и M2.5-Lightning (то же качество, меньшая задержка / более высокий TPS). |
Что такое MiniMax‑M2.5?
MiniMax‑M2.5 — это флагманское обновление семейства M2.x, ориентированное на реальную продуктивность и agentic workflows. В релизе акцент сделан на улучшенной декомпозиции задач, интеграции инструментов/поиска, точности генерации кода и эффективности использования токенов для длительных многошаговых задач. Модель предлагается в стандартном варианте и в варианте “lightning” с пониженной задержкой, предназначенных для разных компромиссов при развёртывании.
Основные особенности MiniMax‑M2.5
- Дизайн agentic-first: Улучшенное планирование и оркестрация инструментов для многоэтапных задач (поиск, вызовы инструментов, среды выполнения кода).
- Эффективность токенов: Сообщается о снижении потребления токенов на задачу по сравнению с M2.1, что позволяет уменьшить сквозные затраты для длинных рабочих процессов.
- Более быстрое сквозное выполнение: По данным бенчмарков провайдера, среднее время завершения задач примерно на ~37% быстрее, чем у M2.1, в agentic-оценках кодирования.
- Сильное понимание кода: Модель дообучена на многоязычных корпусах кода для надёжных межъязыковых рефакторингов, многофайловых правок и рассуждений на уровне репозитория.
- Высокопроизводительное обслуживание: Ориентирована на production-развёртывания с высокими показателями token/sec; подходит для непрерывных агентных нагрузок.
- Варианты для компромисса между задержкой и мощностью: M2.5‑lightning предлагает меньшую задержку при меньших вычислительных затратах и размере для интерактивных сценариев.
Производительность в бенчмарках (reported)
Основные показатели, reported провайдером — репрезентативные метрики (релиз):
- SWE‑Bench Verified: 80.2% (reported pass rate в benchmark harnesses провайдера)
- BrowseComp (search & tool use): 76.3%
- Multi‑SWE‑Bench (многоязычное программирование): 51.3%
- Относительная скорость / эффективность: ~37% более быстрое сквозное завершение по сравнению с M2.1 на SWE‑Bench Verified в тестах провайдера; ~20% меньше раундов поиска/инструментов в некоторых оценках.
Интерпретация: Эти показатели выводят M2.5 на уровень или близко к ведущим в отрасли agentic/code-моделям по указанным бенчмаркам. Бенчмарки reported провайдером и воспроизведены рядом источников экосистемы — рассматривайте их как измеренные в рамках harness/configuration провайдера, если они не воспроизведены независимо.
MiniMax‑M2.5 по сравнению с аналогами (краткое сравнение)
| Параметр | MiniMax‑M2.5 | MiniMax M2.1 | Пример аналога (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (зависит от harness) | Сопоставимо (для Opus сообщаются результаты, близкие к лучшим) |
| Скорость agentic-задач | На 37% быстрее по сравнению с M2.1 (тесты провайдера) | Базовый уровень | Сопоставимая скорость на отдельных harnesses |
| Эффективность токенов | Улучшена по сравнению с M2.1 (~меньше токенов на задачу) | Более высокое потребление токенов | Конкурентоспособно |
| Лучшее применение | Production agentic workflows, конвейеры кодирования | Более раннее поколение того же семейства | Сильна в мультимодальном рассуждении и задачах с настройкой на безопасность |
Примечание провайдера: сравнения основаны на материалах релиза и отчётах о vendor benchmark. Небольшие различия могут сильно зависеть от harness, toolchain и протокола оценки.
Репрезентативные корпоративные сценарии использования
- Рефакторинг на уровне репозитория и конвейеры миграции — сохранение намерения при многофайловых правках и автоматизированных PR-патчах.
- Agentic-оркестрация для DevOps — оркестрация тестовых запусков, шагов CI, установки пакетов и диагностики среды с интеграцией инструментов.
- Автоматизированный обзор кода и исправление — триаж уязвимостей, предложение минимальных исправлений и подготовка воспроизводимых тестовых случаев.
- Поисково-управляемое извлечение информации — использование компетенций поиска уровня BrowseComp для многораундового исследования и суммаризации технических баз знаний.
- Production-агенты и ассистенты — непрерывные агенты, которым требуется экономичный по стоимости и стабильный длительный инференс.
Как получить доступ к MiniMax‑M2.5 и интегрировать его
Шаг 1: Зарегистрируйтесь для получения API Key
Войдите на cometapi.com. Если вы ещё не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь. Войдите в консоль CometAPI. Получите учётные данные доступа — API key интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите token key: sk-xxxxx и отправьте его.
Шаг 2: Отправьте запросы к API minimax-m2.5
Выберите endpoint “minimax-m2.5”, чтобы отправить API-запрос, и задайте тело запроса. Метод запроса и тело запроса можно получить из API doc на нашем сайте. На нашем сайте также доступен тест Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашей учётной записи. Где вызывать: формат Chat.
Вставьте ваш вопрос или запрос в поле content — именно на него модель ответит. Обработайте API-ответ, чтобы получить сгенерированный ответ.
Шаг 3: Получите и проверьте результаты
Обработайте API-ответ, чтобы получить сгенерированный ответ. После обработки API возвращает статус задачи и выходные данные.