Технические характеристики MiniMax‑M2.5

Поле	Утверждение / значение
Название модели	MiniMax-M2.5 (промышленный релиз, 12 февраля 2026 г.).
Архитектура	Трансформер Mixture‑of‑Experts (MoE) (семейство M2).
Всего параметров	~230 миллиардов (общая емкость MoE).
Активные параметры (на инференс)	~10 миллиардов активируются на один инференс (разреженная активация).
Типы входных данных	Текст и код (нативная поддержка многофайловых контекстов кода), вызов инструментов / интерфейсы инструментов API (агентные рабочие процессы).
Типы выходных данных	Текст, структурированные выводы (JSON/вызовы инструментов), код (многофайловый), офисные артефакты (PPT/Excel/Word через цепочки инструментов).
Варианты / режимы	M2.5 (высокая точность/возможности) и M2.5‑Lightning (то же качество, меньшая задержка / более высокий TPS).

Что такое MiniMax‑M2.5?

MiniMax‑M2.5 — флагманское обновление семейства M2.x, ориентированное на практическую продуктивность и агентные рабочие процессы. В релизе сделан упор на улучшенную декомпозицию задач, интеграцию инструментов/поиска, точность генерации кода и эффективность по токенам для расширенных многошаговых задач. Модель предлагается в стандартном варианте и варианте с меньшей задержкой «lightning» для разных компромиссов развертывания.

Основные возможности MiniMax‑M2.5

Agentic-first design: улучшены планирование и оркестрация инструментов для многоэтапных задач (поиск, вызовы инструментов, обвязки для выполнения кода).
Эффективность использования токенов: сообщается о снижении потребления токенов на задачу по сравнению с M2.1, что уменьшает сквозные затраты для длинных рабочих процессов.
Более быстрое сквозное выполнение: по данным бенчмаркинга провайдера среднее время завершения задач на ~37% быстрее, чем у M2.1, на агентных оценках по программированию.
Глубокое понимание кода: модель обучена на многоязычных корпусах кода для надежных межъязыковых рефакторингов, многофайловых правок и рассуждений в масштабе репозиториев.
Высокая пропускная способность сервинга: нацелена на промышленную эксплуатацию с высокими профилями токенов/с; подходит для непрерывных агентных нагрузок.
Варианты с компромиссами задержка/мощность: M2.5‑lightning обеспечивает меньшую задержку при меньшей вычислительной нагрузке и ресурсном следе для интерактивных сценариев.

Результаты бенчмарков (сообщенные)

Ключевые показатели по данным провайдера — репрезентативные метрики (релиз):

SWE‑Bench Verified: 80.2% (сообщаемая доля прохождения на стендах бенчмарков провайдера)

BrowseComp (поиск и использование инструментов): 76.3%

Multi‑SWE‑Bench (многоязычное программирование): 51.3%

Относительная скорость / эффективность: ~37% быстрее сквозное выполнение по сравнению с M2.1 на SWE‑Bench Verified в тестах провайдера; ~20% меньше раундов поиска/инструментов в некоторых оценках.

Интерпретация: Эти цифры ставят M2.5 на уровень паритета или близко к отраслевым лидерам среди агентных/кодовых моделей на указанных бенчмарках. Показатели предоставлены провайдером и воспроизведены рядом источников экосистемы — рассматривайте их как измеренные под стендом/конфигурацией провайдера, если не воспроизведено независимо.

MiniMax‑M2.5 по сравнению с аналогами (кратко)

Параметр	MiniMax‑M2.5	MiniMax M2.1	Пример аналога (Anthropic Opus 4.6)
SWE‑Bench Verified	80.2%	~71–76% (зависит от стенда)	Сопоставимо (для Opus сообщались близкие к лидерам результаты)
Скорость агентных задач	на 37% быстрее vs M2.1 (тесты провайдера)	Базовый уровень	Схожая скорость на отдельных стендах
Эффективность по токенам	Улучшена по сравнению с M2.1 (~меньше токенов на задачу)	Большее потребление токенов	Конкурентоспособно
Лучшие сценарии	Промышленные агентные рабочие процессы, конвейеры разработки	Раннее поколение той же линейки	Сильна в мультимодальных рассуждениях и задачах с акцентом на безопасность

Примечание провайдера: сравнения основаны на материалах релиза и отчетах вендора по бенчмаркам. Небольшие различия чувствительны к стендам, инструментальной цепочке и протоколу оценки.

Типовые корпоративные сценарии

Рефакторинг в масштабе репозитория и конвейеры миграции — сохранение замысла при многофайловых правках и автоматизированных патчах PR.
Агентная оркестрация для DevOps — оркестрация запусков тестов, этапов CI, установки пакетов и диагностики окружений с интеграцией инструментов.
Автоматизированный код‑ревью и ремедиация — приоритизация уязвимостей, предложение минимальных исправлений и подготовка воспроизводимых тестов.
Поисково‑ориентированный поиск информации — использование компетенции поиска уровня BrowseComp для многократного исследования и суммаризации технических баз знаний.
Продуктовые агенты и ассистенты — непрерывные агенты, которым требуется экономичный и стабильный длительный инференс.

Как получить доступ и интегрировать MiniMax‑M2.5

Шаг 1: Получите ключ API

Войдите на cometapi.com. Если вы ещё не наш пользователь, сначала зарегистрируйтесь. Войдите в свою консоль CometAPI. Получите учетные данные — ключ API для интерфейса. В личном кабинете в разделе API token нажмите «Add Token», получите ключ токена: sk-xxxxx и отправьте.

Шаг 2: Отправьте запросы к API `minimax-m2.5`

Выберите конечную точку «minimax-m2.5» для отправки запроса API и задайте тело запроса. Метод запроса и тело запроса берите из документации API на нашем сайте. На нашем сайте также доступен тест Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашего аккаунта. Где вызывать: формат Chat.

Вставьте ваш вопрос или запрос в поле content — именно на него модель ответит. Обработайте ответ API, чтобы получить сгенерированный ответ.

Шаг 3: Получите и проверьте результаты

Обработайте ответ API, чтобы получить сгенерированный ответ. После обработки API отвечает статусом задачи и выходными данными.