MiniMax‑M1: бірінші ашық салмақ гибридті назар аудару үлгісі

CometAPI
AnnaJun 19, 2025
MiniMax‑M1: бірінші ашық салмақ гибридті назар аудару үлгісі

17 маусымда Шанхай AI бір мүйізді MiniMax ресми түрде ашық бастапқы коды бар MiniMax‑M1, әлемдегі алғашқы ашық салмақты ауқымды гибридті назар аудару үлгісі. Сарапшылар қоспасы (ММ) архитектурасын жаңа Lightning Attention механизмімен біріктіре отырып, MiniMax‑M1 шығару жылдамдығында, өте ұзақ мәтінмәнді өңдеуде және күрделі тапсырмаларды орындауда үлкен жетістіктерге қол жеткізеді.

Фон және эволюция

іргетасы негізінде салу MiniMax-Мәтін-01, ол оқыту кезінде 1 миллион токен контекстіне және қорытынды жасау кезінде 4 миллион таңбалауышқа жету үшін Сарапшылар қоспасы (ММ) құрылымына найзағай назарын енгізді, MiniMax-M1 MiniMax-01 сериясының келесі буынын білдіреді. Алдыңғы үлгідегі MiniMax-Text-01 әр таңбалауыш үшін 456 миллиард белсендірілген 45.9 миллиард жалпы параметрді қамтыды, бұл контекстік мүмкіндіктерді айтарлықтай кеңейте отырып, жоғары деңгейдегі LLM-мен тең өнімділікті көрсетеді.

MiniMax‑M1 негізгі мүмкіндіктері

  • Гибридті MoE + Найзағай Назар аударыңыз: MiniMax‑M1 сарапшылардың сирек қоспасын (жалпы параметрі 456 миллиард, бірақ бір таңбалауыш үшін тек 45.9 миллиард белсендірілген) өте ұзақ тізбектер үшін оңтайландырылған сызықтық күрделілік назарын Lightning Attention көмегімен сақтайды.
  • Ультра-ұзын контекст: дейін қолдайды 1 млн енгізу токендері — DeepSeek‑R128 1 К шегінен шамамен сегіз есе — ауқымды құжаттарды терең түсінуге мүмкіндік береді.
  • Жоғары тиімділік: 100 K таңбалауышты генерациялау кезінде MiniMax‑M1 найзағайына назар аудару DeepSeek‑R25 пайдаланатын есептеудің тек ~30–1%-ын қажет етеді.

Модель нұсқалары

  • MiniMax‑M1‑40K: 1 M таңбалауыш мәтінмәні, 40 К таңбалауыш қорытынды бюджеті
  • MiniMax‑M1‑80K: 1 M таңбалауыш мәтінмәні, 80 К таңбалауыш қорытынды бюджеті
    TAU-стендтік құралдарды пайдалану сценарийлерінде 40K нұсқасы өзінің агент мүмкіндіктерін көрсете отырып, Gemini 2.5 Pro қоса алғанда, барлық ашық үлгілерден асып түсті.

Оқу құны және орнату

MiniMax-M1 кеңейтілген математикалық пайымдаулардан бастап құмсалғышқа негізделген бағдарламалық жасақтама жасау орталарына дейін әртүрлі тапсырмалар жинағында кең ауқымды күшейтуді оқытуды (RL) пайдалану арқылы аяғына дейін оқытылды. Жаңа алгоритм, CISPO (Саясатты оңтайландыру үшін қиылған маңыздылық үлгісі) таңбалауыш деңгейіндегі жаңартулардың орнына маңыздылық іріктеу салмақтарын кесу арқылы оқыту тиімділігін одан әрі арттырады. Модельдің найзағай назарымен біріктірілген бұл тәсіл 512 H800 графикалық процессорында толық RL оқытуды үш аптаның ішінде жалпы жалдау құны $534,700 аяқтауға мүмкіндік берді.

Қолжетімділік және баға белгілеу

MiniMax-M1 астында шығарылады Apache 2.0 ашық бастапқы лицензия және мыналар арқылы бірден қол жеткізуге болады:

  • GitHub репозиторийі, соның ішінде үлгі салмақтары, жаттығу сценарийлері және бағалау көрсеткіштері.
  • SiliconCloud хостинг, екі нұсқаны ұсынатын – 40 K‑токен («M1‑40K») және 80 K‑токен («M1‑80K») — 1 миллион токен шұңқырын қосу жоспарларымен.
  • Баға қазір белгіленген Миллионына ¥4 енгізуге арналған белгілер және Миллионына ¥16 кәсіпорын тұтынушылары үшін қол жетімді көлемдік жеңілдіктермен шығаруға арналған белгілер.

Әзірлеушілер мен ұйымдар MiniMax-M1-ді стандартты API интерфейстері арқылы біріктіре алады, доменге қатысты деректерде дәл баптай алады немесе сезімтал жұмыс жүктемелері үшін жергілікті жерде орналастыра алады.

Тапсырма деңгейінің өнімділігі

Тапсырма санатыНазар аударыңызСалыстырмалы өнімділік
Математика және логикаAIME 2024: 86.0%> Qwen 3, DeepSeek‑R1; жабық көзге жақын
Ұзақ контекстті түсінуСызғыш (4 K–1 M таңбалауышы): тұрақты жоғарғы деңгей4 К таңбалауыш ұзындығынан асатын GPT‑128-тен асып түседі
Бағдарламалық қамтамасыз етуді жобалауSWE-стенд (нақты GitHub қателері): 56%Ашық модельдер арасында ең жақсысы; 2-ден жетекшіге дейін жабық
Агент және құралды пайдалануTAU‑стенд (API симуляциясы)Егіздер 62, Клод 63.5 қарсы 2.5–4%
Диалог және көмекшіMultiChallenge: 44.7%Клод 4, DeepSeek‑R1 сәйкес келеді
Факт QAҚарапайым QA: 18.5%Болашақта жақсартуға арналған аймақ

Ескерту: MiniMax ресми ашылуы мен тәуелсіз жаңалықтар есептерінен алынған пайыздар мен көрсеткіштер

MiniMax‑M1: бірінші ашық салмақ гибридті назар аудару үлгісі

Техникалық инновациялар

  1. Гибридті назар жинағы: Найзағай Назар аударыңыз тиімділік пен модельдеу қуатын теңестіру үшін мерзімді Softmax Attention (квадраттық, бірақ мәнерлі) араласқан қабаттар (сызықтық құны).
  2. Сирек ТМ бағыттау: 32 сарапшылық модуль; әрбір таңбалауыш жалпы параметрлердің ~10% ғана белсендіреді, бұл сыйымдылықты сақтай отырып, қорытынды құнын төмендетеді.
  3. CISPO Reinforment Learning: Оқыту сигналында сирек, бірақ маңызды белгілерді сақтайтын, RL тұрақтылығы мен жылдамдығын жеделдететін «Қосылған IS-салмағы саясатын оңтайландыру» романы.

MiniMax‑M1 ашық салмақты шығарылымы ультра-ұзақ контекст, барлығына арналған жоғары тиімді тұжырымды ашады, бұл зерттеулер мен қолданылатын кең ауқымды AI арасындағы алшақтықты жояды.

Басталу

CometAPI ендірілген API кілтін басқару, пайдалану квоталары және есеп айырысу бақылау тақталары бар дәйекті соңғы нүкте астында жүздеген AI үлгілерін, соның ішінде ChatGPT отбасын біріктіретін бірыңғай REST интерфейсін ұсынады. Бірнеше жеткізушінің URL мекенжайлары мен тіркелгі деректерін араластырудың орнына.

Бастау үшін үлгілердің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз.

Ең соңғы интеграцияланған MiniMax‑M1 API жақын арада CometAPI-де пайда болады, сондықтан хабардар болыңыз! MiniMax‑M1 үлгісін жүктеп салуды аяқтағанша, басқа үлгілерімізді мына жерден зерттеңіз. Модельдер беті немесе оларды ішінде көріңіз AI ойын алаңы. MiniMax-тың CometAPI-дегі соңғы үлгісі Minimax ABAB7-Preview API және MiniMax Video-01 API , мынаны қараңыз:

MiniMax‑M1: бірінші ашық салмақ гибридті назар аудару үлгісі

SHARE THIS BLOG

500+ модель бір API-да

20%-ға дейін жеңілдік