Tekniske specifikationer for MiniMax‑M2.5
| Field | Claim / value |
|---|---|
| Model name | MiniMax-M2.5 (produktionsudgivelse, 12. feb. 2026). |
| Architecture | Mixture-of-Experts (MoE) Transformer (M2-familien). |
| Total parameters | ~230 milliarder (samlet MoE-kapacitet). |
| Active (per-inference) parameters | ~10 milliarder aktiveret pr. inferens (sparsom aktivering). |
| Input types | Tekst og kode (indbygget understøttelse af kodekontekster med flere filer), tool-calling / API-værktøjsgrænseflader (agentiske workflows). |
| Output types | Tekst, strukturerede output (JSON/tool calls), kode (flere filer), Office-artefakter (PPT/Excel/Word via værktøjskæder). |
| Variants / modes | M2.5 (høj nøjagtighed/kapacitet) og M2.5-Lightning (samme kvalitet, lavere latenstid / højere TPS). |
Hvad er MiniMax‑M2.5?
MiniMax‑M2.5 er flagskibsopdateringen i M2.x-familien med fokus på produktivitet i den virkelige verden og agentiske workflows. Udgivelsen lægger vægt på forbedret opgavedekomponering, integration af værktøjer/søgning, højere troværdighed i kodegenerering og tokeneffektivitet til udvidede problemer i flere trin. Modellen tilbydes i en standardvariant og en variant med lavere latenstid, “lightning”, som er beregnet til forskellige kompromiser i implementering.
Hovedfunktioner i MiniMax‑M2.5
- Agentic-first-design: Forbedret planlægning og værktøjsorkestrering til opgaver i flere faser (søgning, tool calls, kodeeksekveringsmiljøer).
- Tokeneffektivitet: Rapporterede reduktioner i tokenforbrug pr. opgave sammenlignet med M2.1, hvilket muliggør lavere end-to-end-omkostninger for lange workflows.
- Hurtigere end-to-end-fuldførelse: Udbyderens benchmarkrapporter angiver gennemsnitlige opgavefuldførelsestider på ~37 % hurtigere end M2.1 i agentiske kodeevalueringer.
- Stærk kodeforståelse: Tunet på flersprogede kodekorpora for robuste refaktoreringer på tværs af sprog, redigeringer i flere filer og ræsonnering i repositorieskala.
- Servering med høj throughput: Målrettet produktionsimplementeringer med høje token/sek.-profiler; egnet til kontinuerlige agentarbejdsbelastninger.
- Varianter til kompromiser mellem latenstid og ydeevne: M2.5‑lightning tilbyder lavere latenstid ved lavere compute-forbrug og mindre footprint til interaktive scenarier.
Benchmarkydelse (rapporteret)
Højdepunkter rapporteret af udbyderen — repræsentative målinger (udgivelse):
- SWE‑Bench Verified: 80.2% (rapporteret beståelsesrate på udbyderens benchmarkmiljøer)
- BrowseComp (søgning og værktøjsbrug): 76.3%
- Multi‑SWE‑Bench (flersproget kodning): 51.3%
- Relativ hastighed / effektivitet: ~37% hurtigere end-to-end-fuldførelse vs. M2.1 på SWE‑Bench Verified i udbydertests; ~20 % færre søge-/værktøjsrunder i nogle evalueringer.
Fortolkning: Disse tal placerer M2.5 på niveau med eller tæt på branchens førende agentiske/kodemodeller på de nævnte benchmarks. Benchmarks er rapporteret af udbyderen og gengivet af flere aktører i økosystemet — betragt dem som målt under udbyderens miljø/konfiguration, medmindre de er uafhængigt reproduceret.
MiniMax‑M2.5 vs. andre modeller (kort sammenligning)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | Peer example (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (varierer efter miljø) | Sammenlignelig (Opus rapporterede resultater nær toppen) |
| Agentic task speed | 37% hurtigere vs. M2.1 (udbydertests) | Baseline | Lignende hastighed i specifikke miljøer |
| Token efficiency | Forbedret vs. M2.1 (~færre tokens pr. opgave) | Højere tokenforbrug | Konkurrencedygtig |
| Best use | Produktionsklare agentiske workflows, kodepipelines | Tidligere generation i samme familie | Stærk til multimodal ræsonnering og sikkerhedstunede opgaver |
Note fra udbyderen: sammenligninger er afledt af udgivelsesmaterialer og leverandørers benchmarkrapporter. Små forskelle kan være følsomme over for miljø, værktøjskæde og evalueringsprotokol.
Repræsentative enterprise-use cases
- Refaktoreringer i repositorieskala og migrationspipelines — bevar hensigten på tværs af redigeringer i flere filer og automatiserede PR-patches.
- Agentisk orkestrering til DevOps — orkestrer testkørsler, CI-trin, pakkeinstallationer og miljødiagnostik med værktøjsintegrationer.
- Automatiseret kodegennemgang og afhjælpning — triager sårbarheder, foreslå minimale rettelser og forbered reproducerbare testcases.
- Søgedrevet informationssøgning — udnyt BrowseComp-niveauets søgekompetence til at udføre udforskning i flere runder og opsummering af tekniske vidensbaser.
- Produktionsagenter og assistenter — kontinuerlige agenter, der kræver omkostningseffektiv og stabil inferens over lang tid.
Sådan får du adgang til og integrerer MiniMax‑M2.5
Trin 1: Tilmeld dig en API-nøgle
Log ind på cometapi.com. Hvis du endnu ikke er bruger hos os, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent adgangsoplysningen API key til grænsefladen. Klik på “Add Token” under API token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend den.
Trin 2: Send anmodninger til minimax-m2.5 API
Vælg endpointet “minimax-m2.5” for at sende API-anmodningen og angive request body. Request method og request body findes i API-dokumentationen på vores website. Vores website tilbyder også Apifox-test for nemheds skyld. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Hvor det kaldes: Chat format.
Indsæt dit spørgsmål eller din anmodning i content-feltet — det er dette, modellen vil svare på. Behandl API-svaret for at få det genererede svar.
Trin 3: Hent og verificer resultater
Behandl API-svaret for at få det genererede svar. Efter behandling svarer API’et med opgavestatus og outputdata.