Tekniske spesifikasjoner for MiniMax‑M2.5

Felt	Påstand / verdi
Modellnavn	MiniMax‑M2.5 (produksjonslansering, 12. feb. 2026).
Arkitektur	Mixture‑of‑Experts (MoE) Transformer (M2‑familien).
Totalt antall parametre	~230 milliarder (total MoE‑kapasitet).
Aktive (per inferens) parametre	~10 milliarder aktivert per inferens (sparsom aktivering).
Inndatatyper	Tekst og kode (native støtte for flerfil‑kodekontekster), verktøykalling / API‑verktøygrensesnitt (agentiske arbeidsflyter).
Utdatatyper	Tekst, strukturerte utdata (JSON/verktøykall), kode (flerfil), Office‑artefakter (PPT/Excel/Word via verktøykjeder).
Varianter / moduser	M2.5 (høy nøyaktighet/kapabilitet) og M2.5‑Lightning (samme kvalitet, lavere latens / høyere TPS).

Hva er MiniMax‑M2.5?

MiniMax‑M2.5 er M2.x‑familiens flaggskipsoppdatering med fokus på real‑world produktivitet og agentiske arbeidsflyter. Lanseringen vektlegger forbedret oppgavedekomponering, verktøy/søke‑integrasjon, nøyaktighet i kodegenerering og token‑effektivitet for utvidede, flertrinns problemer. Modellen tilbys i en standardvariant og en lavlatens «lightning»‑variant for ulike utrullingskompromisser.

Hovedfunksjoner for MiniMax‑M2.5

Agentisk‑først design: Forbedret planlegging og verktøyorkestrering for flertrinns oppgaver (søk, verktøykall, kjørebur for kode).
Token‑effektivitet: Rapporterer reduksjon i tokenforbruk per oppgave sammenlignet med M2.1, som muliggjør lavere ende‑til‑ende kostnader for lange arbeidsflyter.
Raskere ende‑til‑ende fullføring: Leverandørens benchmarking rapporterer gjennomsnittlig oppgavefullføring ~37% raskere enn M2.1 på agentiske kodeevalueringer.
Sterk kodeforståelse: Tunet på flerspråklige kodekorpora for robuste tverrspråklige refaktoreringer, flerfil‑redigeringer og resonnering i repository‑skala.
Høy gjennomstrømming i produksjon: Målrettet mot produksjonsutrullinger med høye token/sek‑profiler; egnet for kontinuerlige agent‑arbeidslaster.
Varianter for kompromiss mellom latens og kraft: M2.5‑lightning tilbyr lavere latens ved lavere beregningsbehov og fotavtrykk for interaktive scenarioer.

Benchmark‑ytelse (rapportert)

Høydepunkter rapportert av leverandør — representative mål (lansering):

SWE‑Bench Verified: 80.2% (rapportert passrate på leverandørens benchmark‑rigg)
BrowseComp (søk og verktøybruk): 76.3%
Multi‑SWE‑Bench (flerspråklig koding): 51.3%
Relativ hastighet / effektivitet: ~37% raskere ende‑til‑ende fullføring vs M2.1 på SWE‑Bench Verified i leverandørtester; ~20% færre søke-/verktøy‑runder i noen evalueringer.

Tolkning: Disse tallene plasserer M2.5 på nivå med eller nær bransjeledende agentiske/kode‑modeller på de siterte benchmarkene. Benchmarker er rapportert av leverandøren og gjengitt av flere økosystemkanaler — betrakt dem som målt under leverandørens rigg/konfigurasjon med mindre de reproduseres uavhengig.

MiniMax‑M2.5 vs konkurrenter (kort sammenligning)

Dimensjon	MiniMax‑M2.5	MiniMax M2.1	Eksempel på konkurrent (Anthropic Opus 4.6)
SWE‑Bench Verified	80.2%	~71–76% (varierer etter rigg)	Sammenlignbar (Opus rapporterte nær toppresultater)
Hastighet på agentiske oppgaver	37% raskere vs M2.1 (leverandørtester)	Grunnlinje	Lignende hastighet på spesifikke rigger
Token‑effektivitet	Forbedret vs M2.1 (~lavere tokens per oppgave)	Høyere tokenbruk	Konkurransedyktig
Beste bruk	Produksjons‑agentiske arbeidsflyter, kodepipeliner	Tidligere generasjon i samme familie	Sterk på multimodal resonnering og sikkerhetsjusterte oppgaver

Leverandørmerknad: sammenligninger stammer fra lanseringsmateriale og leverandørers benchmarkrapporter. Små forskjeller kan være sensitive for rigg, verktøykjede og evalueringsprotokoll.

Representative bedriftsbrukstilfeller

Refaktoreringer i repository‑skala og migreringspipeliner — bevar intensjon på tvers av flerfil‑redigeringer og automatiserte PR‑patcher.
Agentisk orkestrering for DevOps — orkestrer testrunder, CI‑trinn, pakkeinstallasjoner og miljødiagnostikk med verktøyintegrasjoner.
Automatisert koderevisjon og utbedring — triager sårbarheter, foreslå minimale rettelser og forbered reproducerbare testtilfeller.
Søkedrevet informasjonsinnhenting — utnytt BrowseComp‑nivå søkekompetanse til å gjennomføre flerrunds utforskning og oppsummering av tekniske kunnskapsbaser.
Produksjonsagenter og assistenter — kontinuerlige agenter som krever kostnadseffektiv, stabil langtidsinferens.

Slik får du tilgang til og integrerer MiniMax‑M2.5

Trinn 1: Registrer deg for API‑nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn i din CometAPI‑konsoll. Hent tilgangslegitimasjonen API‑nøkkelen for grensesnittet. Klikk «Add Token» ved API‑tokenet i personlig senter, hent token‑nøkkelen: sk‑xxxxx og send inn.

Trinn 2: Send forespørsler til `minimax-m2.5`‑API

Velg «minimax-m2.5» endepunkt for å sende API‑forespørselen og angi forespørselskroppen. Forespørselsmetoden og forespørselskroppen hentes fra API‑dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox‑test for din bekvemmelighet. Erstatt <YOUR_API_KEY> med din faktiske CometAPI‑nøkkel fra kontoen din. Hvor det skal kalles: Chat format.

Sett inn spørsmålet eller forespørselen din i content‑feltet—det er dette modellen vil svare på . Behandle API‑responsen for å hente den genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API‑responsen for å hente den genererte svaret. Etter behandling svarer API‑et med oppgavestatus og utdata.

MiniMax-M2.5 is optimized for real-world productivity and agentic workflows — especially complex coding, multi-stage planning, tool invocation, search, and cross-platform system development. Its training emphasizes handling full development lifecycles from architecture planning to code review and testing.

Compared with M2.1, M2.5 shows significant improvements in task decomposition, token efficiency, and speed — for example completing certain agentic benchmarks about 37% faster and with fewer tokens consumed per task.

M2.5 achieves around 80.2% on SWE-Bench Verified, about 51.3% on Multi-SWE-Bench, and roughly 76.3% on BrowseComp in contexts where task planning and search are enabled — results competitive with flagship models from other providers.

Yes — M2.5 was trained on over 10 programming languages including Python, Java, Rust, Go, TypeScript, C/C++, Ruby, and Dart, enabling it to handle diverse coding tasks across ecosystems.

Yes — MiniMax positions M2.5 to handle full-stack projects spanning Web, Android, iOS, Windows, and Mac, covering design, implementation, iteration, and testing phases.

M2.5 can run at high token throughput (e.g., ~100 tokens/sec) with cost efficiencies about 10–20× lower than many frontier models on an output price basis, enabling scalable deployment of agentic workflows.

MiniMax-M2.5 is available via API endpoints (e.g., standard and high-throughput variants) by specifying minimax-m2.5 as the model in requests.

M2.5 excels at coding and agentic tasks; it may be less specialized for purely creative narrative generation compared with dedicated creative models, so for story writing or creative fiction other models might be preferable.