Technische Spezifikationen von MiniMax‑M2.5
| Feld | Angabe/Wert |
|---|---|
| Modellname | MiniMax‑M2.5 (Produktionsrelease, 12. Februar 2026). |
| Architektur | Mixture‑of‑Experts (MoE) Transformer (M2‑Familie). |
| Gesamtparameter | ~230 Milliarden (gesamte MoE‑Kapazität). |
| Aktive Parameter (pro Inferenz) | ~10 Milliarden pro Inferenz aktiviert (sparse Activation). |
| Eingabetypen | Text und Code (native Unterstützung für Code‑Kontexte mit mehreren Dateien), Tool‑Aufrufe/API‑Tool‑Schnittstellen (agentenbasierte Workflows). |
| Ausgabetypen | Text, strukturierte Ausgaben (JSON/Toolaufrufe), Code (mehrere Dateien), Office‑Artefakte (PPT/Excel/Word über Toolchains). |
| Varianten/Modi | M2.5 (hohe Genauigkeit/Leistungsfähigkeit) und M2.5‑Lightning (gleiche Qualität, geringere Latenz/höherer TPS). |
Was ist MiniMax‑M2.5?
MiniMax‑M2.5 ist das Flaggschiff‑Update der M2.x‑Familie mit Fokus auf reale Produktivität und agentenbasierte Workflows. Das Release legt den Schwerpunkt auf verbesserte Aufgabendekomposition, Tool-/Suche‑Integration, Genauigkeit der Codegenerierung und Token‑Effizienz für umfangreiche, mehrstufige Aufgaben. Das Modell wird in einer Standard‑ und einer latenzärmeren „Lightning“-Variante für unterschiedliche Bereitstellungs‑Trade‑offs angeboten.
Hauptfunktionen von MiniMax‑M2.5
- Agentenorientiertes Design: Verbesserte Planung und Tool‑Orchestrierung für mehrstufige Aufgaben (Suche, Toolaufrufe, Code‑Ausführungsharnesse).
- Token‑Effizienz: Berichtete Reduktionen des Token‑Verbrauchs pro Aufgabe gegenüber M2.1, was geringere End‑to‑End‑Kosten für lange Workflows ermöglicht.
- Schnellere End‑to‑End‑Erledigung: Anbieter‑Benchmarks berichten durchschnittlich ~37% schnellere Aufgabenerledigung als M2.1 bei agentenbasierten Coding‑Evaluierungen.
- Starke Code‑Verständnisfähigkeiten: Auf mehrsprachigen Codekorpora abgestimmt für robuste sprachübergreifende Refactorings, Mehrdatei‑Edits und Reasoning auf Repository‑Ebene.
- High‑Throughput‑Serving: Ausgelegt für Produktivdeployments mit hohen Token/s‑Profilen; geeignet für kontinuierliche Agent‑Workloads.
- Varianten für Latenz‑ vs. Leistungs‑Trade‑offs: M2.5‑Lightning bietet geringere Latenz bei niedrigerem Compute‑Aufwand und Footprint für interaktive Szenarien.
Benchmark‑Leistung (gemeldet)
Vom Anbieter gemeldete Highlights — repräsentative Metriken (Release):
- SWE‑Bench Verified: 80.2% (gemeldete Erfolgsrate auf den Benchmark‑Harnessen des Anbieters)
- BrowseComp (Suche & Toolnutzung): 76.3%
- Multi‑SWE‑Bench (mehrsprachiges Coding): 51.3%
- Relative Geschwindigkeit/Effizienz: ~37% schnellere End‑to‑End‑Erledigung vs. M2.1 auf SWE‑Bench Verified in Anbietertests; ~20% weniger Such-/Tool‑Runden in einigen Evaluierungen.
Interpretation: Diese Werte positionieren M2.5 auf Augenhöhe mit oder nahe bei branchenführenden Agenten-/Codemodellen auf den genannten Benchmarks. Benchmarks werden vom Anbieter berichtet und von mehreren Akteuren im Ökosystem reproduziert — betrachten Sie sie als unter dem Harness/Konfigurationssetup des Anbieters gemessen, sofern nicht unabhängig reproduziert.
MiniMax‑M2.5 vs. Peers (knapper Vergleich)
| Dimension | MiniMax‑M2.5 | MiniMax M2.1 | Peer‑Beispiel (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (je nach Harness) | Vergleichbar (Opus mit nahezu Spitzenergebnissen) |
| Agenten‑Task‑Speed | 37% schneller vs. M2.1 (Anbietertests) | Basiswert | Ähnliche Geschwindigkeit auf spezifischen Harnessen |
| Token‑Effizienz | Verbessert ggü. M2.1 (~weniger Tokens/Aufgabe) | Höherer Token‑Verbrauch | Wettbewerbsfähig |
| Empfohlener Einsatz | Produktionsreife agentenbasierte Workflows, Coding‑Pipelines | Frühere Generation derselben Familie | Stark bei multimodalem Reasoning und sicherheitsabgestimmten Aufgaben |
Hinweis des Anbieters: Vergleiche stammen aus Release‑Materialien und Anbieter‑Benchmarkberichten. Kleine Unterschiede können sensitiv gegenüber Harness, Toolchain und Evaluationsprotokoll sein.
Repräsentative Enterprise‑Anwendungsfälle
- Refactorings im Repository‑Maßstab & Migrationspipelines — erhält die Intention über Mehrdatei‑Änderungen und automatisierte PR‑Patches hinweg.
- Agenten‑Orchestrierung für DevOps — orchestriert Testläufe, CI‑Schritte, Paketinstallationen und Umgebungsdiagnosen mit Tool‑Integrationen.
- Automatisiertes Code‑Review & Remediation — priorisiert Schwachstellen, schlägt minimale Fixes vor und bereitet reproduzierbare Testfälle vor.
- Suchgetriebene Informationsrecherche — nutzt BrowseComp‑Niveau in der Suchkompetenz für mehrrunde Exploration und Zusammenfassung technischer Wissensbasen.
- Produktionsagenten & Assistenten — kontinuierliche Agenten, die kosteneffiziente, stabile Langzeitinferenz erfordern.
Zugriff und Integration von MiniMax‑M2.5
Schritt 1: Für API‑Schlüssel registrieren
Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI‑Konsole an. Beziehen Sie den Zugriffs‑API‑Schlüssel der Schnittstelle. Klicken Sie beim API‑Token im persönlichen Bereich auf „Add Token“, erhalten Sie den Token‑Key: sk-xxxxx und senden Sie ihn ab.
Schritt 2: Anfragen an die minimax-m2.5‑API senden
Wählen Sie den „minimax-m2.5“-Endpoint, um die API‑Anfrage zu senden, und setzen Sie den Request‑Body. Die Request‑Methode und der Request‑Body sind in der API‑Dokumentation auf unserer Website beschrieben. Unsere Website stellt außerdem Apifox‑Tests zu Ihrer Bequemlichkeit bereit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI‑Key aus Ihrem Konto. Aufrufort: Chat‑Format.
Fügen Sie Ihre Frage oder Anforderung in das content‑Feld ein — darauf antwortet das Modell. Verarbeiten Sie die API‑Antwort, um die generierte Antwort zu erhalten.
Schritt 3: Ergebnisse abrufen und verifizieren
Verarbeiten Sie die API‑Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Taskstatus und den Ausgabedaten.