Can MiniMax M3 process a full software repository in a single context window?

Ja. MiniMax M3 unterstützt ein Kontextfenster mit bis zu 1,000,000 Token, sodass große Repositories, Dokumentationssammlungen und lang andauernde Agentensitzungen innerhalb einer einzigen Unterhaltung analysiert werden können.

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 erreicht bei mehreren Programmierungs- und Agenten-Benchmarks nahezu das Niveau von Claude Opus 4.7 und bietet zugleich ein 1M-Token-Kontextfenster sowie eine geplante Open-Weight-Verfügbarkeit. Unabhängige Vergleiche durch Dritte entstehen derzeit noch.

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 führt die MiniMax Sparse Attention (MSA)-Architektur, natives multimodales Training, stärkere Agentenfähigkeiten und eine deutlich größere Kontextunterstützung als frühere Modelle der M2-Serie ein.

Does the MiniMax M3 API support multimodal inputs?

Ja. MiniMax M3 ist nativ multimodal und unterstützt neben textbasierten Eingaben auch das Verständnis von Bildern und Videos.

What benchmark scores has MiniMax M3 achieved?

MiniMax meldet 59.0% auf SWE-Bench Pro, 66.0% auf Terminal-Bench 2.1, 74.2% auf MCP Atlas und 83.5 auf BrowseComp und positioniert M3 damit unter den führenden, auf Code und Agenten fokussierten Modellen.

Is MiniMax M3 suitable for autonomous AI agents?

Ja. Das Modell wurde speziell für langfristige Agenten-Workflows optimiert, einschließlich Planung, Tool-Nutzung, Aufgabenzerlegung, Terminalausführung und mehrstufiger Problemlösung.

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

MiniMax M3 ist besonders attraktiv, wenn extrem lange Kontextfenster, codeintensive Workflows oder Open-Weight-Bereitstellungsoptionen Priorität haben. Gemini 3.1 Pro kann für Teams, die bereits auf das Google-Ökosystem standardisiert sind, weiterhin vorzuziehen sein.

Erschwingliche MiniMax-M3 API | text-to-text

Playground für MiniMax-M3

Erkunden Sie MiniMax-M3's Playground — eine interaktive Umgebung zum Testen von Modellen und Ausführen von Abfragen in Echtzeit. Probieren Sie Prompts aus, passen Sie Parameter an und iterieren Sie sofort, um die Entwicklung zu beschleunigen und Anwendungsfälle zu validieren.

Technische Spezifikationen von MiniMax M3

Eintrag	MiniMax M3
Modellfamilie	MiniMax M3 Frontier-Foundation-Modell
Anbieter	MiniMax
Architektur	MiniMax Sparse Attention (MSA)
Eingabetypen	Text, Bild, Video
Ausgabetypen	Text
Kontextfenster	Bis zu 1,000,000 Token (mindestens garantiert 512K)
Hauptstärken	Programmierung, agentische Workflows, multimodales Schlussfolgern, Langkontext-Verarbeitung
Denkmodus	Denkmodus an/aus
Tool-Nutzung	Agenten-Workflows, Tool-Aufrufe, Terminal-Aufgaben-Ausführung
Bereitstellung	API, MiniMax Code, Token Plan, bevorstehende Open-Weight-Veröffentlichung
Multimodale Unterstützung	Natives multimodales Pretraining ab Schritt null
Veröffentlichungsdatum	Juni 2026

Was ist MiniMax M3?

MiniMax M3 ist ein KI-Modell der Frontier-Klasse, das um drei Fähigkeiten herum entwickelt wurde, die bisher meist geschlossenen Systemen vorbehalten waren: fortgeschrittene Programmierleistung, Verarbeitung von Kontexten mit einer Million Token und natives multimodales Verständnis. Anders als Modelle, die Vision später als Erweiterung hinzufügen, wurde M3 von Anfang an als multimodales Modell trainiert, was eine engere Ausrichtung zwischen visuellem und textuellem Schlussfolgern ermöglicht.

Das Modell basiert auf MiniMax Sparse Attention (MSA), einer Sparse-Attention-Architektur, die darauf ausgelegt ist, Million-Token-Kontexte rechnerisch praktikabel zu machen, ohne die Leistung bei Programmierung, Reasoning und agentischen Aufgaben zu beeinträchtigen.

Hauptfunktionen von MiniMax M3

1M-Token-Kontextfenster: Unterstützt extrem große Repositories, umfangreiche Forschungskorpora, Analysen über mehrere Dokumente und lang laufende Agentensitzungen.
Agentenorientierte Architektur: Ausgelegt für autonome Aufgabenzerlegung, Tool-Aufrufe, iterative Planung und mehrstufige Ausführung.
Native Multimodalität: Verarbeitet Text, Bilder, Diagramme, Screenshots und Videoinhalte, ohne auf einen separaten Vision-Stack angewiesen zu sein.
Erweiterte Programmierfähigkeit: Starke Leistung auf Software-Engineering-Benchmarks, darunter SWE-Bench Pro, Terminal-Bench und KernelBench.
Ausführung über lange Horizonte: Nachgewiesene mehrstündige autonome Workflows, darunter Forschungsreproduktion und CUDA-Optimierungsprojekte.
Konfigurierbarer Denkmodus: Der Denkmodus kann für tiefere Reasoning-Workloads aktiviert oder für Interaktionen mit geringerer Latenz deaktiviert werden.

Benchmark-Leistung von MiniMax M3

MiniMax berichtet von Benchmark-Ergebnissen auf Frontier-Niveau in den Bereichen Programmierung, agentische Ausführung und multimodale Bewertung. Gemeldete Ergebnisse umfassen:

Benchmark	Punktzahl
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

Das Unternehmen berichtet außerdem, dass M3 GPT-5.5 und Gemini 3.1 Pro bei mehreren programmierorientierten Benchmarks übertrifft und sich in ausgewählten Bewertungen der Leistung von Claude Opus 4.7 annähert. Diese Angaben stammen aus den internen Benchmark-Offenlegungen von MiniMax und sollten zusammen mit unabhängigen Tests durch Dritte interpretiert werden, sobald diese verfügbar sind.

Langkontext-Architektur und MSA

MiniMax Sparse Attention (MSA) ist die architektonische Innovation hinter der Million-Token-Kontextfähigkeit von M3. Anstatt über die gesamte Sequenz vollständige quadratische Attention anzuwenden, führt MSA Block-Routing und Sparse Attention über ausgewählte Kontextbereiche durch.

Laut MiniMax reduziert dies den Rechenaufwand bei großen Kontextlängen erheblich und liefert:

Mehr als 9× schnellere Prefill-Leistung bei 1M Kontextlänge
Mehr als 15× schnellere Decoding-Leistung
Ungefähr 1/20 des Rechenaufwands pro Token gegenüber der vorherigen Generation bei 1M Kontext

Diese Verbesserungen sollen Coding im Repository-Maßstab und agentische Workflows mit langem Zeithorizont praktikabel machen.

MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Fähigkeit	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
Kontextfenster	Bis zu 1M	Kleinere öffentlich verfügbare Kontextstufen	Multimodal mit großem Kontext
Natives multimodales Training	Ja	Ja	Ja
Agentischer Coding-Fokus	Sehr stark	Sehr stark	Stark
SWE-Bench Pro	59.0%	Höher laut MiniMax-Angaben	Niedriger laut MiniMax-Angaben
Open-Weight-Verfügbarkeit	Geplant	Nein	Nein
Agenten-Workflows mit langem Zeithorizont	Zentraler Designfokus	Stark	Stark

Bekannte Einschränkungen

Die meisten Benchmark-Offenlegungen stammen derzeit von MiniMax und nicht von unabhängigen Evaluierungslaboren.
Open-Weight-Modelldateien und der vollständige technische Bericht wurden angekündigt, waren zum Start jedoch noch nicht breit verfügbar.
Die Zuverlässigkeit in realen Produktionsumgebungen wird noch von der Entwicklercommunity validiert.
Workloads mit Million-Token-Kontext können höhere Betriebskosten und Latenzen als Standard-Inferenz-Workloads verursachen.

Repräsentative Anwendungsfälle

Softwareentwicklung im Repository-Maßstab

Große Codebasen analysieren, mehrdateilige Refactorings durchführen, Patches generieren, Pull Requests prüfen und langfristigen Entwicklungskontext beibehalten.

Autonome Forschungsagenten

Literaturrecherche, Dokumentensynthese, Benchmark-Analyse und lang laufende Forschungs-Workflows mit Hunderttausenden von Token unterstützen.

Multimodale technische Analyse

Screenshots, Architekturdiagramme, Diagramme, technische Dokumente und Videoinhalte im selben Reasoning-Workflow interpretieren.

Terminal- und DevOps-Automatisierung

Komplexe Engineering-Workflows ausführen, darunter Tests, Deployment-Orchestrierung, Abhängigkeitsmanagement und iteratives Debugging.

Unternehmensweite Wissenssysteme

In großen Sammlungen von Richtlinien, Verträgen, technischer Dokumentation und internen Wissensbeständen suchen und darüber schlussfolgern.

Modellversion und Verfügbarkeit

MiniMax M3 wurde im Juni 2026 offiziell als Flaggschiff-Nachfolger innerhalb der MiniMax-Modellreihe vorgestellt. Das Modell ist über das MiniMax-API-Ökosystem und die CometAPI verfügbar.

FAQ

Preise für MiniMax-M3

Entdecken Sie wettbewerbsfähige Preise für MiniMax-M3, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie MiniMax-M3 Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

Comet-Preis (USD / M Tokens)	Offizieller Preis (USD / M Tokens)	Rabatt
Eingabe:$0.48/M Ausgabe:$1.92/M	Eingabe:$0.6/M Ausgabe:$2.4/M	-20%

Beispielcode und API für MiniMax-M3

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für MiniMax-M3 zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von MiniMax-M3 in Ihren Projekten zu nutzen.

POST

/v1/chat/completions

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.

"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.

"
                "Output format:
"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Curl Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Uptime

Anfrageerfolgsrate der letzten 30 Tage, die die Zuverlässigkeit jedes Modellanbieters widerspiegelt. CometAPI überwacht alle verbundenen Anbieter rund um die Uhr in Echtzeit.

RespondLIVE

782msAvg. Response

UptimeLIVE

100.0%Avg. Uptime

Versionen von MiniMax-M3

Der Grund, warum MiniMax-M3 mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.

version
minimax-m3