Can MiniMax M3 process a full software repository in a single context window?

Ja. MiniMax M3 understøtter et kontekstvindue på op til 1,000,000 tokens, hvilket gør det muligt at analysere store repositories, dokumentationssæt og langvarige agentsessioner i en enkelt samtale.

How does MiniMax M3 compare to Claude Opus 4.7 for coding tasks?

M3 nærmer sig Claude Opus 4.7 på flere kode- og agentbenchmarks og tilbyder samtidig et 1M-token kontekstvindue samt planlagt open-weight-tilgængelighed. Uafhængige tredjepartssammenligninger er stadig ved at dukke op.

What makes MiniMax M3 different from previous MiniMax models?

MiniMax M3 introducerer MiniMax Sparse Attention (MSA)-arkitekturen, nativ multimodal træning, stærkere agentkapaciteter og markant større kontekstunderstøttelse end tidligere M2-seriemodeller.

Does the MiniMax M3 API support multimodal inputs?

Ja. MiniMax M3 er nativt multimodal og understøtter forståelse af billeder og video ud over tekstbaserede input.

What benchmark scores has MiniMax M3 achieved?

MiniMax rapporterer 59.0% på SWE-Bench Pro, 66.0% på Terminal-Bench 2.1, 74.2% på MCP Atlas og 83.5 på BrowseComp, hvilket placerer M3 blandt de førende kode- og agentfokuserede modeller.

Is MiniMax M3 suitable for autonomous AI agents?

Ja. Modellen blev specifikt optimeret til agentarbejdsgange med lang horisont, herunder planlægning, værktøjsbrug, opgaveopdeling, terminaludførelse og problemløsning i flere trin.

When should developers choose MiniMax M3 instead of Gemini 3.1 Pro?

MiniMax M3 er særligt attraktiv, når ekstremt lange kontekstvinduer, kodetunge arbejdsgange eller open-weight-implementeringsmuligheder er prioriteter. Gemini 3.1 Pro kan fortsat være at foretrække for teams, der allerede er standardiseret på Googles økosystem.

Overkommelig MiniMax-M3 API | text-to-text

Playground for MiniMax-M3

Udforsk MiniMax-M3's Playground — et interaktivt miljø til at teste modeller og køre forespørgsler i realtid. Prøv prompts, juster parametre og iterer øjeblikkeligt for at fremskynde udvikling og validere use cases.

Tekniske specifikationer for MiniMax M3

Element	MiniMax M3
Modelfamilie	MiniMax M3 frontier-grundmodel
Udbyder	MiniMax
Arkitektur	MiniMax Sparse Attention (MSA)
Inputtyper	Tekst, billede, video
Outputtyper	Tekst
Kontekstvindue	Op til 1,000,000 tokens (minimum garanteret 512K)
Primære styrker	Kodning, agentiske arbejdsgange, multimodal ræsonnering, behandling af lange kontekster
Ræsonneringstilstand	Til/fra-tilstand for tænkning
Værktøjsanvendelse	Agent-arbejdsgange, værktøjskald, udførelse af terminalopgaver
Udrulning	API, MiniMax Code, Token Plan, kommende open-weight-udgivelse
Multimodal understøttelse	Indbygget multimodal fortræning fra første trin
Udgivelsesdato	juni 2026

Hvad er MiniMax M3?

MiniMax M3 er en AI-model i frontier-skala, designet omkring tre kapaciteter, der historisk set har været begrænset til closed-source-systemer: avanceret kodningsydelse, behandling af kontekster i million-token-størrelse og indbygget multimodal forståelse. I modsætning til modeller, der tilføjer vision som en senere udvidelse, blev M3 trænet som en multimodal model fra begyndelsen, hvilket muliggør dybere afstemning mellem visuel og tekstuel ræsonnering.

Modellen er bygget på MiniMax Sparse Attention (MSA), en sparse-attention-arkitektur designet til at gøre million-token-kontekster beregningsmæssigt praktiske samtidig med at ydeevnen i kodning, ræsonnering og agentiske opgaver bevares.

Vigtigste funktioner i MiniMax M3

1M-token-kontekstvindue: Understøtter ekstremt store repositories, omfattende forskningskorpora, multidokumentanalyse og langvarige agent-sessioner.
Agent-orienteret arkitektur: Designet til autonom opgadenedbrydning, værktøjskald, iterativ planlægning og flertrinsudførsel.
Indbygget multimodalitet: Behandler tekst, billeder, diagrammer, skærmbilleder og video-input uden at være afhængig af en separat vision-stack.
Avanceret kodningskapacitet: Stærk ydeevne på software engineering-benchmarks, herunder SWE-Bench Pro, Terminal-Bench og KernelBench.
Udførsel over lange tidshorisonter: Demonstreret fler-timers autonome workflows, inkl. reproduktion af forskning og CUDA-optimeringsprojekter.
Konfigurerbar ræsonnering: Tænkningstilstand kan aktiveres til dybere ræsonneringsarbejdslaster eller deaktiveres for lavere latenstid.

Benchmark-ydelse for MiniMax M3

MiniMax rapporterer frontier-niveau-resultater på tværs af kodning, agentisk udførelse og multimodale evalueringer. Rapporterede resultater omfatter:

Benchmark	Score
SWE-Bench Pro	59.0%
Terminal-Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BrowseComp	83.5
PostTrainBench	37.1

Selskabet rapporterer også, at M3 overgår GPT-5.5 og Gemini 3.1 Pro på flere kodningsorienterede benchmarks, samtidig med at den nærmer sig Claude Opus 4.7s ydeevne i udvalgte evalueringer. Disse påstande stammer fra MiniMax' interne benchmark-offentliggørelser og bør tolkes sammen med uafhængige tredjeparts-tests, efterhånden som de bliver tilgængelige.

Arkitektur til lange kontekster og MSA

MiniMax Sparse Attention (MSA) er den arkitektoniske innovation bag M3's million-token-kontekstkapabilitet. I stedet for at anvende fuld kvadratisk attention over hele sekvensen udfører MSA routing på blokniveau og sparse attention over udvalgte kontekstområder.

Ifølge MiniMax reducerer dette beregningskravene markant ved store kontekstlængder og giver:

Mere end 9× hurtigere prefill-ydeevne ved 1M kontekstlængde
Mere end 15× hurtigere afkodningsydelse
Omtrent 1/20 af beregning pr. token fra forrige generation ved 1M-kontekstskala

Disse forbedringer skal gøre kodning i repository-skala og agent-arbejdsgange med lang tidshorisont praktiske.

MiniMax M3 vs Claude Opus 4.7 vs Gemini 3.1 Pro

Kapabilitet	MiniMax M3	Claude Opus 4.7	Gemini 3.1 Pro
Kontekstvindue	Op til 1M	Mindre offentligt tilgængelige kontekstniveauer	Multimodal med stor kontekst
Indbygget multimodal træning	Ja	Ja	Ja
Fokus på agentisk kodning	Meget stærk	Meget stærk	Stærk
SWE-Bench Pro	59.0%	Højere ifølge MiniMax' rapportering	Lavere ifølge MiniMax' rapportering
Tilgængelighed af open-weight	Planlagt	Nej	Nej
Agent-arbejdsgange med lang tidshorisont	Stort designfokus	Stærk	Stærk

Kendte begrænsninger

De fleste benchmark-offentliggørelser kommer aktuelt fra MiniMax frem for uafhængige evalueringslaboratorier.
Open-weight-modelfiler og den fulde tekniske rapport blev annonceret, men var endnu ikke bredt udgivet ved lanceringen.
Pålidelighed i den virkelige verden på tværs af produktionsmiljøer valideres stadig af udviklerfællesskabet.
Arbejdslaster med million-token-kontekst kan medføre højere driftsomkostninger og latenstid end standardinference-arbejdslaster.

Repræsentative anvendelser

Software engineering i repository-skala

Analyser store kodebaser, udfør refaktoreringer på tværs af flere filer, generer patches, gennemgå pull requests og bevar langsigtet udviklingskontekst.

Autonome forskningsagenter

Understøt litteraturgennemgang, dokumentsyntese, benchmarkanalyse og langvarige forskningsarbejdsgange, der kræver hundredtusinder af tokens.

Multimodal teknisk analyse

Fortolk skærmbilleder, arkitekturdiagrammer, grafer, tekniske dokumenter og videoindhold i samme ræsonneringsarbejdsgang.

Terminal- og DevOps-automatisering

Udfør komplekse ingeniørarbejdsgange med test, udrulningsorkestrering, afhængighedshåndtering og iterativ fejlfinding.

Virksomhedsvidenssystemer

Søg og ræsonner over store samlinger af politikker, kontrakter, teknisk dokumentation og interne vidensrepositories.

Modelversion og tilgængelighed

MiniMax M3 blev officielt introduceret i juni 2026 som flagskibs-efterfølger i MiniMax-modellinjen. Modellen er tilgængelig via MiniMax API-økosystemet og CometAPI.

FAQ

Priser for MiniMax-M3

Udforsk konkurrencedygtige priser for MiniMax-M3, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan MiniMax-M3 kan forbedre dine projekter, mens omkostningerne holdes håndterbare.

Comet-pris (USD / M Tokens)	Officiel Pris (USD / M Tokens)	Rabat
Indtast:$0.48/M Output:$1.92/M	Indtast:$0.6/M Output:$2.4/M	-20%

Eksempelkode og API til MiniMax-M3

Få adgang til omfattende eksempelkode og API-ressourcer for MiniMax-M3 for at strømline din integrationsproces. Vores detaljerede dokumentation giver trin-for-trin vejledning, der hjælper dig med at udnytte det fulde potentiale af MiniMax-M3 i dine projekter.

POST

/v1/chat/completions

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.

"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.

"
                "Output format:
"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="minimax-m3",
    messages=[
        {
            "role": "system",
            "content": (
                "You are a senior backend reviewer focused on correctness, "
                "reliability, and maintainability."
            ),
        },
        {
            "role": "user",
            "content": (
                "Task: review the API migration plan and identify the "
                "highest-impact improvements.\n\n"
                "Context: the team is moving a customer support workflow from "
                "blocking chat calls to an async job queue. Prioritize data "
                "safety, retry behavior, observability, and rollback.\n\n"
                "Output format:\n"
                "Return a table with columns: Area, Risk, Recommendation, "
                "Priority. Keep each recommendation actionable and under 40 words."
            ),
        },
    ],
    max_completion_tokens=800,
    extra_body={"reasoning_split": True},
)

if not completion.choices:
    print(completion.model_dump_json(indent=2))
    raise SystemExit

message = completion.choices[0].message

reasoning_details = getattr(message, "reasoning_details", None)
if reasoning_details:
    print("Thinking:")
    print(reasoning_details[0]["text"])
    print()

print("Response:")
print(message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "minimax-m3",
  messages: [
    {
      role: "system",
      content:
        "You are a senior backend reviewer focused on correctness, reliability, and maintainability.",
    },
    {
      role: "user",
      content:
        "Task: review the API migration plan and identify the highest-impact improvements.\n\n" +
        "Context: the team is moving a customer support workflow from blocking chat calls " +
        "to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\n" +
        "Output format:\n" +
        "Return a table with columns: Area, Risk, Recommendation, Priority. " +
        "Keep each recommendation actionable and under 40 words.",
    },
  ],
  max_completion_tokens: 800,
  reasoning_split: true,
});

if (!completion.choices?.length) {
  console.log(JSON.stringify(completion, null, 2));
  process.exit(0);
}

const message = completion.choices[0].message;

if (message.reasoning_details?.length) {
  console.log("Thinking:");
  console.log(message.reasoning_details[0].text);
  console.log();
}

console.log("Response:");
console.log(message.content);

Curl Code Example

# Get your CometAPI key from https://www.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "minimax-m3",
    "messages": [
      {
        "role": "system",
        "content": "You are a senior backend reviewer focused on correctness, reliability, and maintainability."
      },
      {
        "role": "user",
        "content": "Task: review the API migration plan and identify the highest-impact improvements.\n\nContext: the team is moving a customer support workflow from blocking chat calls to an async job queue. Prioritize data safety, retry behavior, observability, and rollback.\n\nOutput format:\nReturn a table with columns: Area, Risk, Recommendation, Priority. Keep each recommendation actionable and under 40 words."
      }
    ],
    "max_completion_tokens": 800,
    "reasoning_split": true
  }'

Uptime

Anmodningssuccessrate over de seneste 30 dage, der afspejler pålideligheden hos hver modeludbyder. CometAPI overvåger alle tilsluttede udbydere i realtid, 24/7.

RespondLIVE

792msAvg. Response

UptimeLIVE

100.0%Avg. Uptime

Versioner af MiniMax-M3

Årsagen til, at MiniMax-M3 har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.

version
minimax-m3