Grundlæggende oplysninger og nøglefunktioner

GPT-5 mini er OpenAI’s omkostnings- og latensoptimerede medlem af GPT-5-familien, designet til at levere en stor del af GPT-5’s multimodale og instruktionsfølgende styrker til væsentligt lavere omkostning for brug i stor skala i produktion. Den er målrettet miljøer, hvor gennemløb, forudsigelig pris pr. token og hurtige svar er de primære begrænsninger, samtidig med at den stadig tilbyder stærke generelle egenskaber.

Model Name: gpt-5-mini
Context Window: 400 000 tokens
Max Output Tokens: 128 000
Key features: hastighed, gennemløb, omkostningseffektivitet, deterministiske output for korte prompts

Hvordan fungerer `gpt-5-mini`?

Optimeret inferenssti og udrulning. Praktiske hastighedsforbedringer kommer fra kernelfusion, tensor-parallelisme tilpasset en mindre graf og en inference-runtime, der foretrækker kortere interne “tænke”-sløjfer, medmindre udvikleren beder om dybere ræsonnering. Derfor opnår mini mærkbart lavere beregningsforbrug pr. kald og forudsigelig latens for trafik i høj volumen. Denne afvejning er bevidst: lavere beregningsforbrug pr. forward pass → lavere omkostning og lavere gennemsnitlig latens.

Udviklerkontroller. GPT-5 mini eksponerer parametre såsom verbosity (styrer detaljer/længde) og reasoning_effort (afvejning mellem hastighed og dybde) samt robust tool-calling-understøttelse (funktionskald, parallelle værktøjskæder og struktureret fejlbehandling), hvilket giver produktionssystemer mulighed for præcist at afstemme nøjagtighed kontra omkostning.

Benchmark-ydelse — hovedtal og fortolkning

GPT-5 mini ligger typisk inden for ~85–95% af GPT-5 high på generelle benchmarks, samtidig med at latens/pris forbedres markant. Platformens lanceringsmaterialer angiver meget høje absolutte scorer for GPT-5 high (AIME ≈ 94.6% rapporteret for topvarianten), hvor mini ligger noget lavere, men stadig brancheførende for sin prisklasse.

På tværs af en række standardiserede og interne benchmarks opnår GPT-5 mini:

Intelligens (AIME ’25): 91.1% (vs. 94.6% for GPT-5 high)
Multimodal (MMMU): 81.6% (vs. 84.2% for GPT-5 high)
Kodning (SWE-bench Verified): 71.0% (vs. 74.9% for GPT-5 high)
Instruktionsfølgning (Scale MultiChallenge): 62.3% (vs. 69.6%)
Funktionskald (τ²-bench telecom): 74.1% (vs. 96.7%)
Hallucinationsrater (LongFact-Concepts): 0.7% (lavere er bedre)([OpenAI][4])

Disse resultater demonstrerer GPT-5 mini’s robuste afvejninger mellem ydeevne, omkostning og hastighed.

Begrænsninger

Kendte begrænsninger: GPT-5 mini reduceret dybræsonneringskapacitet vs. fuld GPT-5, højere følsomhed over for tvetydige prompts og resterende risiko for hallucinationer.

Reduceret dybræsonnering: Til flertrins-, langhorisont-ressonering overgår den fulde ræsonneringsmodel eller “thinking”-varianter mini.
Hallucinationer og overmod: Mini reducerer hallucinationer i forhold til meget små modeller, men eliminerer dem ikke; output bør valideres i højrisikoforløb (juridisk, klinisk, compliance).
Kontekstsensitivitet: Meget lange, stærkt indbyrdes afhængige kontekstkæder håndteres bedre af de fulde GPT-5-varianter med større kontekstvinduer eller “thinking”-modellen.
Sikkerhed og politikbegrænsninger: De samme sikkerhedsrækværk samt rate-/brugsgrænser, der gælder for andre GPT-5-modeller, gælder for mini; følsomme opgaver kræver menneskelig overvågning.

Hvad gør `gpt-5-mini`?

Samtaleagenter i stor skala: lav latens, forudsigelige omkostninger.
Dokument- og multimodal opsummering: langkontekst-opsummering, billede+tekst-rapporter.
Udviklerværktøjer i skala: CI-kodekontrol, autoreview, letvægtskodegenerering.
Agent-orkestrering: tool-calling med parallelle kæder, når dyb ræsonnering ikke er påkrævet.

Hvordan begynder jeg at bruge `gpt-5-mini` API’et?

Påkrævede trin

Log ind på cometapi.com. Hvis du ikke er bruger hos os endnu, skal du registrere dig først
Hent grænsefladens adgangslegitimations-API-nøgle. Klik på “Add Token” ved API token i det personlige center, få token-nøglen: sk-xxxxx og indsend.
Hent URL’en til dette site: https://api.cometapi.com/

Brugsmåde

Vælg “gpt-5-mini“ / "gpt-5-mini-2025-08-07" endpointet for at sende API-anmodningen, og angiv anmodningskroppen. Anmodningsmetoden og anmodningskroppen fås fra vores websteds API-dokumentation. Vores websted tilbyder også Apifox-test for din bekvemmelighed.
Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto.
Indsæt dit spørgsmål eller din forespørgsel i content-feltet—det er det, modellen vil svare på.
. Behandl API-svaret for at få det genererede svar.

CometAPI leverer en fuldt kompatibel REST API—for problemfri migration. Nøgleoplysninger til API-dokumentation:

Kerneparametre: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Modelparameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Godkendelse: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

Instruktioner til API-kald: gpt-5-chat-latest bør kaldes ved hjælp af standarden /v1/chat/completions format. For andre modeller (gpt-5, gpt-5-mini, gpt-5-nano og deres daterede versioner) anbefales det at bruge the /v1/responses format anbefales. I øjeblikket er to tilstande tilgængelige.

GPT-5 mini

Grundlæggende oplysninger og nøglefunktioner

Hvordan fungerer `gpt-5-mini`?

Benchmark-ydelse — hovedtal og fortolkning

Begrænsninger

Hvad gør `gpt-5-mini`?

Hvordan begynder jeg at bruge `gpt-5-mini` API’et?

Påkrævede trin

Brugsmåde

Funktioner til GPT-5 mini

Priser for GPT-5 mini

Eksempelkode og API til GPT-5 mini

Flere modeller