ModellenOndersteuningOndernemingBlog
500+ AI Model API, Alles In Één API. Gewoon In CometAPI
Modellen API
Ontwikkelaar
Snelle StartDocumentatieAPI Dashboard
Bronnen
AI-modellenBlogOndernemingWijzigingslogboekOver ons
2025 CometAPI. Alle rechten voorbehouden.PrivacybeleidServicevoorwaarden
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

Invoer:$0.2/M
Uitvoer:$1.6/M
Context:400K
Max Uitvoer:128K
GPT-5 mini is het voor kosten en latentie geoptimaliseerde lid van de GPT-5-familie van OpenAI, bedoeld om veel van de multimodale en instructievolgende sterke punten van GPT-5 te bieden tegen aanzienlijk lagere kosten voor gebruik in grootschalige productie. Het richt zich op omgevingen waar doorvoer, voorspelbare prijs per token en snelle respons de belangrijkste beperkingen zijn, terwijl het toch sterke algemene mogelijkheden biedt.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API

Basisinformatie en belangrijkste functies

GPT-5 mini is OpenAI’s op kosten en latentie geoptimaliseerde lid van de GPT-5-familie, bedoeld om een groot deel van GPT-5’s multimodale en instructievolgende sterke punten te leveren tegen aanzienlijk lagere kosten voor grootschalig productiegebruik. Het is gericht op omgevingen waar throughput, voorspelbare prijsstelling per token en snelle reacties de primaire beperkingen zijn, terwijl het toch sterke algemene capaciteiten biedt.

  • Modelnaam: gpt-5-mini
  • Contextvenster: 400 000 tokens
  • Maximaal aantal outputtokens: 128 000
  • Belangrijkste functies: snelheid, throughput, kostenefficiëntie, deterministische output voor beknopte prompts

Hoe werkt gpt-5-mini?

Geoptimaliseerd inferentiepad en implementatie. Praktische snelheidswinsten komen voort uit kernel fusion, tensor parallelism afgestemd op een kleinere grafiek, en een inferentieruntime die de voorkeur geeft aan kortere interne “thinking”-lussen tenzij de ontwikkelaar om diepere redenering vraagt. Daarom behaalt mini merkbaar lagere compute per aanroep en voorspelbare latentie voor verkeer met hoog volume. Deze afweging is bewust: minder compute per forward pass → lagere kosten en lagere gemiddelde latentie.

Ontwikkelaarsinstellingen. GPT-5 mini biedt parameters zoals verbosity (bepaalt detailniveau/lengte) en reasoning_effort (afweging tussen snelheid en diepgang), plus robuuste ondersteuning voor tool-calling (functieaanroepen, parallelle toolketens en gestructureerde foutafhandeling), waardoor productiesystemen nauwkeurig de balans tussen nauwkeurigheid en kosten kunnen afstemmen.

Benchmarkprestaties — kerncijfers en interpretatie

GPT-5 mini bevindt zich doorgaans binnen ~85–95% van GPT-5 high op algemene benchmarks, terwijl latentie/prijs aanzienlijk verbetert. Het lanceringsmateriaal van het platform geeft zeer hoge absolute scores aan voor GPT-5 high (AIME ≈ 94.6% gerapporteerd voor de topvariant), waarbij mini iets lager scoort maar nog steeds toonaangevend is voor zijn prijsklasse.

Over een reeks gestandaardiseerde en interne benchmarks behaalt GPT-5 mini:

  • Intelligentie (AIME ’25): 91.1% (vs. 94.6% voor GPT-5 high)
  • Multimodaal (MMMU): 81.6% (vs. 84.2% voor GPT-5 high)
  • Coderen (SWE-bench Verified): 71.0% (vs. 74.9% voor GPT-5 high)
  • Instructieopvolging (Scale MultiChallenge): 62.3% (vs. 69.6%)
  • Function calling (τ²-bench telecom): 74.1% (vs. 96.7%)
  • Hallucinatiepercentages (LongFact-Concepts): 0.7% (lager is beter)([OpenAI][4])

Deze resultaten tonen GPT-5 mini’s robuuste afwegingen tussen prestaties, kosten en snelheid aan.

Beperkingen

Bekende beperkingen: GPT-5 mini verminderde capaciteit voor diep redeneren ten opzichte van volledige GPT-5, hogere gevoeligheid voor dubbelzinnige prompts en resterende risico’s op hallucinaties.

  • Verminderd diep redeneren: Voor meerstaps- en langetermijnredeneertaken presteren het volledige redeneermodel of de “thinking”-varianten beter dan mini.
  • Hallucinaties en overmoed: Mini vermindert hallucinaties ten opzichte van zeer kleine modellen, maar elimineert ze niet; output moet worden gevalideerd in omgevingen met hoge inzet (juridisch, klinisch, compliance).
  • Contextgevoeligheid: Zeer lange, sterk onderling afhankelijke contextketens worden beter bediend door de volledige GPT-5-varianten met grotere contextvensters of het “thinking”-model.
  • Veiligheids- en beleidsbeperkingen: Dezelfde veiligheidsmaatregelen en snelheids-/gebruiksbeperkingen die gelden voor andere GPT-5-modellen, gelden ook voor mini; gevoelige taken vereisen menselijk toezicht.

Wat doet gpt-5-mini?

  • Conversationele agents met hoog volume: lage latentie, voorspelbare kosten.
  • Document- en multimodale samenvatting: samenvatting met lange context, beeld+tekst-rapporten.
  • Ontwikkelaarstools op schaal: CI-codecontroles, automatische review, lichtgewicht codegeneratie.
  • Agentorkestratie: tool-calling met parallelle ketens wanneer diep redeneren niet vereist is.

Hoe begin ik met het gebruik van de gpt-5-mini API?

Vereiste stappen

  • Log in op cometapi.com. Als u nog geen gebruiker bent, registreer u dan eerst.
  • Verkrijg de toegangssleutel API key voor de interface. Klik op “Add Token” bij het API-token in het persoonlijke centrum, verkrijg de tokensleutel: sk-xxxxx en dien deze in.
  • Verkrijg de URL van deze site: https://api.cometapi.com/

Gebruiksmethode

  1. Selecteer het endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" om het API-verzoek te verzenden en stel de request body in. De request method en request body zijn te vinden in onze API-documentatie op de website. Onze website biedt voor uw gemak ook Apifox-tests.
  2. Vervang <YOUR_API_KEY> door uw daadwerkelijke CometAPI-sleutel uit uw account.
  3. Voeg uw vraag of verzoek in het content-veld in — hierop zal het model reageren.
  4. Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.

CometAPI biedt een volledig compatibele REST API — voor naadloze migratie. Belangrijke details in de API doc:

  • Kernparameters: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Modelparameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Authenticatie: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

API-oproepinstructies: gpt-5-chat-latest moet worden aangeroepen met de standaardindeling /v1/chat/completions format. Voor andere modellen (gpt-5, gpt-5-mini, gpt-5-nano en hun gedateerde versies) wordt het gebruik van the /v1/responses format aanbevolen. Momenteel zijn er twee modi beschikbaar.

Functies voor GPT-5 mini

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of GPT-5 mini, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持GPT-5 mini这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van GPT-5 mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van GPT-5 mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van GPT-5 mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor GPT-5 mini

Ontdek concurrerende prijzen voor GPT-5 mini, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe GPT-5 mini uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.
Comet Prijs (USD / M Tokens)Officiële Prijs (USD / M Tokens)Korting
Invoer:$0.2/M
Uitvoer:$1.6/M
Invoer:$0.25/M
Uitvoer:$2/M
-20%

Voorbeeldcode en API voor GPT-5 mini

GPT-5 mini is een lichte, kostengeoptimaliseerde variant van OpenAI’s vlaggenschipmodel GPT-5, ontworpen om hoogwaardige redeneervermogens en multimodale capaciteiten te leveren met verminderde latentie en lagere kosten.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Meer modellen

A

Claude Opus 4.6

Invoer:$4/M
Uitvoer:$20/M
Claude Opus 4.6 is het “Opus”-klasse grote taalmodel van Anthropic, uitgebracht in februari 2026. Het is gepositioneerd als een werkpaard voor kenniswerk en onderzoekswerkstromen — met verbeteringen in redeneren over lange contexten, planning in meerdere stappen, het gebruik van tools (waaronder agentische softwareworkflows), en computertaken zoals het automatisch genereren van dia’s en spreadsheets.
A

Claude Sonnet 4.6

Invoer:$2.4/M
Uitvoer:$12/M
Claude Sonnet 4.6 is ons meest capabele Sonnet-model tot nu toe. Het is een volledige upgrade van de vaardigheden van het model op het gebied van coderen, computergebruik, redeneren met lange context, agentplanning, kenniswerk en ontwerp. Sonnet 4.6 biedt daarnaast een contextvenster van 1M tokens in bèta.
O

GPT-5.4 nano

Invoer:$0.16/M
Uitvoer:$1/M
GPT-5.4 nano is ontworpen voor taken waarbij snelheid en kosten het belangrijkst zijn, zoals classificatie, data-extractie, ranking en subagenten.
O

GPT-5.4 mini

Invoer:$0.6/M
Uitvoer:$3.6/M
GPT-5.4 mini brengt de sterke punten van GPT-5.4 naar een sneller en efficiënter model dat is ontworpen voor grootschalige workloads.
A

Claude Mythos Preview

A

Claude Mythos Preview

Binnenkort beschikbaar
Invoer:$60/M
Uitvoer:$240/M
Claude Mythos Preview is ons meest capabele frontiermodel tot nu toe en laat een opmerkelijke sprong in scores zien op veel evaluatiebenchmarks vergeleken met ons vorige frontiermodel, Claude Opus 4.6.
X

mimo-v2-pro

Invoer:$0.8/M
Uitvoer:$2.4/M
MiMo-V2-Pro is het vlaggenschipfoundationmodel van Xiaomi, met meer dan 1T totale parameters en een contextlengte van 1M, diepgaand geoptimaliseerd voor agent-gebaseerde scenario's. Het is zeer goed aanpasbaar aan algemene agentframeworks zoals OpenClaw. Het behoort tot de wereldtop in de standaardbenchmarks PinchBench en ClawBench, met een waargenomen prestatieniveau dat dat van Opus 4.6 benadert. MiMo-V2-Pro is ontworpen om te fungeren als het brein van agentsystemen, complexe workflows te orkestreren, productie-engineeringtaken aan te sturen en resultaten betrouwbaar te leveren.