ModellenOndersteuningOndernemingBlog
500+ AI Model API, Alles In Één API. Gewoon In CometAPI
Modellen API
Ontwikkelaar
Snelle StartDocumentatieAPI Dashboard
Bronnen
AI-modellenBlogOndernemingWijzigingslogboekOver ons
2025 CometAPI. Alle rechten voorbehouden.PrivacybeleidServicevoorwaarden
Home/Models/OpenAI/gpt-realtime-mini
O

gpt-realtime-mini

Invoer:$0.48/M
Uitvoer:$0.96/M
Een kostenefficiënte versie van de realtime GPT—die in realtime kan reageren op audio- en tekstinvoer via WebRTC-, WebSocket- of SIP-verbindingen.
Nieuw
Commercieel gebruik
Overzicht
Functies
Prijzen
API
Versies

Technical Specifications of gpt-realtime-mini

SpecificationDetails
Model IDgpt-realtime-mini
Model typeRealtime multimodal model
DescriptionAn economical version of the real-time GPT—capable of responding to audio and text inputs in realtime via WebRTC, WebSocket, or SIP connections.
Input modalitiesText, audio, image
Output modalitiesText, audio
Context window32,000 tokens
Max output tokens4,096 tokens
Supported interfacesWebRTC, WebSocket, SIP
Supported featuresFunction calling supported; structured outputs, fine-tuning, distillation, and predicted outputs not supported
Recommended useLow-latency voice agents, realtime multimodal applications, and cost-sensitive interactive experiences

What is gpt-realtime-mini?

gpt-realtime-mini is a cost-efficient realtime model designed for applications that need fast, natural interaction with users through live audio and text. It is intended for low-latency multimodal experiences, allowing developers to build assistants that can listen, respond, and stream output in realtime rather than relying on slower multi-step pipelines.

Compared with larger realtime variants, gpt-realtime-mini is positioned as the economical option for developers who want realtime speech and text capabilities while managing cost and maintaining responsive performance. It works across browser, server, and telephony-style connection patterns through WebRTC, WebSocket, and SIP.

Main features of gpt-realtime-mini

  • Realtime audio and text interaction: Supports low-latency conversations with streaming input and output, making it suitable for live assistants, voice bots, and interactive agents.
  • Cost-efficient deployment: Positioned as an economical version of the realtime model family, making it attractive for high-volume or budget-sensitive applications.
  • Multiple connection methods: Can be integrated through WebRTC for browser clients, WebSocket for server-side systems, and SIP for telephony or VoIP scenarios.
  • Multimodal input support: Accepts text, audio, and image input, enabling richer user interactions and more flexible application design.
  • Speech-capable output: Produces both text and audio output, which is useful for conversational interfaces and spoken response systems.
  • Function calling support: Supports function calling, allowing applications to connect the model to tools, workflows, or backend actions during realtime sessions.
  • Built for voice agents: Well suited for speech-to-speech assistants and realtime customer interaction experiences where interruption handling and fast turn-taking matter.

How to access and integrate gpt-realtime-mini

Step 1: Sign Up for API Key

To get started, sign up on CometAPI and generate your API key from the dashboard. Once you have your key, keep it secure and store it in your environment variables for server-side use.

Step 2: Connect to gpt-realtime-mini API

The Realtime API uses WebSocket connections. Connect to CometAPI's WebSocket endpoint:

const ws = new WebSocket(
  "wss://api.cometapi.com/v1/realtime?model=gpt-realtime-mini",
  {
    headers: {
      "Authorization": "Bearer " + process.env.COMETAPI_API_KEY,
      "OpenAI-Beta": "realtime=v1"
    }
  }
);

ws.on("open", () => {
  ws.send(JSON.stringify({
    type: "session.update",
    session: {
      modalities: ["text", "audio"],
      instructions: "You are a helpful assistant."
    }
  }));
});

ws.on("message", (data) => {
  console.log(JSON.parse(data));
});

Step 3: Retrieve and Verify Results

The Realtime API streams responses through the WebSocket connection as server-sent events. Listen for response.audio.delta events for audio output and response.text.delta for text. Verify the session is established and responses are streaming correctly.

Functies voor gpt-realtime-mini

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of gpt-realtime-mini, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持gpt-realtime-mini这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van gpt-realtime-mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van gpt-realtime-mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van gpt-realtime-mini, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor gpt-realtime-mini

Ontdek concurrerende prijzen voor gpt-realtime-mini, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe gpt-realtime-mini uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.
Comet Prijs (USD / M Tokens)Officiële Prijs (USD / M Tokens)Korting
Invoer:$0.48/M
Uitvoer:$0.96/M
Invoer:$0.6/M
Uitvoer:$1.2/M
-20%

Voorbeeldcode en API voor gpt-realtime-mini

Krijg toegang tot uitgebreide voorbeeldcode en API-bronnen voor gpt-realtime-mini om uw integratieproces te stroomlijnen. Onze gedetailleerde documentatie biedt stapsgewijze begeleiding en helpt u het volledige potentieel van gpt-realtime-mini in uw projecten te benutten.

Versies van gpt-realtime-mini

De reden waarom gpt-realtime-mini meerdere snapshots heeft, kan mogelijke factoren omvatten zoals variaties in de uitvoer na updates die oudere snapshots vereisen voor consistentie, het bieden van een overgangsperiode voor ontwikkelaars om zich aan te passen en te migreren, en verschillende snapshots die overeenkomen met wereldwijde of regionale eindpunten om de gebruikerservaring te optimaliseren. Voor gedetailleerde verschillen tussen versies, raadpleeg de officiële documentatie.
version
gpt-realtime-mini

Meer modellen

G

Nano Banana 2

Invoer:$0.4/M
Uitvoer:$2.4/M
Overzicht van kernmogelijkheden: Resolutie: Maximaal 4K (4096×4096), vergelijkbaar met Pro. Consistentie van referentieafbeeldingen: Maximaal 14 referentieafbeeldingen (10 objecten + 4 personages), met behoud van stijl- en personageconsistentie. Extreme beeldverhoudingen: Nieuwe verhoudingen 1:4, 4:1, 1:8, 8:1 toegevoegd, geschikt voor lange afbeeldingen, posters en banners. Tekstweergave: Geavanceerde tekstgeneratie, geschikt voor infographics en lay-outs van marketingposters. Zoekverbetering: Geïntegreerde Google Search + Image Search. Verankering: Ingebouwd denkproces; complexe prompts worden voorafgaand aan het genereren beredeneerd.
A

Claude Opus 4.6

Invoer:$4/M
Uitvoer:$20/M
Claude Opus 4.6 is het “Opus”-klasse grote taalmodel van Anthropic, uitgebracht in februari 2026. Het is gepositioneerd als een werkpaard voor kenniswerk en onderzoekswerkstromen — met verbeteringen in redeneren over lange contexten, planning in meerdere stappen, het gebruik van tools (waaronder agentische softwareworkflows), en computertaken zoals het automatisch genereren van dia’s en spreadsheets.
A

Claude Sonnet 4.6

Invoer:$2.4/M
Uitvoer:$12/M
Claude Sonnet 4.6 is ons meest capabele Sonnet-model tot nu toe. Het is een volledige upgrade van de vaardigheden van het model op het gebied van coderen, computergebruik, redeneren met lange context, agentplanning, kenniswerk en ontwerp. Sonnet 4.6 biedt daarnaast een contextvenster van 1M tokens in bèta.
O

GPT-5.4 nano

Invoer:$0.16/M
Uitvoer:$1/M
GPT-5.4 nano is ontworpen voor taken waarbij snelheid en kosten het belangrijkst zijn, zoals classificatie, data-extractie, ranking en subagenten.
O

GPT-5.4 mini

Invoer:$0.6/M
Uitvoer:$3.6/M
GPT-5.4 mini brengt de sterke punten van GPT-5.4 naar een sneller en efficiënter model dat is ontworpen voor grootschalige workloads.
A

Claude Mythos Preview

A

Claude Mythos Preview

Binnenkort beschikbaar
Invoer:$60/M
Uitvoer:$240/M
Claude Mythos Preview is ons meest capabele frontiermodel tot nu toe en laat een opmerkelijke sprong in scores zien op veel evaluatiebenchmarks vergeleken met ons vorige frontiermodel, Claude Opus 4.6.