МодельдерҚолдауКәсіпорынБлог
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Ресурстар
AI МодельдеріБлогКәсіпорынӨзгерістер журналыБіз туралы
2025 CometAPI. Барлық құқықтар қорғалған.Құпиялылық саясатыҚызмет көрсету шарттары
Home/Models/OpenAI/gpt-realtime-mini
O

gpt-realtime-mini

Енгізу:$0.48/M
Шығыс:$0.96/M
Нақты уақыттағы GPT-тің үнемді нұсқасы — WebRTC, WebSocket немесе SIP қосылымдары арқылы аудио және мәтіндік енгізулерге нақты уақыт режимінде жауап беруге қабілетті.
Жаңа
Коммерциялық пайдалану
Шолу
Мүмкіндіктер
Баға белгілеу
API
Нұсқалар

Technical Specifications of gpt-realtime-mini

SpecificationDetails
Model IDgpt-realtime-mini
Model typeRealtime multimodal model
DescriptionAn economical version of the real-time GPT—capable of responding to audio and text inputs in realtime via WebRTC, WebSocket, or SIP connections.
Input modalitiesText, audio, image
Output modalitiesText, audio
Context window32,000 tokens
Max output tokens4,096 tokens
Supported interfacesWebRTC, WebSocket, SIP
Supported featuresFunction calling supported; structured outputs, fine-tuning, distillation, and predicted outputs not supported
Recommended useLow-latency voice agents, realtime multimodal applications, and cost-sensitive interactive experiences

What is gpt-realtime-mini?

gpt-realtime-mini is a cost-efficient realtime model designed for applications that need fast, natural interaction with users through live audio and text. It is intended for low-latency multimodal experiences, allowing developers to build assistants that can listen, respond, and stream output in realtime rather than relying on slower multi-step pipelines.

Compared with larger realtime variants, gpt-realtime-mini is positioned as the economical option for developers who want realtime speech and text capabilities while managing cost and maintaining responsive performance. It works across browser, server, and telephony-style connection patterns through WebRTC, WebSocket, and SIP.

Main features of gpt-realtime-mini

  • Realtime audio and text interaction: Supports low-latency conversations with streaming input and output, making it suitable for live assistants, voice bots, and interactive agents.
  • Cost-efficient deployment: Positioned as an economical version of the realtime model family, making it attractive for high-volume or budget-sensitive applications.
  • Multiple connection methods: Can be integrated through WebRTC for browser clients, WebSocket for server-side systems, and SIP for telephony or VoIP scenarios.
  • Multimodal input support: Accepts text, audio, and image input, enabling richer user interactions and more flexible application design.
  • Speech-capable output: Produces both text and audio output, which is useful for conversational interfaces and spoken response systems.
  • Function calling support: Supports function calling, allowing applications to connect the model to tools, workflows, or backend actions during realtime sessions.
  • Built for voice agents: Well suited for speech-to-speech assistants and realtime customer interaction experiences where interruption handling and fast turn-taking matter.

How to access and integrate gpt-realtime-mini

Step 1: Sign Up for API Key

To get started, sign up on CometAPI and generate your API key from the dashboard. Once you have your key, keep it secure and store it in your environment variables for server-side use.

Step 2: Connect to gpt-realtime-mini API

The Realtime API uses WebSocket connections. Connect to CometAPI's WebSocket endpoint:

const ws = new WebSocket(
  "wss://api.cometapi.com/v1/realtime?model=gpt-realtime-mini",
  {
    headers: {
      "Authorization": "Bearer " + process.env.COMETAPI_API_KEY,
      "OpenAI-Beta": "realtime=v1"
    }
  }
);

ws.on("open", () => {
  ws.send(JSON.stringify({
    type: "session.update",
    session: {
      modalities: ["text", "audio"],
      instructions: "You are a helpful assistant."
    }
  }));
});

ws.on("message", (data) => {
  console.log(JSON.parse(data));
});

Step 3: Retrieve and Verify Results

The Realtime API streams responses through the WebSocket connection as server-sent events. Listen for response.audio.delta events for audio output and response.text.delta for text. Verify the session is established and responses are streaming correctly.

gpt-realtime-mini үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

gpt-realtime-mini үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)Жеңілдік
Енгізу:$0.48/M
Шығыс:$0.96/M
Енгізу:$0.6/M
Шығыс:$1.2/M
-20%

gpt-realtime-mini үшін үлгі код және API

[Модель атауы] үшін кешенді үлгі кодтары мен API ресурстарына қол жеткізіп, интеграция процесіңізді жеңілдетіңіз. Біздің толық құжаттама қадам-қадаммен нұсқаулық береді, жобаларыңызда [Модель атауы] мүмкіндіктерін толық пайдалануға көмектеседі.

gpt-realtime-mini нұсқалары

gpt-realtime-mini бірнеше снупшоттарының болуының себептеріне мыналар жатады: жаңартулардан кейінгі шығыстардың өзгеруі, бұрынғы снупшоттарды тұрақтылықты сақтау үшін қолдану, әзірлеушілерге бейімделу және көшіру үшін өту кезеңін ұсыну, сондай-ақ әртүрлі снупшоттардың жаһалдық немесе аймақтық эндпоинттерге сәйкес келуі арқылы пайдаланушы тәжірибесін оңтайландыру. Нұсқалар арасындағы егжей-тегжейлі айырмашылықтар үшін ресми құжаттамаға жүгініңіз.
version
gpt-realtime-mini

Көбірек модельдер

G

Nano Banana 2

Енгізу:$0.4/M
Шығыс:$2.4/M
Негізгі мүмкіндіктерге шолу: Ажыратылымдылығы: 4K-ға дейін (4096×4096), Pro-мен деңгейлес. Үлгі суреттердің бірізділігі: 14-ке дейін үлгі сурет (10 объект + 4 кейіпкер), стиль/кейіпкер бірізділігін сақтайды. Экстремалды жақтар арақатынастары: Жаңа 1:4, 4:1, 1:8, 8:1 қатынастары қосылды, ұзын суреттерге, постерлер мен баннерлерге жарамды. Мәтінді кескіндеу: Жетілдірілген мәтін генерациясы, инфографика мен маркетингтік постер макеттеріне жарайды. Іздеуді жетілдіру: Google Search + Image Search біріктірілген. Негіздеу: Кірістірілген ойлау үдерісі; күрделі сұраныстар генерацияға дейін пайымдалады.
A

Claude Opus 4.6

Енгізу:$4/M
Шығыс:$20/M
Claude Opus 4.6 — Anthropic компаниясының «Opus» санатындағы үлкен тілдік моделі, 2026 жылғы ақпанда шығарылған. Ол зияткерлік еңбек пен зерттеу процестеріне арналған сенімді жұмыс құралы ретінде позицияланған — ұзақ контексттегі пайымдау, көпқадамды жоспарлау, құралдарды қолдану (агенттік бағдарламалық қамтамасыз ету жұмыс процестерін қоса), сондай-ақ слайдтар мен электрондық кестелерді автоматты түрде жасау сияқты компьютерді пайдалану тапсырмалары бойынша мүмкіндіктерін жақсартады.
A

Claude Sonnet 4.6

Енгізу:$2.4/M
Шығыс:$12/M
Claude Sonnet 4.6 — әзірге біздің ең қабілетті Sonnet моделіміз. Ол кодтау, компьютерді пайдалану, ұзақ контекст бойынша пайымдау, агенттік жоспарлау, білімге негізделген жұмыс және дизайн бойынша модельдің дағдыларын толық жаңартуды қамтиды. Sonnet 4.6 сондай-ақ бета нұсқасында 1M токендік контекст терезесін ұсынады.
O

GPT-5.4 nano

Енгізу:$0.16/M
Шығыс:$1/M
GPT-5.4 nano жылдамдық пен құн ең маңызды болатын жіктеу, деректерді шығарып алу, ранжирлеу және субагенттер сияқты тапсырмаларға арналған.
O

GPT-5.4 mini

Енгізу:$0.6/M
Шығыс:$3.6/M
GPT-5.4 mini жоғары көлемді жүктемелерге арналған, GPT-5.4-тің артықшылықтарын жылдамырақ әрі тиімдірек модельге біріктіреді.
A

Claude Mythos Preview

A

Claude Mythos Preview

Жақында
Енгізу:$60/M
Шығыс:$240/M
Claude Mythos Preview — бүгінге дейінгі ең қабілетті озық моделіміз және алдыңғы озық моделіміз Claude Opus 4.6-пен салыстырғанда көптеген бағалау бенчмарктеріндегі көрсеткіштер бойынша айқын серпіліс көрсетеді.