МоделиПоддержкаПредприятиеБлог
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Ресурсы
AI МоделиБлогПредприятиеЖурнал измененийО нас
2025 CometAPI. Все права защищены.Политика конфиденциальностиУсловия обслуживания
Home/Models/OpenAI/gpt-realtime-mini
O

gpt-realtime-mini

Ввод:$0.48/M
Вывод:$0.96/M
Экономичная версия GPT реального времени—способная реагировать на аудио- и текстовый ввод в режиме реального времени по соединениям WebRTC, WebSocket или SIP.
Новый
Коммерческое использование
Обзор
Функции
Цены
API
Версии

Technical Specifications of gpt-realtime-mini

SpecificationDetails
Model IDgpt-realtime-mini
Model typeRealtime multimodal model
DescriptionAn economical version of the real-time GPT—capable of responding to audio and text inputs in realtime via WebRTC, WebSocket, or SIP connections.
Input modalitiesText, audio, image
Output modalitiesText, audio
Context window32,000 tokens
Max output tokens4,096 tokens
Supported interfacesWebRTC, WebSocket, SIP
Supported featuresFunction calling supported; structured outputs, fine-tuning, distillation, and predicted outputs not supported
Recommended useLow-latency voice agents, realtime multimodal applications, and cost-sensitive interactive experiences

What is gpt-realtime-mini?

gpt-realtime-mini is a cost-efficient realtime model designed for applications that need fast, natural interaction with users through live audio and text. It is intended for low-latency multimodal experiences, allowing developers to build assistants that can listen, respond, and stream output in realtime rather than relying on slower multi-step pipelines.

Compared with larger realtime variants, gpt-realtime-mini is positioned as the economical option for developers who want realtime speech and text capabilities while managing cost and maintaining responsive performance. It works across browser, server, and telephony-style connection patterns through WebRTC, WebSocket, and SIP.

Main features of gpt-realtime-mini

  • Realtime audio and text interaction: Supports low-latency conversations with streaming input and output, making it suitable for live assistants, voice bots, and interactive agents.
  • Cost-efficient deployment: Positioned as an economical version of the realtime model family, making it attractive for high-volume or budget-sensitive applications.
  • Multiple connection methods: Can be integrated through WebRTC for browser clients, WebSocket for server-side systems, and SIP for telephony or VoIP scenarios.
  • Multimodal input support: Accepts text, audio, and image input, enabling richer user interactions and more flexible application design.
  • Speech-capable output: Produces both text and audio output, which is useful for conversational interfaces and spoken response systems.
  • Function calling support: Supports function calling, allowing applications to connect the model to tools, workflows, or backend actions during realtime sessions.
  • Built for voice agents: Well suited for speech-to-speech assistants and realtime customer interaction experiences where interruption handling and fast turn-taking matter.

How to access and integrate gpt-realtime-mini

Step 1: Sign Up for API Key

To get started, sign up on CometAPI and generate your API key from the dashboard. Once you have your key, keep it secure and store it in your environment variables for server-side use.

Step 2: Connect to gpt-realtime-mini API

The Realtime API uses WebSocket connections. Connect to CometAPI's WebSocket endpoint:

const ws = new WebSocket(
  "wss://api.cometapi.com/v1/realtime?model=gpt-realtime-mini",
  {
    headers: {
      "Authorization": "Bearer " + process.env.COMETAPI_API_KEY,
      "OpenAI-Beta": "realtime=v1"
    }
  }
);

ws.on("open", () => {
  ws.send(JSON.stringify({
    type: "session.update",
    session: {
      modalities: ["text", "audio"],
      instructions: "You are a helpful assistant."
    }
  }));
});

ws.on("message", (data) => {
  console.log(JSON.parse(data));
});

Step 3: Retrieve and Verify Results

The Realtime API streams responses through the WebSocket connection as server-sent events. Listen for response.audio.delta events for audio output and response.text.delta for text. Verify the session is established and responses are streaming correctly.

Функции для gpt-realtime-mini

Изучите ключевые функции gpt-realtime-mini, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для gpt-realtime-mini

Изучите конкурентоспособные цены на gpt-realtime-mini, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как gpt-realtime-mini может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$0.48/M
Вывод:$0.96/M
Ввод:$0.6/M
Вывод:$1.2/M
-20%

Пример кода и API для gpt-realtime-mini

Получите доступ к исчерпывающим примерам кода и ресурсам API для gpt-realtime-mini, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал gpt-realtime-mini в ваших проектах.

Версии gpt-realtime-mini

Причина наличия нескольких снимков gpt-realtime-mini может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.
version
gpt-realtime-mini

Больше моделей

G

Nano Banana 2

Ввод:$0.4/M
Вывод:$2.4/M
Обзор основных возможностей: Разрешение: до 4K (4096×4096), на уровне Pro. Согласованность референс-изображений: до 14 референс-изображений (10 объектов + 4 персонажа), с сохранением согласованности стиля/персонажей. Экстремальные соотношения сторон: добавлены новые соотношения 1:4, 4:1, 1:8, 8:1, подходят для длинных изображений, постеров и баннеров. Рендеринг текста: продвинутая генерация текста, подходит для инфографики и макетов маркетинговых постеров. Расширение поиска: интегрированы Google Search + Image Search. Граундирование: встроенный процесс рассуждения; сложные запросы анализируются перед генерацией.
A

Claude Opus 4.6

Ввод:$4/M
Вывод:$20/M
Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц.
A

Claude Sonnet 4.6

Ввод:$2.4/M
Вывод:$12/M
Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии.
O

GPT-5.4 nano

Ввод:$0.16/M
Вывод:$1/M
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.
O

GPT-5.4 mini

Ввод:$0.6/M
Вывод:$3.6/M
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.
A

Claude Mythos Preview

A

Claude Mythos Preview

Скоро
Ввод:$60/M
Вывод:$240/M
Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6.