O

gpt-realtime-1.5

Енгізу:$3.2/M
Шығыс:$12.8/M
Контекст:32,000
Максималды шығыс:4,096
Аудио кіріс пен аудио шығысқа арналған ең үздік дауыстық модель.
Жаңа
Коммерциялық пайдалану

gpt-realtime-1.5 техникалық сипаттамалары

Элементgpt-realtime-1.5 (қоғамдық позициялау)
Модельдер отбасыGPT Realtime 1.5 (дауысқа оңтайландырылған нұсқа)
Негізгі модальдылықСөйлеуден сөйлеуге (S2S)
Енгізу түрлеріАудио (ағындық), мәтін
Шығыс түрлеріАудио (ағындық), мәтін, құрылымдалған құрал шақырулары
APIRealtime API (WebRTC / тұрақты ағындық сессиялар)
Кідіріс профиліТікелей әңгімелесу өзара әрекетінде төмен кідіріс үшін оңтайландырылған
Сессия моделіКүй сақталатын ағындық сессиялар
Құралдарды пайдалануФункция шақыру және құрал интеграцияларын қолдайды
Негізгі қолдану жағдайыТікелей дауыс агенттері, ассистенттер, интерактивті жүйелер

Ескерту: Нақты токен шектеулері мен контекстік терезе өлшемдері қоғамдық қысқаша мазмұндарда айқын құжатталмаған; модель өте ұзақ контексттік сессиялардан гөрі нақты уақыттағы жауаптылыққа бағытталған.


gpt-realtime-1.5 деген не?

gpt-realtime-1.5 — нақты уақыттағы сөйлесу жүйелеріне арналған, төмен кідірісті, сөйлеуден сөйлеуге оңтайландырылған модель. Дәстүрлі сұрау-жауап модельдерінен айырмашылығы, ол тұрақты ағындық сессиялар арқылы жұмыс істейді, бұл табиғи кезек ауыстыруды, үзілістерді өңдеуді және динамикалық дауыс арқылы өзара әрекетті мүмкін етеді.

Бұл ең ұзын контекст ұзындығынан гөрі әңгіме ағынының жылдамдығы маңыздырақ болатын қолданбалар үшін арнайы жасалған.


Негізгі мүмкіндіктер

  1. Нағыз сөйлеуден сөйлеуге өзара әрекет — Тікелей аудио енгізуді қабылдап, жауаптарды нақты уақытта дауыс ретінде ағында жібереді.
  2. Төмен кідіріс архитектурасы — Дауыс агенттерінде бір секундтан төмен жауап беру үшін жасалған.
  3. Ағынға басымдық беретін дизайн — Тұрақты сессиялар арқылы жұмыс істейді (WebRTC немесе ағындық протоколдар).
  4. Табиғи кезек ауыстыру — Үзілістерді өңдеуді және динамикалық әңгіме ағынын қолдайды.
  5. Құрал шақыру қолдауы — Нақты уақыттағы сессия барысында құрылымдалған функция шақыруларын іске қоса алады.
  6. Өндірістік деңгейге дайын дауыс агенттерінің негізі — Интерактивті ассистенттер, киоскілер және ендірілген құрылғылар үшін арнайы құрылған.

Бенчмарк және өнімділік позициялау

OpenAI gpt-realtime-1.5 моделін бұрынғы нақты уақыт модельдерінің эволюциясы ретінде позициялайды: нұсқауларды жақсырақ орындау, ұзақ дауыс сессияларында тұрақтылық және бұрынғы шығарылымдармен салыстырғанда табиғи интонация/просодия.

Кодтауға бағытталған модельдерден (мысалы, Codex нұсқалары) айырмашылығы, өнімділік лидерборд стиліндегі бенчмарктермен емес, әңгімелесу кідірісімен, дауыс табиғилығымен және сессия тұрақтылығымен көбірек өлшенеді.


gpt-realtime-1.5 және байланысты модельдер

Ерекшелікgpt-realtime-1.5gpt-audio-1.5
Негізгі мақсатТікелей дауыс арқылы өзара әрекетАудио мүмкіндігі бар чат жұмыс ағындары
КідірісМинималды кідіріс үшін оңтайландырылғанСапа/жылдамдық балансы
Сессия түріТұрақты ағындық сессияСтандартты Chat Completions ағыны
Контекст өлшеміЖауаптылыққа оңтайландырылғанҮлкен контекстті қолдау
Ең қолайлы қолдану жағдайыНақты уақыт дауыс агенттеріАудио бар сөйлесетін ассистенттер

Қайсысын қашан таңдау керек

  • Қоңырау орталықтары, киоскілер, AI рецепционистері немесе тікелей ендірілген ассистенттер үшін gpt-realtime-1.5 таңдаңыз.
  • Ұзақ сөйлесу жадын немесе мультимодальды жұмыс ағындарын қажет ететін дауыс мүмкіндігі бар чат қолданбалары үшін gpt-audio-1.5 таңдаңыз.

Өкілдік қолдану жағдайлары

  • AI қоңырау орталығы агенттері
  • Смарт құрылғы ассистенттері
  • Интерактивті киоскілер
  • Тікелей оқыту жүйелері
  • Нақты уақыттағы тіл жаттығу құралдары
  • Дауыс арқылы басқарылатын қолданбалар
  • GPT realtime 1.5 API-ге қол жеткізу жолы

1-қадам: API кілтіне тіркелу

cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы емес болсаңыз, алдымен тіркеліңіз. CometAPI console ішіне кіріңіз. Интерфейстің қол жеткізу құжаты — API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” батырмасын басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.

cometapi-key

2-қадам: GPT realtime 1.5 API-ге сұраулар жіберу

API сұрауын жіберу үшін “gpt-realtime-1.5” endpoint-ын таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің сайттағы API құжатынан алынады. Сайтымызда ыңғайлы болу үшін Apifox сынағы да бар. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтіне ауыстырыңыз. Базалық URL — Chat Completions

Модель жауап беретін мазмұн өрісіне сұрағыңызды немесе өтінішіңізді енгізіңіз. Жауапты алу үшін API жауаптарын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

Жауапты алу үшін API жауаптарын өңдеңіз. Өңдеуден кейін API тапсырма мәртебесі мен шығыс деректерін қайтарады.

ЖҚС

Көбірек модельдер