O

gpt-realtime-1.5

Енгізу:$3.2/M
Шығыс:$12.8/M
Контекст:32,000
Максималды шығыс:4,096
Аудио кіріс пен аудио шығысқа арналған ең үздік дауыстық модель.
Жаңа
Коммерциялық пайдалану

gpt-realtime-1.5 техникалық сипаттамалары

Элементgpt-realtime-1.5 (қоғамдық позициялануы)
Модельдер отбасыGPT Realtime 1.5 (дауысқа оңтайландырылған нұсқа)
Негізгі модальдылықСөйлеуден сөйлеуге (S2S)
Кіріс түрлеріАудио (ағындық), мәтін
Шығыс түрлеріАудио (ағындық), мәтін, құрылымдалған құрал шақырулары
APIRealtime API (WebRTC / тұрақты ағындық сессиялар)
Кідіріс профиліТөмен кідіріске, тірі сұхбаттық өзара әрекеттесуге оңтайландырылған
Сессия моделіКүйді сақтайтын ағындық сессиялар
Құралдарды қолдануФункция шақыруы және құрал интеграциялары қолдауға ие
Нысаналы қолдану жағдайыТірі дауыс агенттері, көмекшілер, интерактивті жүйелер

Ескертпе: Нақты токен шектеулері мен контекст терезесінің өлшемдері қоғамдық қысқаша сипаттамаларда айқын көрсетілмеген; модель өте ұзақ контексті сессиялардан гөрі нақты уақыттағы жауап беру жылдамдығына бағытталған.


gpt-realtime-1.5 деген не?

gpt-realtime-1.5 — тірі сұхбаттық жүйелерге арналған, төмен кідіріске ие, сөйлеуден сөйлеуге оңтайландырылған модель. Дәстүрлі сұрау-жауап модельдерінен айырмашылығы, ол тұрақты ағындық сессиялар арқылы жұмыс істейді, бұл табиғи кезектесіп сөйлеуді, үзілістерді өңдеуді және динамикалық дауыстық өзара әрекеттесуді қамтамасыз етеді.

Ол сұхбат ағымының жылдамдығы ең жоғары контекст ұзындығынан маңыздырақ болатын қолданбалар үшін арнайы жасалған.


Негізгі мүмкіндіктер

  1. Шынайы сөйлеуден сөйлеуге өзара әрекеттесу — Тірі аудио кірісін қабылдайды және нақты уақытта ауызша жауаптарды ағын түрінде береді.
  2. Төмен кідірісті архитектура — Дауыс агенттерінде секундтан аз уақыттағы сұхбаттық жауап беру үшін жасалған.
  3. Ағынға басымдық берілген дизайн — Тұрақты сессиялар (WebRTC немесе ағындық протоколдар) арқылы жұмыс істейді.
  4. Табиғи кезектесіп сөйлеу — Үзілістерді өңдеуді және динамикалық сұхбат ағынын қолдайды.
  5. Құрал шақыруын қолдау — Нақты уақыттағы сессия барысында құрылымдалған функция шақыруларын іске қоса алады.
  6. Өндірістік деңгейдегі дауыс агентіне негіз — Интерактивті көмекшілер, киоскілер және ендірілген құрылғылар үшін арнайы жасалған.

Бенчмарк және өнімділік бойынша позициялануы

OpenAI gpt-realtime-1.5 моделін бұрынғы realtime модельдерінің эволюциясы ретінде позициялайды; ол нұсқауларды жақсырақ орындаумен, ұзақ дауыс сессиялары кезіндегі жоғарырақ тұрақтылықпен және алдыңғы шығарылымдармен салыстырғанда табиғиырақ просодиямен ерекшеленеді.

Код жазуға бағытталған модельдерден (мысалы, Codex нұсқалары) айырмашылығы, өнімділік leaderboard стиліндегі бенчмарктерден гөрі сұхбаттық кідіріспен, дауыстың табиғилығымен және сессия тұрақтылығымен көбірек өлшенеді.


gpt-realtime-1.5 және оған байланысты модельдер

Мүмкіндікgpt-realtime-1.5gpt-audio-1.5
Негізгі мақсатТірі дауыстық өзара әрекеттесуАудио қолдайтын чат жұмыс ағындары
КідірісЕң аз кідіріске оңтайландырылғанСапа/жылдамдық теңгерілген
Сессия түріТұрақты ағындық сессияСтандартты Chat Completions ағыны
Контекст өлшеміЖауап беру жылдамдығына оңтайландырылғанҮлкенірек контексті қолдау
Ең жақсы қолдану жағдайыRealtime дауыс агенттеріАудиосы бар сұхбаттық көмекшілер

Қайсысын қашан таңдау керек

  • Қоңырау орталықтары, киоскілер, AI қабылдау қызметкерлері немесе тірі ендірілген көмекшілер үшін gpt-realtime-1.5 таңдаңыз.
  • Ұзағырақ сұхбат жадын немесе мультимодальды жұмыс ағындарын қажет ететін дауыспен қолдайтын чат қолданбалары үшін gpt-audio-1.5 таңдаңыз.

Өкілдік қолдану жағдайлары

  • AI қоңырау орталығы агенттері
  • Ақылды құрылғы көмекшілері
  • Интерактивті киоскілер
  • Тірі оқыту жүйелері
  • Нақты уақыттағы тіл жаттығу құралдары
  • Дауыспен басқарылатын қолданбалар
  • GPT realtime 1.5 API-ге қалай қол жеткізуге болады

1-қадам: API кілтіне тіркелу

cometapi.com сайтына кіріңіз. Егер әлі біздің пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI консоліңізге кіріңіз. Интерфейстің қол жеткізу деректері болатын API кілтін алыңыз. Жеке орталықтағы API token бөлімінде “Add Token” түймесін басып, token key: sk-xxxxx алыңыз және жіберіңіз.

cometapi-key

2-қадам: GPT realtime 1.5 API-ге сұраулар жіберу

API сұрауын жіберу үшін “gpt-realtime-1.5” endpoint-ін таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің веб-сайттағы API құжаттамасынан алынады. Сондай-ақ, ыңғайлылығыңыз үшін біздің веб-сайтта Apifox сынағы ұсынылған. <YOUR_API_KEY> орнын есептік жазбаңыздағы нақты CometAPI кілтімен ауыстырыңыз. base url — Chat Completions

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель жауап беретін нәрсе осы. Жасалған жауапты алу үшін API жауабын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

Жасалған жауапты алу үшін API жауабын өңдеңіз. Өңделгеннен кейін API тапсырма күйі мен шығыс деректерімен жауап береді.

ЖҚС