gpt-realtime-1.5 техникалық сипаттамалары
| Элемент | gpt-realtime-1.5 (қоғамдық позициялануы) |
|---|---|
| Модельдер отбасы | GPT Realtime 1.5 (дауысқа оңтайландырылған нұсқа) |
| Негізгі модальдылық | Сөйлеуден сөйлеуге (S2S) |
| Кіріс түрлері | Аудио (ағындық), мәтін |
| Шығыс түрлері | Аудио (ағындық), мәтін, құрылымдалған құрал шақырулары |
| API | Realtime API (WebRTC / тұрақты ағындық сессиялар) |
| Кідіріс профилі | Төмен кідіріске, тірі сұхбаттық өзара әрекеттесуге оңтайландырылған |
| Сессия моделі | Күйді сақтайтын ағындық сессиялар |
| Құралдарды қолдану | Функция шақыруы және құрал интеграциялары қолдауға ие |
| Нысаналы қолдану жағдайы | Тірі дауыс агенттері, көмекшілер, интерактивті жүйелер |
Ескертпе: Нақты токен шектеулері мен контекст терезесінің өлшемдері қоғамдық қысқаша сипаттамаларда айқын көрсетілмеген; модель өте ұзақ контексті сессиялардан гөрі нақты уақыттағы жауап беру жылдамдығына бағытталған.
gpt-realtime-1.5 деген не?
gpt-realtime-1.5 — тірі сұхбаттық жүйелерге арналған, төмен кідіріске ие, сөйлеуден сөйлеуге оңтайландырылған модель. Дәстүрлі сұрау-жауап модельдерінен айырмашылығы, ол тұрақты ағындық сессиялар арқылы жұмыс істейді, бұл табиғи кезектесіп сөйлеуді, үзілістерді өңдеуді және динамикалық дауыстық өзара әрекеттесуді қамтамасыз етеді.
Ол сұхбат ағымының жылдамдығы ең жоғары контекст ұзындығынан маңыздырақ болатын қолданбалар үшін арнайы жасалған.
Негізгі мүмкіндіктер
- Шынайы сөйлеуден сөйлеуге өзара әрекеттесу — Тірі аудио кірісін қабылдайды және нақты уақытта ауызша жауаптарды ағын түрінде береді.
- Төмен кідірісті архитектура — Дауыс агенттерінде секундтан аз уақыттағы сұхбаттық жауап беру үшін жасалған.
- Ағынға басымдық берілген дизайн — Тұрақты сессиялар (WebRTC немесе ағындық протоколдар) арқылы жұмыс істейді.
- Табиғи кезектесіп сөйлеу — Үзілістерді өңдеуді және динамикалық сұхбат ағынын қолдайды.
- Құрал шақыруын қолдау — Нақты уақыттағы сессия барысында құрылымдалған функция шақыруларын іске қоса алады.
- Өндірістік деңгейдегі дауыс агентіне негіз — Интерактивті көмекшілер, киоскілер және ендірілген құрылғылар үшін арнайы жасалған.
Бенчмарк және өнімділік бойынша позициялануы
OpenAI gpt-realtime-1.5 моделін бұрынғы realtime модельдерінің эволюциясы ретінде позициялайды; ол нұсқауларды жақсырақ орындаумен, ұзақ дауыс сессиялары кезіндегі жоғарырақ тұрақтылықпен және алдыңғы шығарылымдармен салыстырғанда табиғиырақ просодиямен ерекшеленеді.
Код жазуға бағытталған модельдерден (мысалы, Codex нұсқалары) айырмашылығы, өнімділік leaderboard стиліндегі бенчмарктерден гөрі сұхбаттық кідіріспен, дауыстың табиғилығымен және сессия тұрақтылығымен көбірек өлшенеді.
gpt-realtime-1.5 және оған байланысты модельдер
| Мүмкіндік | gpt-realtime-1.5 | gpt-audio-1.5 |
|---|---|---|
| Негізгі мақсат | Тірі дауыстық өзара әрекеттесу | Аудио қолдайтын чат жұмыс ағындары |
| Кідіріс | Ең аз кідіріске оңтайландырылған | Сапа/жылдамдық теңгерілген |
| Сессия түрі | Тұрақты ағындық сессия | Стандартты Chat Completions ағыны |
| Контекст өлшемі | Жауап беру жылдамдығына оңтайландырылған | Үлкенірек контексті қолдау |
| Ең жақсы қолдану жағдайы | Realtime дауыс агенттері | Аудиосы бар сұхбаттық көмекшілер |
Қайсысын қашан таңдау керек
- Қоңырау орталықтары, киоскілер, AI қабылдау қызметкерлері немесе тірі ендірілген көмекшілер үшін gpt-realtime-1.5 таңдаңыз.
- Ұзағырақ сұхбат жадын немесе мультимодальды жұмыс ағындарын қажет ететін дауыспен қолдайтын чат қолданбалары үшін gpt-audio-1.5 таңдаңыз.
Өкілдік қолдану жағдайлары
- AI қоңырау орталығы агенттері
- Ақылды құрылғы көмекшілері
- Интерактивті киоскілер
- Тірі оқыту жүйелері
- Нақты уақыттағы тіл жаттығу құралдары
- Дауыспен басқарылатын қолданбалар
- GPT realtime 1.5 API-ге қалай қол жеткізуге болады
1-қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер әлі біздің пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI консоліңізге кіріңіз. Интерфейстің қол жеткізу деректері болатын API кілтін алыңыз. Жеке орталықтағы API token бөлімінде “Add Token” түймесін басып, token key: sk-xxxxx алыңыз және жіберіңіз.

2-қадам: GPT realtime 1.5 API-ге сұраулар жіберу
API сұрауын жіберу үшін “gpt-realtime-1.5” endpoint-ін таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің веб-сайттағы API құжаттамасынан алынады. Сондай-ақ, ыңғайлылығыңыз үшін біздің веб-сайтта Apifox сынағы ұсынылған. <YOUR_API_KEY> орнын есептік жазбаңыздағы нақты CometAPI кілтімен ауыстырыңыз. base url — Chat Completions
Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель жауап беретін нәрсе осы. Жасалған жауапты алу үшін API жауабын өңдеңіз.
3-қадам: Нәтижелерді алу және тексеру
Жасалған жауапты алу үшін API жауабын өңдеңіз. Өңделгеннен кейін API тапсырма күйі мен шығыс деректерімен жауап береді.