Spesifikasi Teknis gpt-realtime-1.5
| Item | gpt-realtime-1.5 (posisi publik) |
|---|---|
| Keluarga model | GPT Realtime 1.5 (varian yang dioptimalkan untuk suara) |
| Modalitas utama | Ucapan-ke-ucapan (S2S) |
| Jenis input | Audio (streaming), teks |
| Jenis output | Audio (streaming), teks, panggilan alat terstruktur |
| API | Realtime API (WebRTC / sesi streaming persisten) |
| Profil latensi | Dioptimalkan untuk latensi rendah, interaksi percakapan langsung |
| Model sesi | Sesi streaming stateful |
| Penggunaan alat | Mendukung pemanggilan fungsi dan integrasi alat |
| Kasus penggunaan target | Agen suara langsung, asisten, sistem interaktif |
Catatan: Batas token yang tepat dan ukuran jendela konteks tidak didokumentasikan secara menonjol dalam ringkasan publik; model ini diposisikan untuk responsivitas waktu nyata alih-alih sesi konteks yang sangat panjang.
Apa itu gpt-realtime-1.5?
gpt-realtime-1.5 adalah model berlatensi rendah yang dioptimalkan untuk ucapan-ke-ucapan, dirancang untuk sistem percakapan langsung. Berbeda dengan model permintaan–respons tradisional, model ini beroperasi melalui sesi streaming persisten, memungkinkan giliran berbicara yang natural, penanganan interupsi, dan interaksi suara yang dinamis.
Model ini dibuat khusus untuk aplikasi di mana kecepatan alur percakapan lebih penting daripada panjang konteks maksimum.
Fitur Utama
- Interaksi ucapan-ke-ucapan yang sesungguhnya — Menerima input audio langsung dan menyiarkan respons lisan secara waktu nyata.
- Arsitektur berlatensi rendah — Dirancang untuk respons percakapan dalam waktu kurang dari satu detik di agen suara.
- Desain berorientasi streaming — Bekerja melalui sesi persisten (WebRTC atau protokol streaming).
- Pergantian giliran yang natural — Mendukung penanganan interupsi dan alur percakapan dinamis.
- Dukungan pemanggilan alat — Dapat memicu pemanggilan fungsi terstruktur selama sesi waktu nyata.
- Fondasi agen suara siap produksi — Dibangun khusus untuk asisten interaktif, kios, dan perangkat tertanam.
Benchmark & Pemosisian Kinerja
OpenAI memposisikan gpt-realtime-1.5 sebagai evolusi dari model waktu nyata sebelumnya dengan peningkatan kemampuan mengikuti instruksi, stabilitas selama sesi suara yang diperpanjang, dan prosodi yang lebih natural dibandingkan rilis sebelumnya.
Tidak seperti model yang berfokus pada pengodean (misalnya varian Codex), pengukuran kinerja lebih menitikberatkan pada latensi percakapan, kealamian suara, dan stabilitas sesi daripada tolok ukur bergaya papan peringkat.
gpt-realtime-1.5 vs Model Terkait
| Fitur | gpt-realtime-1.5 | gpt-audio-1.5 |
|---|---|---|
| Tujuan utama | Interaksi suara langsung | Alur kerja chat berfitur audio |
| Latensi | Dioptimalkan untuk jeda minimal | Keseimbangan kualitas/kecepatan |
| Jenis sesi | Sesi streaming persisten | Alur Chat Completions standar |
| Ukuran konteks | Dioptimalkan untuk responsivitas | Dukungan konteks lebih besar |
| Kasus penggunaan terbaik | Agen suara waktu nyata | Asisten percakapan dengan audio |
Kapan Memilih Masing-Masing
- Pilih gpt-realtime-1.5 untuk pusat panggilan, kios, resepsionis AI, atau asisten tertanam yang beroperasi langsung.
- Pilih gpt-audio-1.5 untuk aplikasi chat berfitur suara yang memerlukan memori percakapan lebih panjang atau alur kerja multimodal.
Kasus Penggunaan Representatif
- Agen pusat panggilan AI
- Asisten perangkat pintar
- Kios interaktif
- Sistem tutor langsung
- Alat latihan bahasa waktu nyata
- Aplikasi yang dikendalikan suara
- Cara mengakses API GPT realtime 1.5
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim Permintaan ke API GPT realtime 1.5
Pilih endpoint “gpt-realtime-1.5” untuk mengirim permintaan API dan setel badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah Chat Completions
Masukkan pertanyaan atau permintaan Anda ke bidang konten—ini adalah bagian yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.