Spesifikasi Teknis gpt-realtime-1.5
| Item | gpt-realtime-1.5 (posisi publik) |
|---|---|
| Model family | GPT Realtime 1.5 (varian yang dioptimalkan untuk suara) |
| Primary modality | Ucapan-ke-ucapan (S2S) |
| Input types | Audio (streaming), teks |
| Output types | Audio (streaming), teks, pemanggilan alat terstruktur |
| API | Realtime API (WebRTC / sesi streaming persisten) |
| Latency profile | Dioptimalkan untuk latensi rendah, interaksi percakapan langsung |
| Session model | Sesi streaming stateful |
| Tool use | Pemanggilan fungsi dan integrasi alat didukung |
| Target use case | Agen suara langsung, asisten, sistem interaktif |
Catatan: Batas token yang tepat dan ukuran jendela konteks tidak didokumentasikan secara menonjol dalam ringkasan publik; model ini diposisikan untuk responsivitas realtime, bukan untuk sesi konteks yang sangat panjang.
Apa itu gpt-realtime-1.5?
gpt-realtime-1.5 adalah model berlatensi rendah yang dioptimalkan untuk ucapan-ke-ucapan, dirancang untuk sistem percakapan langsung. Tidak seperti model permintaan-respons tradisional, model ini beroperasi melalui sesi streaming persisten, memungkinkan pergiliran bicara yang alami, penanganan interupsi, dan interaksi suara yang dinamis.
Model ini dibuat khusus untuk aplikasi yang mengutamakan kecepatan alur percakapan dibandingkan panjang konteks maksimum.
Fitur Utama
- Interaksi ucapan-ke-ucapan yang sesungguhnya — Menerima input audio langsung dan melakukan streaming respons lisan secara realtime.
- Arsitektur berlatensi rendah — Dirancang untuk responsivitas percakapan sub-detik pada agen suara.
- Desain yang mengutamakan streaming — Bekerja melalui sesi persisten (WebRTC atau protokol streaming).
- Pergiliran bicara yang alami — Mendukung penanganan interupsi dan alur percakapan yang dinamis.
- Dukungan pemanggilan alat — Dapat memicu pemanggilan fungsi terstruktur selama sesi realtime.
- Fondasi agen suara siap produksi — Dibangun khusus untuk asisten interaktif, kios, dan perangkat tertanam.
Posisi Benchmark & Kinerja
OpenAI memosisikan gpt-realtime-1.5 sebagai evolusi dari model realtime sebelumnya dengan peningkatan dalam mengikuti instruksi, stabilitas selama sesi suara yang panjang, dan prosodi yang lebih alami dibandingkan rilis sebelumnya.
Tidak seperti model yang berfokus pada coding (misalnya, varian Codex), kinerja lebih diukur berdasarkan latensi percakapan, kealamian suara, dan stabilitas sesi daripada benchmark bergaya leaderboard.
gpt-realtime-1.5 vs Model Terkait
| Feature | gpt-realtime-1.5 | gpt-audio-1.5 |
|---|---|---|
| Primary goal | Interaksi suara langsung | Alur kerja chat dengan dukungan audio |
| Latency | Dioptimalkan untuk jeda minimal | Keseimbangan kualitas/kecepatan |
| Session type | Sesi streaming persisten | Alur Chat Completions standar |
| Context size | Dioptimalkan untuk responsivitas | Dukungan konteks yang lebih besar |
| Best use case | Agen suara realtime | Asisten percakapan dengan audio |
Kapan Memilih Masing-Masing
- Pilih gpt-realtime-1.5 untuk pusat panggilan, kios, resepsionis AI, atau asisten tertanam langsung.
- Pilih gpt-audio-1.5 untuk aplikasi chat berkemampuan suara yang memerlukan memori percakapan lebih panjang atau alur kerja multimodal.
Kasus Penggunaan Representatif
- Agen pusat panggilan AI
- Asisten perangkat pintar
- Kios interaktif
- Sistem bimbingan langsung
- Alat latihan bahasa realtime
- Aplikasi yang dikendalikan dengan suara
- Cara mengakses API GPT realtime 1.5
Langkah 1: Daftar untuk Mendapatkan API Key
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke Konsol CometAPI Anda. Dapatkan kredensial akses API key untuk antarmuka tersebut. Klik “Add Token” pada API token di pusat pribadi, dapatkan token key: sk-xxxxx lalu kirimkan.

Langkah 2: Kirim Permintaan ke API GPT realtime 1.5
Pilih endpoint “gpt-realtime-1.5” untuk mengirim permintaan API dan atur isi request body. Metode request dan request body diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI aktual dari akun Anda. base url adalah Chat Completions
Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data output.