ModelDukunganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Sumber Daya
Model AIBlogPerusahaanCatatan PerubahanTentang
2025 CometAPI. Semua hak dilindungi undang-undang.Kebijakan PrivasiSyarat dan Ketentuan Layanan
Home/Models/OpenAI/gpt-realtime-1.5
O

gpt-realtime-1.5

Masukan:$3.2/M
Keluaran:$12.8/M
Konteks:32,000
Keluaran Maksimum:4,096
Model suara terbaik untuk input audio, output audio.
Baru
Penggunaan komersial
Ikhtisar
Fitur
Harga
API

Spesifikasi Teknis gpt-realtime-1.5

Itemgpt-realtime-1.5 (posisi publik)
Model familyGPT Realtime 1.5 (varian yang dioptimalkan untuk suara)
Primary modalityUcapan-ke-ucapan (S2S)
Input typesAudio (streaming), teks
Output typesAudio (streaming), teks, pemanggilan alat terstruktur
APIRealtime API (WebRTC / sesi streaming persisten)
Latency profileDioptimalkan untuk latensi rendah, interaksi percakapan langsung
Session modelSesi streaming stateful
Tool usePemanggilan fungsi dan integrasi alat didukung
Target use caseAgen suara langsung, asisten, sistem interaktif

Catatan: Batas token yang tepat dan ukuran jendela konteks tidak didokumentasikan secara menonjol dalam ringkasan publik; model ini diposisikan untuk responsivitas realtime, bukan untuk sesi konteks yang sangat panjang.


Apa itu gpt-realtime-1.5?

gpt-realtime-1.5 adalah model berlatensi rendah yang dioptimalkan untuk ucapan-ke-ucapan, dirancang untuk sistem percakapan langsung. Tidak seperti model permintaan-respons tradisional, model ini beroperasi melalui sesi streaming persisten, memungkinkan pergiliran bicara yang alami, penanganan interupsi, dan interaksi suara yang dinamis.

Model ini dibuat khusus untuk aplikasi yang mengutamakan kecepatan alur percakapan dibandingkan panjang konteks maksimum.


Fitur Utama

  1. Interaksi ucapan-ke-ucapan yang sesungguhnya — Menerima input audio langsung dan melakukan streaming respons lisan secara realtime.
  2. Arsitektur berlatensi rendah — Dirancang untuk responsivitas percakapan sub-detik pada agen suara.
  3. Desain yang mengutamakan streaming — Bekerja melalui sesi persisten (WebRTC atau protokol streaming).
  4. Pergiliran bicara yang alami — Mendukung penanganan interupsi dan alur percakapan yang dinamis.
  5. Dukungan pemanggilan alat — Dapat memicu pemanggilan fungsi terstruktur selama sesi realtime.
  6. Fondasi agen suara siap produksi — Dibangun khusus untuk asisten interaktif, kios, dan perangkat tertanam.

Posisi Benchmark & Kinerja

OpenAI memosisikan gpt-realtime-1.5 sebagai evolusi dari model realtime sebelumnya dengan peningkatan dalam mengikuti instruksi, stabilitas selama sesi suara yang panjang, dan prosodi yang lebih alami dibandingkan rilis sebelumnya.

Tidak seperti model yang berfokus pada coding (misalnya, varian Codex), kinerja lebih diukur berdasarkan latensi percakapan, kealamian suara, dan stabilitas sesi daripada benchmark bergaya leaderboard.


gpt-realtime-1.5 vs Model Terkait

Featuregpt-realtime-1.5gpt-audio-1.5
Primary goalInteraksi suara langsungAlur kerja chat dengan dukungan audio
LatencyDioptimalkan untuk jeda minimalKeseimbangan kualitas/kecepatan
Session typeSesi streaming persistenAlur Chat Completions standar
Context sizeDioptimalkan untuk responsivitasDukungan konteks yang lebih besar
Best use caseAgen suara realtimeAsisten percakapan dengan audio

Kapan Memilih Masing-Masing

  • Pilih gpt-realtime-1.5 untuk pusat panggilan, kios, resepsionis AI, atau asisten tertanam langsung.
  • Pilih gpt-audio-1.5 untuk aplikasi chat berkemampuan suara yang memerlukan memori percakapan lebih panjang atau alur kerja multimodal.

Kasus Penggunaan Representatif

  • Agen pusat panggilan AI
  • Asisten perangkat pintar
  • Kios interaktif
  • Sistem bimbingan langsung
  • Alat latihan bahasa realtime
  • Aplikasi yang dikendalikan dengan suara
  • Cara mengakses API GPT realtime 1.5

Langkah 1: Daftar untuk Mendapatkan API Key

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke Konsol CometAPI Anda. Dapatkan kredensial akses API key untuk antarmuka tersebut. Klik “Add Token” pada API token di pusat pribadi, dapatkan token key: sk-xxxxx lalu kirimkan.

cometapi-key

Langkah 2: Kirim Permintaan ke API GPT realtime 1.5

Pilih endpoint “gpt-realtime-1.5” untuk mengirim permintaan API dan atur isi request body. Metode request dan request body diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI aktual dari akun Anda. base url adalah Chat Completions

Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data output.

FAQ

What is gpt-realtime-1.5 used for in the Realtime API?

gpt-realtime-1.5 dirancang untuk interaksi ucapan-ke-ucapan berlatensi rendah menggunakan sesi streaming persisten, sehingga ideal untuk agen suara langsung dan asisten interaktif.

How is gpt-realtime-1.5 different from gpt-audio-1.5 API?

gpt-realtime-1.5 berfokus pada percakapan suara streaming waktu nyata dengan penundaan minimal, sementara gpt-audio-1.5 dioptimalkan untuk alur kerja chat berkemampuan audio dengan konteks yang lebih tinggi.

Does gpt-realtime-1.5 API support function calling during live sessions?

Ya, gpt-realtime-1.5 mendukung pemanggilan alat terstruktur dalam sesi realtime yang aktif, sehingga memungkinkan integrasi dengan sistem eksternal.

Is gpt-realtime-1.5 suitable for customer support voice bots?

Ya, model ini secara khusus dioptimalkan untuk sistem percakapan interaktif berlatensi rendah seperti agen call center dan resepsionis virtual.

Can gpt-realtime-1.5 handle interruptions during conversation?

Ya, model ini dirancang untuk pergantian giliran yang alami dan dapat menangani interupsi dalam sesi suara streaming.

Does gpt-realtime-1.5 prioritize latency or long context memory?

gpt-realtime-1.5 memprioritaskan responsivitas percakapan dan latensi rendah daripada jendela konteks yang sangat besar.

What infrastructure is required to integrate gpt-realtime-1.5 API?

Developer biasanya menggunakan WebRTC atau koneksi berbasis streaming untuk mempertahankan sesi audio persisten saat mengintegrasikan API gpt-realtime-1.5.

Fitur untuk gpt-realtime-1.5

Jelajahi fitur-fitur utama dari gpt-realtime-1.5, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk gpt-realtime-1.5

Jelajahi harga kompetitif untuk gpt-realtime-1.5, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana gpt-realtime-1.5 dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$3.2/M
Keluaran:$12.8/M
Masukan:$4/M
Keluaran:$16/M
-20%

Kode contoh dan API untuk gpt-realtime-1.5

Akses kode sampel komprehensif dan sumber daya API untuk gpt-realtime-1.5 guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh gpt-realtime-1.5 dalam proyek Anda.

Model Lainnya

O

gpt-audio-1.5

Masukan:$2/M
Keluaran:$8/M
Model suara terbaik untuk input audio dan output audio dengan Chat Completions.
O

Whisper-1

Masukan:$24/M
Keluaran:$24/M
Ucapan ke teks, menghasilkan terjemahan
O

TTS

Masukan:$12/M
Keluaran:$12/M
OpenAI Text-to-Speech
K

Kling TTS

Per Permintaan:$0.006608
[Sintesis Ucapan] Baru diluncurkan: konversi teks ke audio siaran secara online, dengan fungsi pratinjau ● Dapat sekaligus menghasilkan audio_id yang dapat digunakan dengan API Keling apa pun.
K

Kling video-to-audio

K

Kling video-to-audio

Per Permintaan:$0.03304
Kling video-ke-audio
K

Kling text-to-audio

K

Kling text-to-audio

Per Permintaan:$0.03304
Kling teks ke audio