O

gpt-audio-1.5

Masukan:$2/M
Keluaran:$8/M
Model suara terbaik untuk input audio dan output audio dengan Chat Completions.
Baru
Penggunaan komersial

Spesifikasi teknis gpt-audio-1.5

Itemgpt-audio-1.5 (spesifikasi publik)
Model familyKeluarga GPT Audio (varian audio-first)
Input typesTeks, audio (ucapan masuk)
Output typesTeks, audio (ucapan keluar), output terstruktur (mendukung pemanggilan fungsi)
Context window128,000 token.
Max output tokens16,384 (tercantum dalam daftar gpt-audio terkait).
Performance tierKecerdasan lebih tinggi; Kecepatan sedang (seimbang).
Latency profileDioptimalkan untuk interaksi suara (latensi menengah/rendah bergantung pada endpoint).
AvailabilityChat Completions API (audio in/out) dan playground platform; terintegrasi di berbagai permukaan realtime/suara.
Safety / usage notesGuardrail untuk konten suara; perlakukan keluaran model dengan praktik keselamatan dan verifikasi yang lazim untuk agen suara produksi.

Catatan: gpt-realtime-1.5 adalah varian realtime yang terkait erat dan berfokus pada audio/suara, dioptimalkan untuk latensi lebih rendah dan sesi realtime; lihat perbandingan di bawah.


Apa itu gpt-audio-1.5?

gpt-audio-1.5 adalah model GPT yang mendukung audio, dengan dukungan masukan ucapan dan keluaran ucapan melalui Chat Completions dan API terkait yang mendukung audio. Model ini diposisikan sebagai model audio utama yang tersedia secara umum untuk membangun agen suara dan pengalaman yang berfokus pada suara, dengan keseimbangan antara kualitas dan kecepatan.


Fitur utama

  1. Dukungan masukan suara / keluaran suara: Menangani masukan ujaran dan mengembalikan respons berupa suara atau teks untuk alur percakapan yang alami.
  2. Konteks besar untuk alur kerja audio: Mendukung konteks yang sangat besar (tercantum 128k token), memungkinkan percakapan multi-putaran, riwayat percakapan panjang, atau sesi multimodal yang besar.
  3. Kompatibel dengan Streaming & Chat Completions: Berfungsi di dalam Chat Completions dengan respons audio streaming dan output terstruktur berupa pemanggilan fungsi.
  4. Performa/latensi seimbang: Disetel untuk memberikan respons audio berkualitas tinggi pada throughput sedang—cocok untuk chatbot dan asisten suara di mana kualitas penting.
  5. Ekosistem & integrasi: Didukung di playground platform dan tersedia di berbagai endpoint resmi realtime/suara serta integrasi mitra (catatan Azure/Microsoft Foundry merujuk pada model audio serupa).

gpt-audio-1.5 vs model audio terkait

Propertigpt-audio-1.5gpt-realtime-1.5
Primary focusAudio berkualitas tinggi masuk/keluar untuk Chat Completions dan alur percakapan.Realtime S2S (speech-to-speech) dengan latensi lebih rendah untuk agen suara live dan skenario streaming.
Context window128k token.32k token (varian realtime tercantum).
Max output tokens16,384 (tercantum).Biasanya dikonfigurasi untuk respons realtime yang lebih pendek (dokumen mencantumkan jumlah token maksimum yang lebih kecil).
Best useChatbot, asisten berfitur suara yang memerlukan semantik chat lengkap + audio.Agen suara live, kios, dan antarmuka percakapan berlatensi rendah.

Kasus penggunaan representatif

  • Agen suara percakapan untuk dukungan pelanggan dan helpdesk internal.
  • Asisten berfitur suara yang disematkan dalam aplikasi, perangkat, dan kios.
  • Alur kerja bebas tangan (dikta, pencarian suara, aksesibilitas).
  • Pengalaman multimodal yang memadukan audio dengan teks/gambar melalui Chat Completions.

Keterbatasan & pertimbangan operasional

  • Bukan pengganti langsung untuk QA manusia: Selalu validasi keluaran suara dan tindakan lanjutan dengan tinjauan manusia dalam alur produksi.
  • Perencanaan sumber daya: Konteks besar dan I/O audio dapat meningkatkan komputasi dan latensi—rancang strategi streaming/segmentasi untuk sesi panjang.
  • Keterbatasan keselamatan & kebijakan: Keluaran suara dapat memiliki daya persuasif; ikuti pedoman keselamatan platform dan guardrail saat melakukan penerapan skala besar.
  • Cara mengakses GPT Audio 1.5 API

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API untuk antarmuka. Klik "Add Token" pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.

cometapi-key

Langkah 2: Kirim permintaan ke GPT Audio 1.5 API

Pilih endpoint “gpt-audio-1.5” untuk mengirim permintaan API dan setel body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah Chat Completions

Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data keluaran.

FAQ

Model Lainnya