Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Spesifikasi	Detail
Model ID	`gpt-4o-mini-audio-preview`
Tipe Model	Model audio-preview multimodal yang ringkas
Modalitas Inti	Masukan/keluaran teks, masukan ucapan, keluaran ucapan
Pola Antarmuka Utama	Interaksi berbasis chat dengan konten pesan multimodal
Kemampuan Audio	Pengenalan ucapan, sintesis ucapan, percakapan campuran teks-audio
Dukungan Streaming	Ya, cocok untuk alur percakapan waktu nyata
Pemanggilan Tool/Fungsi	Didukung untuk tindakan terstruktur dan integrasi alur kerja
Paling Cocok Untuk	Asisten suara, transkripsi streaming, IVR, alur kerja call-bot, bantuan audio dalam aplikasi
Gaya Interaksi	Model percakapan yang mengikuti instruksi dengan giliran multimodal
Pola Integrasi	Akses berbasis API melalui CometAPI menggunakan ID model `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

gpt-4o-mini-audio-preview adalah model multimodal yang ringkas, dirancang untuk pengembang yang ingin membangun pengalaman audio percakapan. Model ini mendukung masukan ucapan dan keluaran ucapan selain interaksi teks standar, sehingga sangat cocok untuk aplikasi di mana pengguna berbicara secara natural dan mengharapkan balasan lisan atau berbasis teks.

Model ini sangat berguna ketika sebuah produk perlu menggabungkan pengenalan ucapan otomatis, pemahaman bahasa alami, dan sintesis ucapan dalam satu siklus percakapan. Alih-alih memperlakukan transkripsi, penalaran, dan pembuatan respons sebagai komponen terpisah, gpt-4o-mini-audio-preview memungkinkan alur kerja terpadu untuk dialog teks-audio campuran.

Karena juga mendukung pemanggilan tool dan fungsi, model ini dapat melakukan lebih dari sekadar mengobrol. Model ini dapat memicu tindakan terstruktur seperti mencari informasi akun, merutekan permintaan dukungan pelanggan, memperbarui catatan, atau memanggil logika bisnis di dalam aplikasi yang lebih besar. Hal ini menjadikannya sangat cocok untuk sistem suara produksi seperti asisten virtual, agen dukungan telepon, sistem interactive voice response, pipeline transkripsi dengan peringkasan, dan asisten produk berkemampuan audio.

Fitur utama `gpt-4o-mini-audio-preview`

Dukungan masukan ucapan: Menerima interaksi pengguna berbasis audio sehingga aplikasi dapat memproses permintaan lisan secara alami.
Pembuatan keluaran ucapan: Menghasilkan respons audio untuk asisten, otomasi panggilan, dan pengalaman panduan lisan.
Percakapan campuran teks-audio: Mendukung alur kerja di mana beberapa giliran bersifat lisan dan lainnya berbasis teks, yang bermanfaat untuk antarmuka hibrida.
Desain multimodal yang ringkas: Menawarkan kapabilitas berkemampuan audio dalam jejak model yang lebih ringan, cocok untuk aplikasi yang responsif.
Respons streaming: Membantu menghadirkan pengalaman latensi rendah dan waktu nyata seperti asisten live dan sistem transkripsi streaming.
Pemanggilan tool/fungsi: Memungkinkan model memanggil tool terstruktur atau fungsi bisnis untuk tugas di luar percakapan terbuka.
Mengikuti instruksi: Mengikuti panduan pada tingkat aplikasi untuk menjaga respons selaras dengan perilaku produk dan kebutuhan alur kerja.
Alur kerja transkripsi dan peringkasan: Berguna untuk mengubah interaksi lisan menjadi keluaran teks terstruktur, ringkasan, atau tindakan lanjutan.
Kesiapan IVR dan call-bot: Cocok untuk skenario dukungan pelanggan dan telefoni di mana interaksi lisan dan perutean tugas menjadi pusat.
Bantuan audio dalam aplikasi: Dapat disematkan ke dalam produk perangkat lunak yang memerlukan bantuan berkemampuan suara, onboarding, atau tindakan terpandu.

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 1: Daftar untuk Kunci API

Untuk mulai menggunakan gpt-4o-mini-audio-preview, pertama buat akun di CometAPI dan hasilkan kunci API Anda dari dasbor. Kunci ini digunakan untuk mengautentikasi setiap permintaan dan menghubungkan aplikasi Anda ke model secara aman.

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`

Gunakan endpoint CometAPI yang kompatibel dengan OpenAI dengan dukungan masukan/keluaran audio.

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-audio-preview",
    "modalities": ["text", "audio"],
    "audio": {
      "voice": "alloy",
      "format": "wav"
    },
    "messages": [
      {
        "role": "user",
        "content": "Tell me a short joke."
      }
    ]
  }'

Langkah 3: Ambil dan Verifikasi Hasil

API mengembalikan respons chat completion standar dengan field tambahan audio yang berisi keluaran audio terkode base64. Dekode data audio dan verifikasi kualitas sebelum digunakan di produksi.

Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Spesifikasi	Detail
Model ID	`gpt-4o-mini-audio-preview`
Tipe Model	Model audio-preview multimodal yang ringkas
Modalitas Inti	Masukan/keluaran teks, masukan ucapan, keluaran ucapan
Pola Antarmuka Utama	Interaksi berbasis chat dengan konten pesan multimodal
Kemampuan Audio	Pengenalan ucapan, sintesis ucapan, percakapan campuran teks-audio
Dukungan Streaming	Ya, cocok untuk alur percakapan waktu nyata
Pemanggilan Tool/Fungsi	Didukung untuk tindakan terstruktur dan integrasi alur kerja
Paling Cocok Untuk	Asisten suara, transkripsi streaming, IVR, alur kerja call-bot, bantuan audio dalam aplikasi
Gaya Interaksi	Model percakapan yang mengikuti instruksi dengan giliran multimodal
Pola Integrasi	Akses berbasis API melalui CometAPI menggunakan ID model `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

Fitur utama `gpt-4o-mini-audio-preview`

Dukungan masukan ucapan: Menerima interaksi pengguna berbasis audio sehingga aplikasi dapat memproses permintaan lisan secara alami.
Pembuatan keluaran ucapan: Menghasilkan respons audio untuk asisten, otomasi panggilan, dan pengalaman panduan lisan.
Percakapan campuran teks-audio: Mendukung alur kerja di mana beberapa giliran bersifat lisan dan lainnya berbasis teks, yang bermanfaat untuk antarmuka hibrida.
Desain multimodal yang ringkas: Menawarkan kapabilitas berkemampuan audio dalam jejak model yang lebih ringan, cocok untuk aplikasi yang responsif.
Respons streaming: Membantu menghadirkan pengalaman latensi rendah dan waktu nyata seperti asisten live dan sistem transkripsi streaming.
Pemanggilan tool/fungsi: Memungkinkan model memanggil tool terstruktur atau fungsi bisnis untuk tugas di luar percakapan terbuka.
Mengikuti instruksi: Mengikuti panduan pada tingkat aplikasi untuk menjaga respons selaras dengan perilaku produk dan kebutuhan alur kerja.
Alur kerja transkripsi dan peringkasan: Berguna untuk mengubah interaksi lisan menjadi keluaran teks terstruktur, ringkasan, atau tindakan lanjutan.
Kesiapan IVR dan call-bot: Cocok untuk skenario dukungan pelanggan dan telefoni di mana interaksi lisan dan perutean tugas menjadi pusat.
Bantuan audio dalam aplikasi: Dapat disematkan ke dalam produk perangkat lunak yang memerlukan bantuan berkemampuan suara, onboarding, atau tindakan terpandu.

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`

Gunakan endpoint CometAPI yang kompatibel dengan OpenAI dengan dukungan masukan/keluaran audio.

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-audio-preview",
    "modalities": ["text", "audio"],
    "audio": {
      "voice": "alloy",
      "format": "wav"
    },
    "messages": [
      {
        "role": "user",
        "content": "Tell me a short joke."
      }
    ]
  }'

Langkah 3: Ambil dan Verifikasi Hasil

API mengembalikan respons chat completion standar dengan field tambahan audio yang berisi keluaran audio terkode base64. Dekode data audio dan verifikasi kualitas sebelum digunakan di produksi.

GPT-4o mini Audio Preview

Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

Fitur utama `gpt-4o-mini-audio-preview`

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`

Langkah 3: Ambil dan Verifikasi Hasil

Harga untuk GPT-4o mini Audio Preview

Kode contoh dan API untuk GPT-4o mini Audio Preview

Versi GPT-4o mini Audio Preview

GPT-4o mini Audio Preview

Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

Fitur utama `gpt-4o-mini-audio-preview`

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`

Langkah 3: Ambil dan Verifikasi Hasil

Harga untuk GPT-4o mini Audio Preview

Kode contoh dan API untuk GPT-4o mini Audio Preview

Versi GPT-4o mini Audio Preview

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

GPT-4o mini Audio Preview

Spesifikasi Teknis gpt-4o-mini-audio-preview

Apa itu gpt-4o-mini-audio-preview?

Fitur utama gpt-4o-mini-audio-preview

Cara mengakses dan mengintegrasikan gpt-4o-mini-audio-preview

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API gpt-4o-mini-audio-preview

Langkah 3: Ambil dan Verifikasi Hasil

Harga untuk GPT-4o mini Audio Preview

Kode contoh dan API untuk GPT-4o mini Audio Preview

Versi GPT-4o mini Audio Preview

GPT-4o mini Audio Preview

Spesifikasi Teknis gpt-4o-mini-audio-preview

Apa itu gpt-4o-mini-audio-preview?

Fitur utama gpt-4o-mini-audio-preview

Cara mengakses dan mengintegrasikan gpt-4o-mini-audio-preview

Langkah 1: Daftar untuk Kunci API

Langkah 2: Kirim Permintaan ke API gpt-4o-mini-audio-preview

Langkah 3: Ambil dan Verifikasi Hasil

Harga untuk GPT-4o mini Audio Preview

Kode contoh dan API untuk GPT-4o mini Audio Preview

Versi GPT-4o mini Audio Preview

Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

Fitur utama `gpt-4o-mini-audio-preview`

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`

Spesifikasi Teknis `gpt-4o-mini-audio-preview`

Apa itu `gpt-4o-mini-audio-preview`?

Fitur utama `gpt-4o-mini-audio-preview`

Cara mengakses dan mengintegrasikan `gpt-4o-mini-audio-preview`

Langkah 2: Kirim Permintaan ke API `gpt-4o-mini-audio-preview`