Spesifikasi Teknikal `tts-1`

Spesifikasi	Butiran
ID Model	`tts-1`
Penyedia	OpenAI
Jenis model	Model teks-ke-pertuturan (TTS) untuk menukar input teks kepada audio pertuturan.
Pengoptimuman utama	Dioptimumkan untuk kelajuan dan penjanaan berlatensi rendah, khususnya untuk output pertuturan masa nyata atau hampir masa nyata.
Profil kualiti	Latensi lebih rendah daripada `tts-1-hd`, tetapi dengan kualiti audio lebih rendah berbanding varian HD.
Mod input	Teks sahaja.
Mod output	Audio sahaja.
Titik akhir API	Titik akhir penjanaan pertuturan OpenAI Audio API: `/v1/audio/speech`.
Panjang input maksimum	Sehingga 4096 aksara bagi setiap permintaan.
Format respons yang disokong	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Kawalan kelajuan	Disokong dari `0.25` hingga `4.0`, dengan `1.0` sebagai lalai.
Pilihan suara untuk `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Sokongan penstriman	Speech API menyokong output audio penstriman, tetapi penstriman SSE dan kawalan suara berasaskan arahan tidak disokong untuk `tts-1`.
Harga	OpenAI menyenaraikan `tts-1` pada $15 per 1M token untuk penjanaan pertuturan.

Apakah `tts-1`?

tts-1 ialah model teks-ke-pertuturan oleh OpenAI yang direka untuk menukar teks bertulis kepada audio pertuturan yang kedengaran semula jadi. Ia diposisikan sebagai pilihan yang lebih pantas dan berlatensi lebih rendah dalam kalangan model TTS klasik OpenAI, menjadikannya sesuai untuk aplikasi yang memerlukan sintesis pertuturan pantas berbanding fideliti setinggi mungkin.

Pembangun lazimnya menggunakan tts-1 melalui titik akhir penjanaan pertuturan Audio API apabila mereka ingin menukar teks aplikasi, arahan, pemberitahuan, narasi, atau respons pembantu kepada fail audio yang boleh dimainkan. Dokumentasi OpenAI menerangkannya sebagai dioptimumkan untuk kes penggunaan teks-ke-pertuturan masa nyata.

Dalam praktiknya, tts-1 sesuai untuk pengalaman suara ringan, sistem respons pantas, prototaip interaktif, dan produk di mana kereaktifan lebih penting daripada kualiti suara premium. Jika kualiti maksimum menjadi keutamaan, OpenAI mengesyorkan tts-1-hd, manakala kes penggunaan ekspresif yang lebih baharu mungkin menggunakan model TTS yang lebih baharu.

Ciri utama `tts-1`

Penjanaan pertuturan berlatensi rendah: tts-1 dioptimumkan khusus untuk kelajuan, menjadikannya berguna bagi aplikasi yang memerlukan output pertuturan dengan cepat.
Teks-ke-pertuturan yang kedengaran semula jadi: Model ini menukar teks biasa kepada audio pertuturan yang sesuai untuk narasi, respons pembantu, dan antara muka suara.
Pelbagai suara terbina dalam: tts-1 menyokong set suara terbina termasuk alloy, ash, coral, echo, fable, onyx, nova, sage, dan shimmer.
Format output audio yang fleksibel: Pembangun boleh meminta audio yang dijana dalam format lazim seperti MP3, WAV, FLAC, AAC, Opus dan PCM bergantung pada keperluan main balik atau pemprosesan.
Kelajuan main balik boleh dilaras: API membenarkan kawalan kelajuan dari 0.25x hingga 4.0x, membolehkan narasi lebih perlahan atau main balik lebih pantas mengikut kesesuaian.
Integrasi berasaskan API yang ringkas: tts-1 tersedia melalui API penjanaan pertuturan standard, menjadikannya mudah untuk diintegrasikan ke dalam aliran kerja web, mudah alih, atau backend.
Sesuai untuk aplikasi berorientasikan masa nyata: OpenAI dengan jelas memposisikan tts-1 sebagai model untuk senario teks-ke-pertuturan masa nyata, menjadikannya praktikal untuk pembantu, pemberitahuan, dan sistem interaktif pantas.
Pilihan model berfokus kompromi: Berbanding tts-1-hd, model ini mengutamakan penjanaan lebih pantas berbanding output fideliti lebih tinggi, memberikan pembangun pilihan jelas antara latensi dan kualiti.

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 1: Daftar untuk Kunci API

Untuk mengakses API tts-1, mula-mula daftar di CometAPI dan jana kunci API anda daripada papan pemuka. Selepas log masuk, cipta kunci baharu, salin dengan selamat, dan simpan dalam pembolehubah persekitaran aplikasi anda. Anda akan menggunakan kunci ini untuk mengesahkan semua permintaan kepada API tts-1.

Langkah 2: Hantar Permintaan ke API `tts-1`

Sebaik sahaja anda mempunyai kunci API, hantarkan permintaan POST ke titik akhir CometAPI untuk tts-1 bersama payload input anda. Sertakan kunci API anda dalam pengepala Authorization dan nyatakan tts-1 sebagai model. Permintaan lazim merangkumi teks input serta parameter TTS seperti suara dan format respons.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Langkah 3: Dapatkan dan Sahkan Hasil

Selepas menghantar permintaan anda, API tts-1 akan memulangkan kandungan audio yang dijana jika panggilan berjaya. Simpan fail atau strim yang dipulangkan, sahkan bahawa audio dimainkan dengan betul, dan pastikan suara, kelajuan, serta format yang dipilih sepadan dengan keperluan aplikasi anda. Jika perlu, cuba semula dengan melaraskan parameter untuk memperbaiki output akhir.

Spesifikasi Teknikal `tts-1`

Spesifikasi	Butiran
ID Model	`tts-1`
Penyedia	OpenAI
Jenis model	Model teks-ke-pertuturan (TTS) untuk menukar input teks kepada audio pertuturan.
Pengoptimuman utama	Dioptimumkan untuk kelajuan dan penjanaan berlatensi rendah, khususnya untuk output pertuturan masa nyata atau hampir masa nyata.
Profil kualiti	Latensi lebih rendah daripada `tts-1-hd`, tetapi dengan kualiti audio lebih rendah berbanding varian HD.
Mod input	Teks sahaja.
Mod output	Audio sahaja.
Titik akhir API	Titik akhir penjanaan pertuturan OpenAI Audio API: `/v1/audio/speech`.
Panjang input maksimum	Sehingga 4096 aksara bagi setiap permintaan.
Format respons yang disokong	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Kawalan kelajuan	Disokong dari `0.25` hingga `4.0`, dengan `1.0` sebagai lalai.
Pilihan suara untuk `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Sokongan penstriman	Speech API menyokong output audio penstriman, tetapi penstriman SSE dan kawalan suara berasaskan arahan tidak disokong untuk `tts-1`.
Harga	OpenAI menyenaraikan `tts-1` pada $15 per 1M token untuk penjanaan pertuturan.

Apakah `tts-1`?

Ciri utama `tts-1`

Penjanaan pertuturan berlatensi rendah: tts-1 dioptimumkan khusus untuk kelajuan, menjadikannya berguna bagi aplikasi yang memerlukan output pertuturan dengan cepat.
Teks-ke-pertuturan yang kedengaran semula jadi: Model ini menukar teks biasa kepada audio pertuturan yang sesuai untuk narasi, respons pembantu, dan antara muka suara.
Pelbagai suara terbina dalam: tts-1 menyokong set suara terbina termasuk alloy, ash, coral, echo, fable, onyx, nova, sage, dan shimmer.
Format output audio yang fleksibel: Pembangun boleh meminta audio yang dijana dalam format lazim seperti MP3, WAV, FLAC, AAC, Opus dan PCM bergantung pada keperluan main balik atau pemprosesan.
Kelajuan main balik boleh dilaras: API membenarkan kawalan kelajuan dari 0.25x hingga 4.0x, membolehkan narasi lebih perlahan atau main balik lebih pantas mengikut kesesuaian.
Integrasi berasaskan API yang ringkas: tts-1 tersedia melalui API penjanaan pertuturan standard, menjadikannya mudah untuk diintegrasikan ke dalam aliran kerja web, mudah alih, atau backend.
Sesuai untuk aplikasi berorientasikan masa nyata: OpenAI dengan jelas memposisikan tts-1 sebagai model untuk senario teks-ke-pertuturan masa nyata, menjadikannya praktikal untuk pembantu, pemberitahuan, dan sistem interaktif pantas.
Pilihan model berfokus kompromi: Berbanding tts-1-hd, model ini mengutamakan penjanaan lebih pantas berbanding output fideliti lebih tinggi, memberikan pembangun pilihan jelas antara latensi dan kualiti.

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

Spesifikasi Teknikal `tts-1`

Apakah `tts-1`?

Ciri utama `tts-1`

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API `tts-1`

Langkah 3: Dapatkan dan Sahkan Hasil

Harga untuk tts-1

Kod contoh dan API untuk tts-1

tts-1

Spesifikasi Teknikal `tts-1`

Apakah `tts-1`?

Ciri utama `tts-1`

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API `tts-1`

Langkah 3: Dapatkan dan Sahkan Hasil

Harga untuk tts-1

Kod contoh dan API untuk tts-1

tts-1

Spesifikasi Teknikal tts-1

Apakah tts-1?

Ciri utama tts-1

Cara mengakses dan mengintegrasikan tts-1

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API tts-1

Langkah 3: Dapatkan dan Sahkan Hasil

Harga untuk tts-1

Kod contoh dan API untuk tts-1

tts-1

Spesifikasi Teknikal tts-1

Apakah tts-1?

Ciri utama tts-1

Cara mengakses dan mengintegrasikan tts-1

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API tts-1

Langkah 3: Dapatkan dan Sahkan Hasil

Harga untuk tts-1

Kod contoh dan API untuk tts-1

Spesifikasi Teknikal `tts-1`

Apakah `tts-1`?

Ciri utama `tts-1`

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 2: Hantar Permintaan ke API `tts-1`

Spesifikasi Teknikal `tts-1`

Apakah `tts-1`?

Ciri utama `tts-1`

Cara mengakses dan mengintegrasikan `tts-1`

Langkah 2: Hantar Permintaan ke API `tts-1`