Spécifications techniques de `tts-1`

Spécification	Détails
ID du modèle	`tts-1`
Fournisseur	OpenAI
Type de modèle	Modèle de synthèse vocale (TTS) pour convertir du texte en audio parlé.
Optimisation principale	Optimisé pour la vitesse et une génération à faible latence, en particulier pour une sortie vocale en temps réel ou quasi temps réel.
Profil de qualité	Latence inférieure à `tts-1-hd`, mais avec une qualité audio moindre que la variante HD.
Modalité d'entrée	Texte uniquement.
Modalité de sortie	Audio uniquement.
Point de terminaison API	Point de terminaison de génération vocale de l'API Audio d'OpenAI : `/v1/audio/speech`.
Longueur maximale d'entrée	Jusqu'à 4096 caractères par requête.
Formats de réponse pris en charge	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Contrôle de la vitesse	Pris en charge de `0.25` à `4.0`, avec `1.0` par défaut.
Options de voix pour `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Prise en charge du streaming	L'API de synthèse vocale prend en charge la diffusion audio en continu, mais le streaming SSE et le contrôle de la voix basés sur des instructions ne sont pas pris en charge pour `tts-1`.
Tarification	OpenAI fixe le prix de `tts-1` à 15 $ par 1M de jetons pour la génération vocale.

Qu'est-ce que `tts-1` ?

tts-1 est le modèle de synthèse vocale d’OpenAI conçu pour transformer du texte écrit en audio parlé au rendu naturel. Il est positionné comme l’option la plus rapide et à plus faible latence parmi les modèles TTS classiques d’OpenAI, ce qui le rend adapté aux applications nécessitant une synthèse rapide plutôt que la fidélité la plus élevée.

Les développeurs utilisent généralement tts-1 via le point de terminaison de génération vocale de l’API Audio lorsqu’ils veulent convertir du texte d’application, des invites, des notifications, des narrations ou des réponses d’assistant en fichiers audio lisibles. La documentation d’OpenAI le décrit comme optimisé pour les cas d’usage de synthèse vocale en temps réel.

En pratique, tts-1 convient bien aux expériences vocales légères, aux systèmes à réponse rapide, aux prototypes interactifs et aux produits où la réactivité prime sur une qualité vocale premium. Si la qualité maximale est prioritaire, OpenAI oriente les utilisateurs vers tts-1-hd, tandis que des cas d’usage plus expressifs peuvent se tourner vers de nouveaux modèles TTS.

Principales fonctionnalités de `tts-1`

Génération vocale à faible latence : tts-1 est spécifiquement optimisé pour la vitesse, ce qui le rend utile pour les applications qui nécessitent une sortie vocale rapide.
Synthèse vocale naturelle : le modèle convertit du texte brut en audio parlé adapté à la narration, aux réponses d’assistant et aux interfaces vocales.
Plusieurs voix intégrées : tts-1 propose un ensemble de voix intégrées, notamment alloy, ash, coral, echo, fable, onyx, nova, sage et shimmer.
Formats audio de sortie flexibles : les développeurs peuvent demander un audio généré dans des formats courants comme MP3, WAV, FLAC, AAC, Opus et PCM selon les besoins de lecture ou de traitement.
Vitesse de lecture ajustable : l’API permet de régler la vitesse de 0.25 à 4.0, pour une narration plus lente ou une lecture accélérée selon le contexte.
Intégration simple via API : tts-1 est disponible via l’API standard de génération vocale, ce qui facilite son intégration dans des workflows web, mobiles ou back-end.
Adapté aux applications orientées temps réel : OpenAI présente explicitement tts-1 comme un modèle pour les scénarios de synthèse vocale en temps réel, ce qui le rend pratique pour les assistants, les notifications et les systèmes interactifs rapides.
Choix axé sur les compromis : par rapport à tts-1-hd, ce modèle privilégie une génération plus rapide plutôt qu’une fidélité supérieure, offrant un choix clair entre latence et qualité.

Comment accéder à `tts-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Pour accéder à l’API tts-1, inscrivez-vous d’abord sur CometAPI et générez votre clé API depuis le tableau de bord. Après vous être connecté, créez une nouvelle clé, copiez-la de manière sécurisée et stockez-la dans les variables d’environnement de votre application. Vous utiliserez cette clé pour authentifier toutes les requêtes vers l’API tts-1.

Étape 2 : Envoyer des requêtes à l’API `tts-1`

Une fois votre clé API obtenue, envoyez une requête POST vers le point de terminaison CometAPI pour tts-1 avec votre charge utile. Incluez votre clé API dans l’en-tête Authorization et spécifiez tts-1 comme modèle. Une requête type inclut le texte d’entrée ainsi que des paramètres TTS tels que la voix et le format de réponse.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Étape 3 : Récupérer et vérifier les résultats

Après l’envoi de votre requête, l’API tts-1 retourne le contenu audio généré si l’appel réussit. Enregistrez le fichier ou le flux renvoyé, vérifiez que l’audio se lit correctement et confirmez que la voix, la vitesse et le format sélectionnés correspondent aux exigences de votre application. Si nécessaire, réessayez avec des paramètres ajustés pour améliorer le rendu final.

Spécifications techniques de `tts-1`

Spécification	Détails
ID du modèle	`tts-1`
Fournisseur	OpenAI
Type de modèle	Modèle de synthèse vocale (TTS) pour convertir du texte en audio parlé.
Optimisation principale	Optimisé pour la vitesse et une génération à faible latence, en particulier pour une sortie vocale en temps réel ou quasi temps réel.
Profil de qualité	Latence inférieure à `tts-1-hd`, mais avec une qualité audio moindre que la variante HD.
Modalité d'entrée	Texte uniquement.
Modalité de sortie	Audio uniquement.
Point de terminaison API	Point de terminaison de génération vocale de l'API Audio d'OpenAI : `/v1/audio/speech`.
Longueur maximale d'entrée	Jusqu'à 4096 caractères par requête.
Formats de réponse pris en charge	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Contrôle de la vitesse	Pris en charge de `0.25` à `4.0`, avec `1.0` par défaut.
Options de voix pour `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Prise en charge du streaming	L'API de synthèse vocale prend en charge la diffusion audio en continu, mais le streaming SSE et le contrôle de la voix basés sur des instructions ne sont pas pris en charge pour `tts-1`.
Tarification	OpenAI fixe le prix de `tts-1` à 15 $ par 1M de jetons pour la génération vocale.

Qu'est-ce que `tts-1` ?

Principales fonctionnalités de `tts-1`

Génération vocale à faible latence : tts-1 est spécifiquement optimisé pour la vitesse, ce qui le rend utile pour les applications qui nécessitent une sortie vocale rapide.
Synthèse vocale naturelle : le modèle convertit du texte brut en audio parlé adapté à la narration, aux réponses d’assistant et aux interfaces vocales.
Plusieurs voix intégrées : tts-1 propose un ensemble de voix intégrées, notamment alloy, ash, coral, echo, fable, onyx, nova, sage et shimmer.
Formats audio de sortie flexibles : les développeurs peuvent demander un audio généré dans des formats courants comme MP3, WAV, FLAC, AAC, Opus et PCM selon les besoins de lecture ou de traitement.
Vitesse de lecture ajustable : l’API permet de régler la vitesse de 0.25 à 4.0, pour une narration plus lente ou une lecture accélérée selon le contexte.
Intégration simple via API : tts-1 est disponible via l’API standard de génération vocale, ce qui facilite son intégration dans des workflows web, mobiles ou back-end.
Adapté aux applications orientées temps réel : OpenAI présente explicitement tts-1 comme un modèle pour les scénarios de synthèse vocale en temps réel, ce qui le rend pratique pour les assistants, les notifications et les systèmes interactifs rapides.
Choix axé sur les compromis : par rapport à tts-1-hd, ce modèle privilégie une génération plus rapide plutôt qu’une fidélité supérieure, offrant un choix clair entre latence et qualité.

Comment accéder à `tts-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

Spécifications techniques de `tts-1`

Qu'est-ce que `tts-1` ?

Principales fonctionnalités de `tts-1`

Comment accéder à `tts-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API `tts-1`

Étape 3 : Récupérer et vérifier les résultats

Tarification pour tts-1

Exemple de code et API pour tts-1

tts-1

Spécifications techniques de `tts-1`

Qu'est-ce que `tts-1` ?

Principales fonctionnalités de `tts-1`

Comment accéder à `tts-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API `tts-1`

Étape 3 : Récupérer et vérifier les résultats

Tarification pour tts-1

Exemple de code et API pour tts-1

tts-1

Spécifications techniques de tts-1

Qu'est-ce que tts-1 ?

Principales fonctionnalités de tts-1

Comment accéder à tts-1 et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API tts-1

Étape 3 : Récupérer et vérifier les résultats

Tarification pour tts-1

Exemple de code et API pour tts-1

tts-1

Spécifications techniques de tts-1

Qu'est-ce que tts-1 ?

Principales fonctionnalités de tts-1

Comment accéder à tts-1 et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API tts-1

Étape 3 : Récupérer et vérifier les résultats

Tarification pour tts-1

Exemple de code et API pour tts-1

Spécifications techniques de `tts-1`

Qu'est-ce que `tts-1` ?

Principales fonctionnalités de `tts-1`

Comment accéder à `tts-1` et l’intégrer

Étape 2 : Envoyer des requêtes à l’API `tts-1`

Spécifications techniques de `tts-1`

Qu'est-ce que `tts-1` ?

Principales fonctionnalités de `tts-1`

Comment accéder à `tts-1` et l’intégrer

Étape 2 : Envoyer des requêtes à l’API `tts-1`