Specifiche tecniche di `tts-1`

Specifiche	Dettagli
Model ID	`tts-1`
Provider	OpenAI
Model type	Modello di text-to-speech (TTS) per convertire input di testo in audio parlato.
Primary optimization	Ottimizzato per velocità e bassa latenza, soprattutto per output vocale in tempo reale o quasi in tempo reale.
Quality profile	Latenza inferiore rispetto a `tts-1-hd`, ma con qualità audio inferiore rispetto alla variante HD.
Input modality	Solo testo.
Output modality	Solo audio.
API endpoint	Endpoint di generazione vocale dell'OpenAI Audio API: `/v1/audio/speech`.
Max input length	Fino a 4096 caratteri per richiesta.
Supported response formats	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Speed control	Supportato da `0.25` a `4.0`, con `1.0` come predefinito.
Voice options for `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Streaming support	La Speech API supporta l’output audio in streaming, ma lo streaming SSE e il controllo vocale basato su istruzioni non sono supportati per `tts-1`.
Pricing	OpenAI indica `tts-1` a $15 per 1M di token per la generazione vocale.

Che cos’è `tts-1`?

tts-1 è il modello di text-to-speech di OpenAI progettato per trasformare il testo scritto in audio parlato naturale. È posizionato come l’opzione più rapida e a bassa latenza tra i modelli TTS classici di OpenAI, rendendolo adatto alle applicazioni che necessitano di una sintesi vocale rapida piuttosto che della massima fedeltà.

Gli sviluppatori in genere utilizzano tts-1 tramite l’endpoint di generazione vocale della Audio API quando desiderano convertire testi dell’applicazione, prompt, notifiche, narrazioni o risposte dell’assistente in file audio riproducibili. La documentazione di OpenAI lo descrive come ottimizzato per casi d’uso di text-to-speech in tempo reale.

In pratica, tts-1 è adatto a esperienze vocali leggere, sistemi a risposta rapida, prototipi interattivi e prodotti in cui la reattività conta più della qualità vocale premium. Se la qualità massima è la priorità, OpenAI indirizza verso tts-1-hd, mentre per casi d’uso espressivi più recenti si possono utilizzare modelli TTS più nuovi.

Caratteristiche principali di `tts-1`

Generazione vocale a bassa latenza: tts-1 è specificamente ottimizzato per la velocità, utile per app che necessitano di output parlato rapido.
Sintesi vocale dal suono naturale: Converte testo in audio parlato adatto a narrazioni, risposte di assistenti e interfacce vocali.
Più voci integrate: tts-1 supporta un set di voci integrate tra cui alloy, ash, coral, echo, fable, onyx, nova, sage e shimmer.
Formati audio di output flessibili: È possibile richiedere audio nei formati comuni come MP3, WAV, FLAC, AAC, Opus e PCM a seconda delle esigenze di riproduzione o elaborazione.
Controllo della velocità di riproduzione: L’API consente di impostare la velocità da 0,25x a 4,0x, per narrazioni più lente o riproduzioni più rapide.
Integrazione semplice via API: tts-1 è disponibile tramite la standard Speech Generation API, semplificando l’integrazione in flussi web, mobile o backend.
Ideale per applicazioni orientate al realtime: OpenAI presenta tts-1 come un modello per scenari TTS in tempo reale, pratico per assistenti, notifiche e sistemi interattivi rapidi.
Scelta del modello basata sui compromessi: Rispetto a tts-1-hd, privilegia la velocità rispetto alla qualità di output, offrendo una chiara opzione tra latenza e fedeltà.

Come accedere e integrare `tts-1`

Passaggio 1: Registrati per la chiave API

Per accedere all’API di tts-1, registrati su CometAPI e genera la tua chiave API dalla dashboard. Dopo l’accesso, crea una nuova chiave, copiala in modo sicuro e archiviala nelle variabili d’ambiente dell’applicazione. Userai questa chiave per autenticare tutte le richieste all’API di tts-1.

Passaggio 2: Invia richieste all’API di `tts-1`

Dopo aver ottenuto la chiave API, invia una richiesta POST all’endpoint CometAPI per tts-1 con il payload di input. Includi la chiave API nell’intestazione Authorization e specifica tts-1 come modello. Una richiesta tipica include il testo di input e i parametri TTS come voce e formato di risposta.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Passaggio 3: Recupera e verifica i risultati

Dopo l’invio della richiesta, l’API di tts-1 restituisce contenuti audio generati se la chiamata ha esito positivo. Salva il file o lo stream restituito, verifica che l’audio venga riprodotto correttamente e conferma che voce, velocità e formato selezionati corrispondano ai requisiti dell’applicazione. Se necessario, ripeti la richiesta regolando i parametri per migliorare il risultato finale.

Specifiche tecniche di `tts-1`

Specifiche	Dettagli
Model ID	`tts-1`
Provider	OpenAI
Model type	Modello di text-to-speech (TTS) per convertire input di testo in audio parlato.
Primary optimization	Ottimizzato per velocità e bassa latenza, soprattutto per output vocale in tempo reale o quasi in tempo reale.
Quality profile	Latenza inferiore rispetto a `tts-1-hd`, ma con qualità audio inferiore rispetto alla variante HD.
Input modality	Solo testo.
Output modality	Solo audio.
API endpoint	Endpoint di generazione vocale dell'OpenAI Audio API: `/v1/audio/speech`.
Max input length	Fino a 4096 caratteri per richiesta.
Supported response formats	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Speed control	Supportato da `0.25` a `4.0`, con `1.0` come predefinito.
Voice options for `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Streaming support	La Speech API supporta l’output audio in streaming, ma lo streaming SSE e il controllo vocale basato su istruzioni non sono supportati per `tts-1`.
Pricing	OpenAI indica `tts-1` a $15 per 1M di token per la generazione vocale.

Che cos’è `tts-1`?

Caratteristiche principali di `tts-1`

Generazione vocale a bassa latenza: tts-1 è specificamente ottimizzato per la velocità, utile per app che necessitano di output parlato rapido.
Sintesi vocale dal suono naturale: Converte testo in audio parlato adatto a narrazioni, risposte di assistenti e interfacce vocali.
Più voci integrate: tts-1 supporta un set di voci integrate tra cui alloy, ash, coral, echo, fable, onyx, nova, sage e shimmer.
Formati audio di output flessibili: È possibile richiedere audio nei formati comuni come MP3, WAV, FLAC, AAC, Opus e PCM a seconda delle esigenze di riproduzione o elaborazione.
Controllo della velocità di riproduzione: L’API consente di impostare la velocità da 0,25x a 4,0x, per narrazioni più lente o riproduzioni più rapide.
Integrazione semplice via API: tts-1 è disponibile tramite la standard Speech Generation API, semplificando l’integrazione in flussi web, mobile o backend.
Ideale per applicazioni orientate al realtime: OpenAI presenta tts-1 come un modello per scenari TTS in tempo reale, pratico per assistenti, notifiche e sistemi interattivi rapidi.
Scelta del modello basata sui compromessi: Rispetto a tts-1-hd, privilegia la velocità rispetto alla qualità di output, offrendo una chiara opzione tra latenza e fedeltà.

Come accedere e integrare `tts-1`

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste all’API di `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

Specifiche tecniche di `tts-1`

Che cos’è `tts-1`?

Caratteristiche principali di `tts-1`

Come accedere e integrare `tts-1`

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste all’API di `tts-1`

Passaggio 3: Recupera e verifica i risultati

Prezzi per tts-1

Codice di esempio e API per tts-1

tts-1

Specifiche tecniche di `tts-1`

Che cos’è `tts-1`?

Caratteristiche principali di `tts-1`

Come accedere e integrare `tts-1`

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste all’API di `tts-1`

Passaggio 3: Recupera e verifica i risultati

Prezzi per tts-1

Codice di esempio e API per tts-1

tts-1

Specifiche tecniche di tts-1

Che cos’è tts-1?

Caratteristiche principali di tts-1

Come accedere e integrare tts-1

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste all’API di tts-1

Passaggio 3: Recupera e verifica i risultati

Prezzi per tts-1

Codice di esempio e API per tts-1

tts-1

Specifiche tecniche di tts-1

Che cos’è tts-1?

Caratteristiche principali di tts-1

Come accedere e integrare tts-1

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste all’API di tts-1

Passaggio 3: Recupera e verifica i risultati

Prezzi per tts-1

Codice di esempio e API per tts-1

Specifiche tecniche di `tts-1`

Che cos’è `tts-1`?

Caratteristiche principali di `tts-1`

Come accedere e integrare `tts-1`

Passaggio 2: Invia richieste all’API di `tts-1`

Specifiche tecniche di `tts-1`

Che cos’è `tts-1`?

Caratteristiche principali di `tts-1`

Come accedere e integrare `tts-1`

Passaggio 2: Invia richieste all’API di `tts-1`