ModelliSupportoAziendaBlog
500+ API di Modelli AI, Tutto In Una Sola API. Solo In CometAPI
API dei Modelli
Sviluppatore
Avvio RapidoDocumentazioneDashboard API
Risorse
Modelli di Intelligenza ArtificialeBlogAziendaRegistro delle modificheChi siamo
2025 CometAPI. Tutti i diritti riservati.Informativa sulla PrivacyTermini di Servizio
Home/Models/OpenAI/TTS
O

TTS

Ingresso:$12/M
Uscita:$12/M
Sintesi vocale di OpenAI
Nuovo
Uso commerciale
Panoramica
Caratteristiche
Prezzi
API
Versioni

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

Funzionalità per TTS

Esplora le caratteristiche principali di TTS, progettato per migliorare le prestazioni e l'usabilità. Scopri come queste funzionalità possono beneficiare i tuoi progetti e migliorare l'esperienza utente.

Prezzi per TTS

Esplora i prezzi competitivi per TTS, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come TTS può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)Prezzo Ufficiale (USD / M Tokens)Sconto
Ingresso:$12/M
Uscita:$12/M
Ingresso:$15/M
Uscita:$15/M
-20%

Codice di esempio e API per TTS

Accedi a codice di esempio completo e risorse API per TTS per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di TTS nei tuoi progetti.

Versioni di TTS

Il motivo per cui TTS dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.
version
qwen-tts-realtime
qwen3-tts-flash-2025-11-27
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vc-realtime-2026-01-15
qwen3-tts-vd-realtime-2025-12-16
gpt-4o-mini-tts
kling_tts
tts-1
tts-1-1106
tts-1-hd
tts-1-hd-1106

Altri modelli

O

gpt-realtime-1.5

Ingresso:$3.2/M
Uscita:$12.8/M
Il miglior modello vocale per input e output audio.
O

gpt-audio-1.5

Ingresso:$2/M
Uscita:$8/M
Il miglior modello vocale per audio in entrata e in uscita con Chat Completions.
O

Whisper-1

Ingresso:$24/M
Uscita:$24/M
Da parlato a testo, creazione di traduzioni
K

Kling TTS

Per Richiesta:$0.006608
[Sintesi vocale] Appena lanciato: conversione da testo in audio di qualità broadcast online, con funzione di anteprima ● Può generare contemporaneamente un audio_id, utilizzabile con qualsiasi Keling API.
K

Kling video-to-audio

K

Kling video-to-audio

Per Richiesta:$0.03304
Kling da video ad audio
K

Kling text-to-audio

K

Kling text-to-audio

Per Richiesta:$0.03304
Kling da testo ad audio

Blog correlati

ChatGPT può convertire il testo in voce? La guida aggiornata al 2026 su voce e modelli TTS
Apr 2, 2026

ChatGPT può convertire il testo in voce? La guida aggiornata al 2026 su voce e modelli TTS

ChatGPT può effettuare la sintesi vocale, ma la risposta dipende da cosa intendi. Nell’app ChatGPT, Voice consente a ChatGPT di parlare ad alta voce ed è stato aggiornato di recente per seguire meglio le istruzioni e usare strumenti come la ricerca sul Web in modo più efficace. Per gli sviluppatori, OpenAI offre anche un’API dedicata alla sintesi vocale tramite l’endpoint audio/speech, con modelli tra cui gpt-4o-mini-tts, tts-1 e tts-1-hd. OpenAI afferma che il suo ultimo snapshot TTS ha ottenuto un tasso di errore di parola inferiore di circa il 35% su Common Voice e FLEURS rispetto alla generazione precedente.