ModelleSupportUnternehmenBlog
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Ressourcen
KI-ModelleBlogUnternehmenÄnderungsprotokollÜber uns
2025 CometAPI. Alle Rechte vorbehalten.DatenschutzrichtlinieNutzungsbedingungen
Home/Models/OpenAI/TTS
O

TTS

Eingabe:$12/M
Ausgabe:$12/M
OpenAI Text-zu-Sprache
Neu
Kommerzielle Nutzung
Überblick
Funktionen
Preisgestaltung
API
Versionen

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

Funktionen für TTS

Entdecken Sie die wichtigsten Funktionen von TTS, die darauf ausgelegt sind, Leistung und Benutzerfreundlichkeit zu verbessern. Erfahren Sie, wie diese Fähigkeiten Ihren Projekten zugutekommen und die Benutzererfahrung verbessern können.

Preise für TTS

Entdecken Sie wettbewerbsfähige Preise für TTS, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie TTS Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.
Comet-Preis (USD / M Tokens)Offizieller Preis (USD / M Tokens)Rabatt
Eingabe:$12/M
Ausgabe:$12/M
Eingabe:$15/M
Ausgabe:$15/M
-20%

Beispielcode und API für TTS

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für TTS zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von TTS in Ihren Projekten zu nutzen.

Versionen von TTS

Der Grund, warum TTS mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.
version
qwen-tts-realtime
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vc-realtime-2026-01-15
gpt-4o-mini-tts
tts-1-hd
qwen3-tts-flash-2025-11-27
qwen3-tts-vd-realtime-2025-12-16
kling_tts
tts-1
tts-1-1106
tts-1-hd-1106

Weitere Modelle

O

gpt-realtime-1.5

Eingabe:$3.2/M
Ausgabe:$12.8/M
Das beste Sprachmodell für Audioeingabe und -ausgabe.
O

gpt-audio-1.5

Eingabe:$2/M
Ausgabe:$8/M
Das beste Sprachmodell für Audioeingabe und -ausgabe mit Chat Completions.
O

Whisper-1

Eingabe:$24/M
Ausgabe:$24/M
Sprach-zu-Text, Erstellung von Übersetzungen
K

Kling TTS

Pro Anfrage:$0.006608
[Sprachsynthese] Neu eingeführt: Text-zu-Broadcast-Audio online, mit Vorschaufunktion ● Kann gleichzeitig eine audio_id erzeugen, verwendbar mit jeder Keling API.
K

Kling video-to-audio

K

Kling video-to-audio

Pro Anfrage:$0.03304
Kling Video-zu-Audio
K

Kling text-to-audio

K

Kling text-to-audio

Pro Anfrage:$0.03304
Kling Text-zu-Audio

Verwandte Blogs

Kann ChatGPT Text in Sprache umwandeln? Der neueste Leitfaden 2026 zu Voice- und TTS-Modellen
Apr 2, 2026

Kann ChatGPT Text in Sprache umwandeln? Der neueste Leitfaden 2026 zu Voice- und TTS-Modellen

ChatGPT unterstützt Text-to-Speech, aber die Antwort hängt davon ab, was Sie meinen. In der ChatGPT-App lässt Voice ChatGPT laut sprechen und wurde kürzlich aktualisiert, um Anweisungen besser zu befolgen und Tools wie die Websuche effektiver zu nutzen. Für Entwickler bietet OpenAI außerdem eine dedizierte Text-to-Speech-API über den audio/speech-Endpunkt, mit Modellen wie gpt-4o-mini-tts, tts-1 und tts-1-hd. OpenAI sagt, dass sein neuester TTS-Snapshot auf Common Voice und FLEURS eine gegenüber der vorherigen Generation um etwa 35% niedrigere Wortfehlerrate geliefert hat.