ModeleWsparciePrzedsiębiorstwoBlog
Ponad 500 API modeli AI, wszystko w jednym API. Tylko w CometAPI
API modeli
Deweloper
Szybki startDokumentacjaPanel API
Zasoby
Modele Sztucznej InteligencjiBlogPrzedsiębiorstwoDziennik zmianO nas
2025 CometAPI. Wszelkie prawa zastrzeżone.Polityka PrywatnościWarunki korzystania z usługi
Home/Models/OpenAI/TTS
O

TTS

Wejście:$12/M
Wyjście:$12/M
Synteza mowy OpenAI
Nowy
Użycie komercyjne
Przegląd
Funkcje
Cennik
API
Wersje

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

Funkcje dla TTS

Poznaj kluczowe funkcje TTS, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla TTS

Poznaj konkurencyjne ceny dla TTS, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak TTS może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)Zniżka
Wejście:$12/M
Wyjście:$12/M
Wejście:$15/M
Wyjście:$15/M
-20%

Przykładowy kod i API dla TTS

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla TTS, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał TTS w Twoich projektach.

Wersje modelu TTS

Powody, dla których TTS posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.
version
qwen-tts-realtime
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vc-realtime-2026-01-15
gpt-4o-mini-tts
tts-1-hd
qwen3-tts-flash-2025-11-27
qwen3-tts-vd-realtime-2025-12-16
kling_tts
tts-1
tts-1-1106
tts-1-hd-1106

Więcej modeli

O

gpt-realtime-1.5

Wejście:$3.2/M
Wyjście:$12.8/M
Najlepszy model głosowy do wejścia i wyjścia audio.
O

gpt-audio-1.5

Wejście:$2/M
Wyjście:$8/M
Najlepszy model głosowy do wejścia i wyjścia audio w ramach Chat Completions.
O

Whisper-1

Wejście:$24/M
Wyjście:$24/M
Zamiana mowy na tekst, tworzenie tłumaczeń
K

Kling TTS

Na żądanie:$0.006608
[Synteza mowy] Nowo uruchomione: konwersja tekstu na audio o jakości emisyjnej online, z funkcją podglądu ● Może równocześnie generować audio_id, do użycia z dowolnym API Keling.
K

Kling video-to-audio

K

Kling video-to-audio

Na żądanie:$0.03304
Kling wideo-na-audio
K

Kling text-to-audio

K

Kling text-to-audio

Na żądanie:$0.03304
Kling konwersja tekstu na audio

Powiązane blogi

Czy ChatGPT potrafi zamieniać tekst na mowę? Najnowszy przewodnik na 2026 rok dotyczący głosu i modeli TTS
Apr 2, 2026

Czy ChatGPT potrafi zamieniać tekst na mowę? Najnowszy przewodnik na 2026 rok dotyczący głosu i modeli TTS

ChatGPT potrafi zamieniać tekst na mowę, ale odpowiedź zależy od tego, co masz na myśli. W aplikacji ChatGPT funkcja Voice pozwala ChatGPT mówić na głos i została niedawno zaktualizowana, aby lepiej wykonywać polecenia oraz skuteczniej korzystać z narzędzi, takich jak wyszukiwanie w sieci. Dla deweloperów OpenAI udostępnia także dedykowane API do zamiany tekstu na mowę poprzez endpoint audio/speech, z modelami takimi jak gpt-4o-mini-tts, tts-1 i tts-1-hd. OpenAI podaje, że najnowszy snapshot TTS zapewnił około 35% niższy wskaźnik błędów słów w Common Voice i FLEURS w porównaniu z poprzednią generacją.