Specyfikacje techniczne `tts-1`

Parametr	Szczegóły
ID modelu	`tts-1`
Dostawca	OpenAI
Typ modelu	Model tekst-do-mowy (TTS) do konwersji wejściowego tekstu na mówione audio.
Główna optymalizacja	Zoptymalizowany pod kątem szybkości i niskich opóźnień generowania, zwłaszcza dla mowy w czasie rzeczywistym lub zbliżonym do czasu rzeczywistego.
Profil jakości	Niższe opóźnienia niż `tts-1-hd`, ale niższa jakość dźwięku niż w wariancie HD.
Tryb wejścia	Tylko tekst.
Tryb wyjścia	Tylko audio.
Punkt końcowy API	OpenAI Audio API speech generation endpoint: `/v1/audio/speech`.
Maksymalna długość wejścia	Do 4096 znaków na żądanie.
Obsługiwane formaty odpowiedzi	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Kontrola prędkości	Obsługiwane od `0.25` do `4.0`, domyślnie `1.0`.
Opcje głosu dla `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Obsługa strumieniowania	Speech API obsługuje strumieniowe wyjście audio, ale strumieniowanie SSE i sterowanie głosem na podstawie instrukcji nie są obsługiwane dla `tts-1`.
Cennik	OpenAI wycenia `tts-1` na 15 USD za 1M tokenów generacji mowy.

Czym jest `tts-1`?

tts-1 to model tekst-do-mowy firmy OpenAI zaprojektowany do przekształcania pisanego tekstu w naturalnie brzmiące, mówione audio. Jest pozycjonowany jako szybsza, o niższych opóźnieniach opcja wśród klasycznych modeli TTS OpenAI, co czyni go odpowiednim dla aplikacji wymagających szybkiej syntezy mowy zamiast najwyższej możliwej wierności.

Deweloperzy zazwyczaj używają tts-1 poprzez punkt końcowy generowania mowy w Audio API, gdy chcą konwertować tekst aplikacji, prompty, powiadomienia, narracje lub odpowiedzi asystenta na odtwarzalne pliki audio. Dokumentacja OpenAI opisuje go jako zoptymalizowany pod kątem scenariuszy tekst-do-mowy w czasie rzeczywistym.

W praktyce tts-1 dobrze sprawdza się w lekkich doświadczeniach głosowych, systemach szybkiej odpowiedzi, interaktywnych prototypach oraz produktach, w których responsywność liczy się bardziej niż najwyższa jakość głosu. Jeśli priorytetem jest maksymalna jakość, OpenAI kieruje użytkowników do tts-1-hd, natomiast nowsze, ekspresyjne zastosowania mogą korzystać z nowszych modeli TTS.

Główne funkcje `tts-1`

Generowanie mowy z niskim opóźnieniem: tts-1 jest specjalnie zoptymalizowany pod kątem szybkości, co czyni go użytecznym w aplikacjach wymagających szybkiego wyjścia głosowego.
Naturalnie brzmiące TTS: Model przekształca zwykły tekst w mówione audio odpowiednie do narracji, odpowiedzi asystenta i interfejsów głosowych.
Wiele wbudowanych głosów: tts-1 obsługuje zestaw wbudowanych głosów, w tym alloy, ash, coral, echo, fable, onyx, nova, sage i shimmer.
Elastyczne formaty wyjścia audio: Deweloperzy mogą żądać generowanego dźwięku w popularnych formatach, takich jak MP3, WAV, FLAC, AAC, Opus i PCM, w zależności od potrzeb odtwarzania lub przetwarzania.
Regulowana prędkość odtwarzania: API pozwala kontrolować prędkość od 0.25x do 4.0x, co umożliwia wolniejszą narrację lub szybsze odtwarzanie, w razie potrzeby.
Prosta integracja przez API: tts-1 jest dostępny poprzez standardowe API generowania mowy, co ułatwia integrację z przepływami pracy w sieci, na urządzeniach mobilnych lub w backendzie.
Dobry do aplikacji ukierunkowanych na czas rzeczywisty: OpenAI jawnie określa tts-1 jako model do scenariuszy TTS w czasie rzeczywistym, co czyni go praktycznym dla asystentów, powiadomień i szybkich systemów interaktywnych.
Wybór modelu z myślą o kompromisie: W porównaniu z tts-1-hd ten model priorytetowo traktuje szybsze generowanie kosztem wyższej wierności, oferując deweloperom jasny wybór między opóźnieniem a jakością.

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 1: Zarejestruj się, aby uzyskać klucz API

Aby uzyskać dostęp do API tts-1, najpierw zarejestruj się w CometAPI i wygeneruj klucz API z pulpitu nawigacyjnego. Po zalogowaniu utwórz nowy klucz, bezpiecznie go skopiuj i przechowuj w zmiennych środowiskowych swojej aplikacji. Użyjesz tego klucza do uwierzytelniania wszystkich żądań do API tts-1.

Krok 2: Wysyłanie żądań do API `tts-1`

Gdy masz już klucz API, wyślij żądanie POST do punktu końcowego CometAPI dla tts-1 z ładunkiem wejściowym. Dołącz klucz API w nagłówku Authorization i wskaż tts-1 jako model. Typowe żądanie obejmuje tekst wejściowy oraz parametry TTS, takie jak głos i format odpowiedzi.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Krok 3: Pobierz i zweryfikuj wyniki

Po wysłaniu żądania API tts-1 zwróci wygenerowaną treść audio, jeśli wywołanie zakończy się powodzeniem. Zapisz zwrócony plik lub strumień, sprawdź, czy dźwięk odtwarza się poprawnie, i potwierdź, że wybrany głos, prędkość i format odpowiadają wymaganiom Twojej aplikacji. W razie potrzeby ponów próbę z dostosowanymi parametrami, aby poprawić wynik końcowy.

Specyfikacje techniczne `tts-1`

Parametr	Szczegóły
ID modelu	`tts-1`
Dostawca	OpenAI
Typ modelu	Model tekst-do-mowy (TTS) do konwersji wejściowego tekstu na mówione audio.
Główna optymalizacja	Zoptymalizowany pod kątem szybkości i niskich opóźnień generowania, zwłaszcza dla mowy w czasie rzeczywistym lub zbliżonym do czasu rzeczywistego.
Profil jakości	Niższe opóźnienia niż `tts-1-hd`, ale niższa jakość dźwięku niż w wariancie HD.
Tryb wejścia	Tylko tekst.
Tryb wyjścia	Tylko audio.
Punkt końcowy API	OpenAI Audio API speech generation endpoint: `/v1/audio/speech`.
Maksymalna długość wejścia	Do 4096 znaków na żądanie.
Obsługiwane formaty odpowiedzi	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
Kontrola prędkości	Obsługiwane od `0.25` do `4.0`, domyślnie `1.0`.
Opcje głosu dla `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
Obsługa strumieniowania	Speech API obsługuje strumieniowe wyjście audio, ale strumieniowanie SSE i sterowanie głosem na podstawie instrukcji nie są obsługiwane dla `tts-1`.
Cennik	OpenAI wycenia `tts-1` na 15 USD za 1M tokenów generacji mowy.

Czym jest `tts-1`?

Główne funkcje `tts-1`

Generowanie mowy z niskim opóźnieniem: tts-1 jest specjalnie zoptymalizowany pod kątem szybkości, co czyni go użytecznym w aplikacjach wymagających szybkiego wyjścia głosowego.
Naturalnie brzmiące TTS: Model przekształca zwykły tekst w mówione audio odpowiednie do narracji, odpowiedzi asystenta i interfejsów głosowych.
Wiele wbudowanych głosów: tts-1 obsługuje zestaw wbudowanych głosów, w tym alloy, ash, coral, echo, fable, onyx, nova, sage i shimmer.
Elastyczne formaty wyjścia audio: Deweloperzy mogą żądać generowanego dźwięku w popularnych formatach, takich jak MP3, WAV, FLAC, AAC, Opus i PCM, w zależności od potrzeb odtwarzania lub przetwarzania.
Regulowana prędkość odtwarzania: API pozwala kontrolować prędkość od 0.25x do 4.0x, co umożliwia wolniejszą narrację lub szybsze odtwarzanie, w razie potrzeby.
Prosta integracja przez API: tts-1 jest dostępny poprzez standardowe API generowania mowy, co ułatwia integrację z przepływami pracy w sieci, na urządzeniach mobilnych lub w backendzie.
Dobry do aplikacji ukierunkowanych na czas rzeczywisty: OpenAI jawnie określa tts-1 jako model do scenariuszy TTS w czasie rzeczywistym, co czyni go praktycznym dla asystentów, powiadomień i szybkich systemów interaktywnych.
Wybór modelu z myślą o kompromisie: W porównaniu z tts-1-hd ten model priorytetowo traktuje szybsze generowanie kosztem wyższej wierności, oferując deweloperom jasny wybór między opóźnieniem a jakością.

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 1: Zarejestruj się, aby uzyskać klucz API

Krok 2: Wysyłanie żądań do API `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

Specyfikacje techniczne `tts-1`

Czym jest `tts-1`?

Główne funkcje `tts-1`

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 1: Zarejestruj się, aby uzyskać klucz API

Krok 2: Wysyłanie żądań do API `tts-1`

Krok 3: Pobierz i zweryfikuj wyniki

Cennik dla tts-1

Przykładowy kod i API dla tts-1

tts-1

Specyfikacje techniczne `tts-1`

Czym jest `tts-1`?

Główne funkcje `tts-1`

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 1: Zarejestruj się, aby uzyskać klucz API

Krok 2: Wysyłanie żądań do API `tts-1`

Krok 3: Pobierz i zweryfikuj wyniki

Cennik dla tts-1

Przykładowy kod i API dla tts-1

tts-1

Specyfikacje techniczne tts-1

Czym jest tts-1?

Główne funkcje tts-1

Jak uzyskać dostęp i zintegrować tts-1

Krok 1: Zarejestruj się, aby uzyskać klucz API

Krok 2: Wysyłanie żądań do API tts-1

Krok 3: Pobierz i zweryfikuj wyniki

Cennik dla tts-1

Przykładowy kod i API dla tts-1

tts-1

Specyfikacje techniczne tts-1

Czym jest tts-1?

Główne funkcje tts-1

Jak uzyskać dostęp i zintegrować tts-1

Krok 1: Zarejestruj się, aby uzyskać klucz API

Krok 2: Wysyłanie żądań do API tts-1

Krok 3: Pobierz i zweryfikuj wyniki

Cennik dla tts-1

Przykładowy kod i API dla tts-1

Specyfikacje techniczne `tts-1`

Czym jest `tts-1`?

Główne funkcje `tts-1`

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 2: Wysyłanie żądań do API `tts-1`

Specyfikacje techniczne `tts-1`

Czym jest `tts-1`?

Główne funkcje `tts-1`

Jak uzyskać dostęp i zintegrować `tts-1`

Krok 2: Wysyłanie żądań do API `tts-1`