МодельдерҚолдауКәсіпорынБлог
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Ресурстар
AI МодельдеріБлогКәсіпорынӨзгерістер журналыБіз туралы
2025 CometAPI. Барлық құқықтар қорғалған.Құпиялылық саясатыҚызмет көрсету шарттары
Home/Models/OpenAI/tts-1
O

tts-1

Енгізу:$12/M
Шығыс:$12/M
Коммерциялық пайдалану
Шолу
Мүмкіндіктер
Баға белгілеу
API

Technical Specifications of tts-1

SpecificationDetails
Model IDtts-1
ProviderOpenAI
Model typeText-to-speech (TTS) model for converting text input into spoken audio.
Primary optimizationOptimized for speed and low-latency generation, especially for realtime or near-realtime speech output.
Quality profileLower latency than tts-1-hd, but with lower audio quality than the HD variant.
Input modalityText only.
Output modalityAudio only.
API endpointOpenAI Audio API speech generation endpoint: /v1/audio/speech.
Max input lengthUp to 4096 characters per request.
Supported response formatsmp3, opus, aac, flac, wav, pcm.
Speed controlSupported from 0.25 to 4.0, with 1.0 as default.
Voice options for tts-1alloy, ash, coral, echo, fable, onyx, nova, sage, shimmer.
Streaming supportThe Speech API supports streaming audio output, but SSE streaming and instruction-based voice control are not supported for tts-1.
PricingOpenAI lists tts-1 at $15 per 1M tokens for speech generation.

What is tts-1?

tts-1 is OpenAI’s text-to-speech model designed to turn written text into natural-sounding spoken audio. It is positioned as the faster, lower-latency option among OpenAI’s classic TTS models, making it suitable for applications that need quick speech synthesis rather than the highest possible fidelity.

Developers typically use tts-1 through the Audio API’s speech generation endpoint when they want to convert application text, prompts, notifications, narrations, or assistant responses into playable audio files. OpenAI’s documentation describes it as optimized for realtime text-to-speech use cases.

In practice, tts-1 is a good fit for lightweight voice experiences, rapid response systems, interactive prototypes, and products where responsiveness matters more than premium voice quality. If maximum quality is the priority, OpenAI points users toward tts-1-hd, while newer expressive use cases may use newer TTS models instead.

Main features of tts-1

  • Low-latency speech generation: tts-1 is specifically optimized for speed, which makes it useful for apps that need spoken output quickly.
  • Natural-sounding text-to-speech: The model converts plain text into spoken audio suitable for narration, assistant responses, and voice interfaces.
  • Multiple built-in voices: tts-1 supports a set of built-in voices including alloy, ash, coral, echo, fable, onyx, nova, sage, and shimmer.
  • Flexible audio output formats: Developers can request generated audio in common formats such as MP3, WAV, FLAC, AAC, Opus, and PCM depending on playback or processing needs.
  • Adjustable playback speed: The API allows speed control from 0.25x to 4.0x, enabling slower narration or faster playback where appropriate.
  • Simple API-based integration: tts-1 is available through the standard speech generation API, which makes it straightforward to integrate into web, mobile, or backend workflows.
  • Good for realtime-oriented applications: OpenAI explicitly frames tts-1 as a model for realtime text-to-speech scenarios, which makes it practical for assistants, notifications, and fast interactive systems.
  • Tradeoff-focused model choice: Compared with tts-1-hd, this model prioritizes faster generation over higher-fidelity output, giving developers a clear latency-versus-quality option.

How to access and integrate tts-1

Step 1: Sign Up for API Key

To access the tts-1 API, first sign up on CometAPI and generate your API key from the dashboard. After logging in, create a new key, copy it securely, and store it in your application environment variables. You will use this key to authenticate all requests to the tts-1 API.

Step 2: Send Requests to tts-1 API

Once you have your API key, send a POST request to the CometAPI endpoint for tts-1 with your input payload. Include your API key in the Authorization header and specify tts-1 as the model. A typical request includes the input text plus TTS parameters such as voice and response format.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Step 3: Retrieve and Verify Results

After submitting your request, the tts-1 API returns generated audio content if the call succeeds. Save the returned file or stream, verify that the audio plays correctly, and confirm that the selected voice, speed, and format match your application requirements. If needed, retry with adjusted parameters to improve the final output.

tts-1 үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

tts-1 үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)Жеңілдік
Енгізу:$12/M
Шығыс:$12/M
Енгізу:$15/M
Шығыс:$15/M
-20%

tts-1 үшін үлгі код және API

[Модель атауы] үшін кешенді үлгі кодтары мен API ресурстарына қол жеткізіп, интеграция процесіңізді жеңілдетіңіз. Біздің толық құжаттама қадам-қадаммен нұсқаулық береді, жобаларыңызда [Модель атауы] мүмкіндіктерін толық пайдалануға көмектеседі.

Көбірек модельдер

G

Nano Banana 2

Енгізу:$0.4/M
Шығыс:$2.4/M
Негізгі мүмкіндіктерге шолу: Ажыратылымдылығы: 4K-ға дейін (4096×4096), Pro-мен деңгейлес. Үлгі суреттердің бірізділігі: 14-ке дейін үлгі сурет (10 объект + 4 кейіпкер), стиль/кейіпкер бірізділігін сақтайды. Экстремалды жақтар арақатынастары: Жаңа 1:4, 4:1, 1:8, 8:1 қатынастары қосылды, ұзын суреттерге, постерлер мен баннерлерге жарамды. Мәтінді кескіндеу: Жетілдірілген мәтін генерациясы, инфографика мен маркетингтік постер макеттеріне жарайды. Іздеуді жетілдіру: Google Search + Image Search біріктірілген. Негіздеу: Кірістірілген ойлау үдерісі; күрделі сұраныстар генерацияға дейін пайымдалады.
A

Claude Opus 4.6

Енгізу:$4/M
Шығыс:$20/M
Claude Opus 4.6 — Anthropic компаниясының «Opus» санатындағы үлкен тілдік моделі, 2026 жылғы ақпанда шығарылған. Ол зияткерлік еңбек пен зерттеу процестеріне арналған сенімді жұмыс құралы ретінде позицияланған — ұзақ контексттегі пайымдау, көпқадамды жоспарлау, құралдарды қолдану (агенттік бағдарламалық қамтамасыз ету жұмыс процестерін қоса), сондай-ақ слайдтар мен электрондық кестелерді автоматты түрде жасау сияқты компьютерді пайдалану тапсырмалары бойынша мүмкіндіктерін жақсартады.
A

Claude Sonnet 4.6

Енгізу:$2.4/M
Шығыс:$12/M
Claude Sonnet 4.6 — әзірге біздің ең қабілетті Sonnet моделіміз. Ол кодтау, компьютерді пайдалану, ұзақ контекст бойынша пайымдау, агенттік жоспарлау, білімге негізделген жұмыс және дизайн бойынша модельдің дағдыларын толық жаңартуды қамтиды. Sonnet 4.6 сондай-ақ бета нұсқасында 1M токендік контекст терезесін ұсынады.
O

GPT-5.4 nano

Енгізу:$0.16/M
Шығыс:$1/M
GPT-5.4 nano жылдамдық пен құн ең маңызды болатын жіктеу, деректерді шығарып алу, ранжирлеу және субагенттер сияқты тапсырмаларға арналған.
O

GPT-5.4 mini

Енгізу:$0.6/M
Шығыс:$3.6/M
GPT-5.4 mini жоғары көлемді жүктемелерге арналған, GPT-5.4-тің артықшылықтарын жылдамырақ әрі тиімдірек модельге біріктіреді.
A

Claude Mythos Preview

A

Claude Mythos Preview

Жақында
Енгізу:$60/M
Шығыс:$240/M
Claude Mythos Preview — бүгінге дейінгі ең қабілетті озық моделіміз және алдыңғы озық моделіміз Claude Opus 4.6-пен салыстырғанда көптеген бағалау бенчмарктеріндегі көрсеткіштер бойынша айқын серпіліс көрсетеді.

Байланысты блогтар

ChatGPT мәтінді дауысқа айналдыра ала ма? Дауыс және TTS үлгілеріне арналған 2026 жылғы соңғы нұсқаулық
Apr 2, 2026

ChatGPT мәтінді дауысқа айналдыра ала ма? Дауыс және TTS үлгілеріне арналған 2026 жылғы соңғы нұсқаулық

ChatGPT мәтінді дауысқа айналдыра алады, бірақ жауап сіз нені меңзегеніңізге байланысты. ChatGPT қолданбасында Voice ChatGPT-ке дауыстап сөйлеуге мүмкіндік береді және жуырда нұсқауларды жақсырақ орындап, веб-іздеу сияқты құралдарды неғұрлым тиімді пайдаланатындай етіп жаңартылды. Әзірлеушілер үшін OpenAI сондай-ақ audio/speech endpoint арқылы арнайы мәтінді дауысқа айналдыру API-ы ұсынады; қолжетімді модельдер қатарында gpt-4o-mini-tts, tts-1 және tts-1-hd бар. OpenAI-дың айтуынша, оның соңғы TTS snapshot-ы алдыңғы буынмен салыстырғанда Common Voice және FLEURS деректер жиындарында сөздік қателік көрсеткішін шамамен 35%-ға төмендетті.