ModellerDestekKurumsalBlog
500+ Yapay Zeka Modeli API'si, Hepsi Tek Bir API'de. Sadece CometAPI'de
Modeller API
Geliştirici
Hızlı BaşlangıçDokümantasyonAPI Kontrol Paneli
Kaynaklar
Yapay Zeka ModelleriBlogKurumsalDeğişiklik GünlüğüHakkında
2025 CometAPI. Tüm hakları saklıdır.Gizlilik PolitikasıHizmet Şartları
Home/Models/OpenAI/tts-1
O

tts-1

Giriş:$12/M
Çıktı:$12/M
Ticari kullanım
Genel Bakış
Özellikler
Fiyatlandırma
API

Technical Specifications of tts-1

SpecificationDetails
Model IDtts-1
ProviderOpenAI
Model typeText-to-speech (TTS) model for converting text input into spoken audio.
Primary optimizationOptimized for speed and low-latency generation, especially for realtime or near-realtime speech output.
Quality profileLower latency than tts-1-hd, but with lower audio quality than the HD variant.
Input modalityText only.
Output modalityAudio only.
API endpointOpenAI Audio API speech generation endpoint: /v1/audio/speech.
Max input lengthUp to 4096 characters per request.
Supported response formatsmp3, opus, aac, flac, wav, pcm.
Speed controlSupported from 0.25 to 4.0, with 1.0 as default.
Voice options for tts-1alloy, ash, coral, echo, fable, onyx, nova, sage, shimmer.
Streaming supportThe Speech API supports streaming audio output, but SSE streaming and instruction-based voice control are not supported for tts-1.
PricingOpenAI lists tts-1 at $15 per 1M tokens for speech generation.

What is tts-1?

tts-1 is OpenAI’s text-to-speech model designed to turn written text into natural-sounding spoken audio. It is positioned as the faster, lower-latency option among OpenAI’s classic TTS models, making it suitable for applications that need quick speech synthesis rather than the highest possible fidelity.

Developers typically use tts-1 through the Audio API’s speech generation endpoint when they want to convert application text, prompts, notifications, narrations, or assistant responses into playable audio files. OpenAI’s documentation describes it as optimized for realtime text-to-speech use cases.

In practice, tts-1 is a good fit for lightweight voice experiences, rapid response systems, interactive prototypes, and products where responsiveness matters more than premium voice quality. If maximum quality is the priority, OpenAI points users toward tts-1-hd, while newer expressive use cases may use newer TTS models instead.

Main features of tts-1

  • Low-latency speech generation: tts-1 is specifically optimized for speed, which makes it useful for apps that need spoken output quickly.
  • Natural-sounding text-to-speech: The model converts plain text into spoken audio suitable for narration, assistant responses, and voice interfaces.
  • Multiple built-in voices: tts-1 supports a set of built-in voices including alloy, ash, coral, echo, fable, onyx, nova, sage, and shimmer.
  • Flexible audio output formats: Developers can request generated audio in common formats such as MP3, WAV, FLAC, AAC, Opus, and PCM depending on playback or processing needs.
  • Adjustable playback speed: The API allows speed control from 0.25x to 4.0x, enabling slower narration or faster playback where appropriate.
  • Simple API-based integration: tts-1 is available through the standard speech generation API, which makes it straightforward to integrate into web, mobile, or backend workflows.
  • Good for realtime-oriented applications: OpenAI explicitly frames tts-1 as a model for realtime text-to-speech scenarios, which makes it practical for assistants, notifications, and fast interactive systems.
  • Tradeoff-focused model choice: Compared with tts-1-hd, this model prioritizes faster generation over higher-fidelity output, giving developers a clear latency-versus-quality option.

How to access and integrate tts-1

Step 1: Sign Up for API Key

To access the tts-1 API, first sign up on CometAPI and generate your API key from the dashboard. After logging in, create a new key, copy it securely, and store it in your application environment variables. You will use this key to authenticate all requests to the tts-1 API.

Step 2: Send Requests to tts-1 API

Once you have your API key, send a POST request to the CometAPI endpoint for tts-1 with your input payload. Include your API key in the Authorization header and specify tts-1 as the model. A typical request includes the input text plus TTS parameters such as voice and response format.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Step 3: Retrieve and Verify Results

After submitting your request, the tts-1 API returns generated audio content if the call succeeds. Save the returned file or stream, verify that the audio plays correctly, and confirm that the selected voice, speed, and format match your application requirements. If needed, retry with adjusted parameters to improve the final output.

tts-1 için Özellikler

tts-1'in performansı ve kullanılabilirliği artırmak için tasarlanmış temel özelliklerini keşfedin. Bu yeteneklerin projelerinize nasıl fayda sağlayabileceğini ve kullanıcı deneyimini nasıl geliştirebileceğini öğrenin.

tts-1 için Fiyatlandırma

tts-1 için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. tts-1'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.
Comet Fiyatı (USD / M Tokens)Resmi Fiyat (USD / M Tokens)İndirim
Giriş:$12/M
Çıktı:$12/M
Giriş:$15/M
Çıktı:$15/M
-20%

tts-1 için örnek kod ve API

tts-1 için kapsamlı örnek kodlara ve API kaynaklarına erişerek entegrasyon sürecinizi kolaylaştırın. Ayrıntılı dokümantasyonumuz adım adım rehberlik sağlayarak projelerinizde tts-1'in tüm potansiyelinden yararlanmanıza yardımcı olur.

Daha Fazla Model

G

Nano Banana 2

Giriş:$0.4/M
Çıktı:$2.4/M
Temel Yeteneklere Genel Bakış: Çözünürlük: 4K'ya kadar (4096×4096), Pro ile aynı seviyede. Referans Görsel Tutarlılığı: En fazla 14 referans görseli (10 nesne + 4 karakter), stil/karakter tutarlılığını koruyarak. Aşırı En-Boy Oranları: Yeni 1:4, 4:1, 1:8, 8:1 oranları eklendi, uzun görseller, posterler ve banner'lar için uygundur. Metin İşleme: Gelişmiş metin üretimi, infografikler ve pazarlama poster yerleşimleri için uygundur. Arama Geliştirmesi: Entegre Google Search + Görsel Arama. Temellendirme: Yerleşik düşünme süreci; karmaşık istemler üretimden önce akıl yürütülür.
A

Claude Opus 4.6

Giriş:$4/M
Çıktı:$20/M
Claude Opus 4.6, Anthropic’in “Opus” sınıfı büyük dil modelidir; Şubat 2026’da yayımlandı. Bilgi odaklı çalışma ve araştırma iş akışları için bir temel araç olarak konumlandırılmıştır — uzun bağlamlarda akıl yürütmeyi, çok adımlı planlamayı, araç kullanımını (ajan tabanlı yazılım iş akışları dahil) ve otomatik slayt ve e-tablo oluşturma gibi bilgisayar kullanımına yönelik görevleri geliştirir.
A

Claude Sonnet 4.6

Giriş:$2.4/M
Çıktı:$12/M
Claude Sonnet 4.6, şimdiye kadarki en yetenekli Sonnet modelimiz. Modelin kodlama, bilgisayar kullanımı, uzun bağlamlı akıl yürütme, ajan planlama, bilgi çalışması ve tasarım alanlarındaki becerilerine tam kapsamlı bir yükseltme sunar. Sonnet 4.6 ayrıca beta aşamasında 1M token bağlam penceresi sunar.
O

GPT-5.4 nano

Giriş:$0.16/M
Çıktı:$1/M
GPT-5.4 nano, hız ve maliyetin en çok önem taşıdığı sınıflandırma, veri çıkarımı, sıralama ve alt ajanlar gibi görevler için tasarlanmıştır.
O

GPT-5.4 mini

Giriş:$0.6/M
Çıktı:$3.6/M
GPT-5.4 mini, GPT-5.4'ün güçlü yönlerini yüksek hacimli iş yükleri için tasarlanmış daha hızlı ve daha verimli bir modele taşır.
A

Claude Mythos Preview

A

Claude Mythos Preview

Yakında
Giriş:$60/M
Çıktı:$240/M
Claude Mythos Preview, bugüne kadarki en güçlü öncü modelimizdir ve önceki öncü modelimiz Claude Opus 4.6 ile karşılaştırıldığında birçok değerlendirme ölçütündeki puanlarda çarpıcı bir sıçrama göstermektedir.

İlgili Blog

ChatGPT metni sese dönüştürebilir mi? Ses ve TTS modelleri için en güncel 2026 rehberi
Apr 2, 2026

ChatGPT metni sese dönüştürebilir mi? Ses ve TTS modelleri için en güncel 2026 rehberi

ChatGPT metinden konuşmaya yapabilir, ancak yanıt neyi kastettiğinize bağlıdır. ChatGPT uygulamasında Voice, ChatGPT’nin sesli olarak konuşmasını sağlar ve yakın zamanda talimatları daha iyi izlemesi ve web araması gibi araçları daha etkili kullanması için güncellendi. Geliştiriciler için OpenAI, audio/speech uç noktası üzerinden özel bir metinden konuşmaya API’si de sunar; modeller arasında gpt-4o-mini-tts, tts-1 ve tts-1-hd bulunur. OpenAI, en son TTS snapshot’ının önceki nesille karşılaştırıldığında Common Voice ve FLEURS üzerinde yaklaşık %35 daha düşük kelime hata oranı sağladığını söylüyor.