模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/OpenAI/TTS
O

TTS

輸入:$12/M
輸出:$12/M
OpenAI 文字轉語音
新
商業用途
概覽
功能
定價
API
版本

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

TTS 的功能

探索 TTS 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

TTS 的定價

探索 TTS 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 TTS 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$12/M
輸出:$12/M
輸入:$15/M
輸出:$15/M
-20%

TTS 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 TTS 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 TTS 的潛力。

TTS的版本

TTS擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
version
kling_tts
tts-1
tts-1-1106
tts-1-hd
tts-1-hd-1106
qwen-tts-realtime
gpt-4o-mini-tts
qwen3-tts-flash-2025-11-27
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vc-realtime-2026-01-15
qwen3-tts-vd-realtime-2025-12-16

更多模型

O

gpt-realtime-1.5

輸入:$3.2/M
輸出:$12.8/M
用於音訊輸入、音訊輸出的最佳語音模型。
O

gpt-audio-1.5

輸入:$2/M
輸出:$8/M
搭配 Chat Completions 進行音訊輸入、音訊輸出的最佳語音模型。
O

Whisper-1

輸入:$24/M
輸出:$24/M
語音轉文字,生成翻譯
K

Kling TTS

每次請求:$0.006608
[語音合成] 全新上線:線上文字轉廣播級音訊,支援預覽功能 ● 可同時生成 audio_id,適用於任何 Keling API。
K

Kling video-to-audio

K

Kling video-to-audio

每次請求:$0.03304
Kling 影片轉音訊
K

Kling text-to-audio

K

Kling text-to-audio

每次請求:$0.03304
Kling 文字轉音訊

相關部落格

ChatGPT 能進行文字轉語音嗎?2026 年最新語音與 TTS 模型指南
Apr 2, 2026

ChatGPT 能進行文字轉語音嗎?2026 年最新語音與 TTS 模型指南

ChatGPT 可以進行文字轉語音,但答案取決於你所指的內容。在 ChatGPT 應用程式中,Voice 讓 ChatGPT 能夠朗讀,並且最近已更新,可更好地遵循指令並更有效地使用像網路搜尋這樣的工具。對於開發者,OpenAI 也透過 audio/speech 端點提供專用的文字轉語音 API,模型包括 gpt-4o-mini-tts、tts-1 和 tts-1-hd。OpenAI 表示,其最新的 TTS 快照相較於前一代,在 Common Voice 和 FLEURS 上的詞錯誤率約降低 35%。