モデルサポートエンタープライズブログ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
リソース
AIモデルブログエンタープライズ変更履歴概要
2025 CometAPI. 全著作権所有。プライバシーポリシー利用規約
Home/Models/OpenAI/TTS
O

TTS

入力:$12/M
出力:$12/M
OpenAI テキスト読み上げ
新着
商用利用
概要
機能
料金プラン
API
バージョン

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

TTSの機能

TTSのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

TTSの料金

TTSの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。TTSがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
入力:$12/M
出力:$12/M
入力:$15/M
出力:$15/M
-20%

TTSのサンプルコードとAPI

TTSの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでTTSの潜在能力を最大限に活用できるよう支援します。

TTSのバージョン

TTSに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
version
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vd-realtime-2025-12-16
tts-1-hd
qwen-tts-realtime
qwen3-tts-vc-realtime-2026-01-15
gpt-4o-mini-tts
kling_tts
tts-1
tts-1-1106
tts-1-hd-1106
qwen3-tts-flash-2025-11-27

その他のモデル

O

gpt-realtime-1.5

入力:$3.2/M
出力:$12.8/M
音声入力・音声出力に最適な音声モデル。
O

gpt-audio-1.5

入力:$2/M
出力:$8/M
Chat Completions における音声入出力に最適な音声モデル。
O

Whisper-1

入力:$24/M
出力:$24/M
音声をテキストに変換、翻訳を作成
K

Kling TTS

リクエストごと:$0.006608
[音声合成] 新登場:テキストから放送用音声をオンラインで生成、プレビュー機能付き ● 同時にaudio_idを生成でき、任意のKeling APIで利用可能。
K

Kling video-to-audio

K

Kling video-to-audio

リクエストごと:$0.03304
Kling 動画から音声に
K

Kling text-to-audio

K

Kling text-to-audio

リクエストごと:$0.03304
Kling テキストからオーディオ生成

関連ブログ

ChatGPTはテキスト読み上げに対応していますか? 2026年最新ガイド:音声・TTSモデル
Apr 2, 2026

ChatGPTはテキスト読み上げに対応していますか? 2026年最新ガイド:音声・TTSモデル

ChatGPT はテキスト読み上げが可能ですが、何を指すかによって答えは異なります。ChatGPT アプリでは、Voice によって ChatGPT が音声で話すことができ、最近のアップデートで指示への追従性が向上し、ウェブ検索などのツールをより効果的に使えるようになりました。開発者向けには、OpenAI は audio/speech エンドポイント経由で専用のテキスト読み上げ API も提供しており、gpt-4o-mini-tts、tts-1、tts-1-hd といったモデルが用意されています。OpenAI によれば、最新の TTS スナップショットは前世代と比べて、Common Voice および FLEURS における単語誤り率を約35%低減したとしています。