`tts-1` の技術仕様

仕様	詳細
モデル ID	`tts-1`
提供元	OpenAI
モデルタイプ	テキスト入力を音声に変換するテキスト読み上げ（TTS）モデル。
主な最適化	特にリアルタイムまたは準リアルタイムの音声出力において、速度と低遅延生成に最適化。
品質プロファイル	`tts-1-hd` よりも低遅延だが、HD 版より音質は低い。
入力モダリティ	テキストのみ。
出力モダリティ	音声のみ。
API エンドポイント	OpenAI Audio API の音声生成エンドポイント: `/v1/audio/speech`。
最大入力長	1 回のリクエストにつき最大 4096 文字。
対応レスポンス形式	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`。
速度制御	`0.25` から `4.0` まで対応（デフォルトは `1.0`）。
`tts-1` の音声オプション	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`。
ストリーミング対応	Speech API は音声のストリーミング出力をサポートするが、SSE ストリーミングおよび指示ベースの音声制御は `tts-1` ではサポートされない。
価格	OpenAI は音声生成において `tts-1` を 100万トークンあたり $15 と記載。

`tts-1` とは？

tts-1 は、OpenAI のテキスト読み上げモデルで、文章を自然な音声に変換するために設計されています。OpenAI のクラシックな TTS モデル群の中では、より高速かつ低遅延の選択肢として位置付けられており、最高の音質よりも素早い音声合成が求められるアプリケーションに適しています。

開発者は通常、Audio API の音声生成エンドポイントを通じて tts-1 を利用し、アプリ内テキスト、プロンプト、通知、ナレーション、アシスタントの応答などを再生可能な音声ファイルに変換します。OpenAI のドキュメントでは、リアルタイムのテキスト読み上げ用途に最適化されていると説明されています。

実運用では、tts-1 は軽量な音声体験、即応性が重要なシステム、インタラクティブなプロトタイプ、そして応答性がプレミアムな音質より重視される製品に適しています。最大限の品質が優先される場合は tts-1-hd が推奨され、より表現力を重視するユースケースでは、より新しい TTS モデルが選ばれることもあります。

`tts-1` の主な機能

低遅延の音声生成: tts-1 は速度に特化して最適化されており、素早い音声出力が必要なアプリに有用です。
自然なテキスト読み上げ: プレーンテキストを、ナレーション、アシスタント応答、音声インターフェースに適した音声に変換します。
複数の内蔵音声: alloy、ash、coral、echo、fable、onyx、nova、sage、shimmer などの内蔵音声をサポートします。
柔軟な音声出力形式: 再生や処理の要件に応じて、MP3、WAV、FLAC、AAC、Opus、PCM などの一般的な形式で音声を生成可能です。
再生速度の調整: 0.25x〜4.0x の速度制御に対応し、ゆっくりしたナレーションから高速再生まで選べます。
シンプルな API ベースの統合: 標準的な音声生成 API を通じて利用でき、Web、モバイル、バックエンドへの統合が容易です。
リアルタイム志向のアプリに適する: OpenAI は tts-1 をリアルタイム TTS シナリオ向けのモデルとして位置付けており、アシスタント、通知、迅速な対話型システムに実用的です。
トレードオフ重視のモデル選択: tts-1-hd と比べて生成速度を優先し、レイテンシと品質の明確な選択肢を提供します。

`tts-1` へのアクセスと統合方法

ステップ 1: API キーを取得

tts-1 API にアクセスするには、まず CometAPI にサインアップし、ダッシュボードから API キーを生成します。ログイン後、新しいキーを作成して安全にコピーし、アプリケーションの環境変数に保存します。このキーは tts-1 API へのすべてのリクエストの認証に使用します。

ステップ 2: `tts-1` API にリクエストを送信

API キーを取得したら、入力ペイロードを添えて CometAPI の tts-1 エンドポイントに POST リクエストを送信します。Authorization ヘッダーに API キーを含め、モデルとして tts-1 を指定します。典型的なリクエストには、入力テキストに加えて、音声やレスポンス形式といった TTS パラメータが含まれます。

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

ステップ 3: 結果を取得して検証

リクエスト送信後、呼び出しが成功すれば tts-1 API は生成音声コンテンツを返します。返されたファイルまたはストリームを保存し、音声が正しく再生されることを確認のうえ、選択した音声、速度、形式がアプリの要件に合致しているかを確認します。必要に応じてパラメータを調整して再試行し、最終出力を改善します。

`tts-1` の技術仕様

仕様	詳細
モデル ID	`tts-1`
提供元	OpenAI
モデルタイプ	テキスト入力を音声に変換するテキスト読み上げ（TTS）モデル。
主な最適化	特にリアルタイムまたは準リアルタイムの音声出力において、速度と低遅延生成に最適化。
品質プロファイル	`tts-1-hd` よりも低遅延だが、HD 版より音質は低い。
入力モダリティ	テキストのみ。
出力モダリティ	音声のみ。
API エンドポイント	OpenAI Audio API の音声生成エンドポイント: `/v1/audio/speech`。
最大入力長	1 回のリクエストにつき最大 4096 文字。
対応レスポンス形式	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`。
速度制御	`0.25` から `4.0` まで対応（デフォルトは `1.0`）。
`tts-1` の音声オプション	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`。
ストリーミング対応	Speech API は音声のストリーミング出力をサポートするが、SSE ストリーミングおよび指示ベースの音声制御は `tts-1` ではサポートされない。
価格	OpenAI は音声生成において `tts-1` を 100万トークンあたり $15 と記載。

`tts-1` とは？

`tts-1` の主な機能

低遅延の音声生成: tts-1 は速度に特化して最適化されており、素早い音声出力が必要なアプリに有用です。
自然なテキスト読み上げ: プレーンテキストを、ナレーション、アシスタント応答、音声インターフェースに適した音声に変換します。
複数の内蔵音声: alloy、ash、coral、echo、fable、onyx、nova、sage、shimmer などの内蔵音声をサポートします。
柔軟な音声出力形式: 再生や処理の要件に応じて、MP3、WAV、FLAC、AAC、Opus、PCM などの一般的な形式で音声を生成可能です。
再生速度の調整: 0.25x〜4.0x の速度制御に対応し、ゆっくりしたナレーションから高速再生まで選べます。
シンプルな API ベースの統合: 標準的な音声生成 API を通じて利用でき、Web、モバイル、バックエンドへの統合が容易です。
リアルタイム志向のアプリに適する: OpenAI は tts-1 をリアルタイム TTS シナリオ向けのモデルとして位置付けており、アシスタント、通知、迅速な対話型システムに実用的です。
トレードオフ重視のモデル選択: tts-1-hd と比べて生成速度を優先し、レイテンシと品質の明確な選択肢を提供します。

`tts-1` へのアクセスと統合方法

ステップ 1: API キーを取得

ステップ 2: `tts-1` API にリクエストを送信

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

`tts-1` の技術仕様

`tts-1` とは？

`tts-1` の主な機能

`tts-1` へのアクセスと統合方法

ステップ 1: API キーを取得

ステップ 2: `tts-1` API にリクエストを送信

ステップ 3: 結果を取得して検証

tts-1の料金

tts-1のサンプルコードとAPI

tts-1

`tts-1` の技術仕様

`tts-1` とは？

`tts-1` の主な機能

`tts-1` へのアクセスと統合方法

ステップ 1: API キーを取得

ステップ 2: `tts-1` API にリクエストを送信

ステップ 3: 結果を取得して検証

tts-1の料金

tts-1のサンプルコードとAPI

tts-1

tts-1 の技術仕様

tts-1 とは？

tts-1 の主な機能

tts-1 へのアクセスと統合方法

ステップ 1: API キーを取得

ステップ 2: tts-1 API にリクエストを送信

ステップ 3: 結果を取得して検証

tts-1の料金

tts-1のサンプルコードとAPI

tts-1

tts-1 の技術仕様

tts-1 とは？

tts-1 の主な機能

tts-1 へのアクセスと統合方法

ステップ 1: API キーを取得

ステップ 2: tts-1 API にリクエストを送信

ステップ 3: 結果を取得して検証

tts-1の料金

tts-1のサンプルコードとAPI

`tts-1` の技術仕様

`tts-1` とは？

`tts-1` の主な機能

`tts-1` へのアクセスと統合方法

ステップ 2: `tts-1` API にリクエストを送信

`tts-1` の技術仕様

`tts-1` とは？

`tts-1` の主な機能

`tts-1` へのアクセスと統合方法

ステップ 2: `tts-1` API にリクエストを送信