O

gpt-realtime-1.5

入力:$3.2/M
出力:$12.8/M
文脈:32,000
最大出力:4,096
音声入力・音声出力に最適な音声モデル。
新着
商用利用

gpt-realtime-1.5 の技術仕様

項目gpt-realtime-1.5(公開上の位置づけ)
モデルファミリーGPT Realtime 1.5(音声最適化バリアント)
主要モダリティ音声対音声(S2S)
入力タイプ音声(ストリーミング)、テキスト
出力タイプ音声(ストリーミング)、テキスト、構造化ツール呼び出し
APIRealtime API(WebRTC / 永続的なストリーミングセッション)
レイテンシ特性低レイテンシでライブ会話型インタラクション向けに最適化
セッションモデル状態を保持するストリーミングセッション
ツール利用関数呼び出しおよびツール統合をサポート
想定ユースケースライブ音声エージェント、アシスタント、対話型システム

注: 正確なトークン上限やコンテキストウィンドウサイズは、公開サマリーでは目立って文書化されていません。このモデルは、極端に長いコンテキストセッションよりもリアルタイム応答性を重視する位置づけです。


gpt-realtime-1.5 とは?

gpt-realtime-1.5 は、ライブ会話システム向けに設計された、低レイテンシの音声対音声最適化モデルです。従来のリクエスト・レスポンス型モデルとは異なり、永続的なストリーミングセッションを通じて動作し、自然なターンテイキング、割り込み処理、動的な音声対話を可能にします。

最大コンテキスト長よりも会話フローの速度が重要となるアプリケーション向けに特化して構築されています。


主な機能

  1. 真の音声対音声インタラクション — ライブ音声入力を受け取り、リアルタイムで音声応答をストリーミングします。
  2. 低レイテンシアーキテクチャ — 音声エージェントにおいてサブ秒レベルの会話応答性を実現するよう設計されています。
  3. ストリーミングファースト設計 — 永続的なセッション(WebRTC またはストリーミングプロトコル)を介して動作します。
  4. 自然なターンテイキング — 割り込み処理と動的な会話フローをサポートします。
  5. ツール呼び出し対応 — リアルタイムセッション中に構造化された関数呼び出しを実行できます。
  6. 本番対応の音声エージェント基盤 — 対話型アシスタント、キオスク、組み込みデバイス向けに特化して構築されています。

ベンチマークと性能上の位置づけ

OpenAI は gpt-realtime-1.5 を、従来のリアルタイムモデルを発展させたものとして位置づけており、以前のリリースと比較して、指示追従性の向上、長時間の音声セッション中の安定性向上、より自然なプロソディを実現しています。

コーディング重視のモデル(例: Codex バリアント)とは異なり、性能はリーダーボード型ベンチマークよりも、会話レイテンシ、音声の自然さ、セッション安定性によって評価されます。


gpt-realtime-1.5 と関連モデルの比較

機能gpt-realtime-1.5gpt-audio-1.5
主な目的ライブ音声インタラクション音声対応チャットワークフロー
レイテンシ最小遅延向けに最適化品質と速度のバランス重視
セッションタイプ永続的ストリーミングセッション標準的な Chat Completions フロー
コンテキストサイズ応答性向けに最適化より大きなコンテキストをサポート
最適な用途リアルタイム音声エージェント音声対応の会話アシスタント

それぞれを選ぶべき場合

  • コールセンター、キオスク、AI 受付、またはライブ組み込みアシスタントには gpt-realtime-1.5 を選んでください。
  • より長い会話メモリやマルチモーダルワークフローを必要とする音声対応チャットアプリには gpt-audio-1.5 を選んでください。

代表的なユースケース

  • AI コールセンターエージェント
  • スマートデバイスアシスタント
  • 対話型キオスク
  • ライブ個別指導システム
  • リアルタイム語学練習ツール
  • 音声制御アプリケーション
  • GPT realtime 1.5 API へのアクセス方法

ステップ 1: API キーを取得する

cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証情報である API キーを取得します。個人センターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。

cometapi-key

ステップ 2: GPT realtime 1.5 API にリクエストを送信する

API リクエストを送信し、リクエストボディを設定するには、「gpt-realtime-1.5」エンドポイントを選択します。リクエストメソッドとリクエストボディは、当社ウェブサイトの API ドキュメントから取得できます。当社ウェブサイトでは、利便性のために Apifox テストも提供しています。<YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えてください。base url は Chat Completions です。

質問またはリクエストを content フィールドに入力してください。これがモデルの応答対象になります。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果を取得して確認する

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データを返します。

よくある質問