gpt-realtime-1.5 の技術仕様
| 項目 | gpt-realtime-1.5(公開上の位置づけ) |
|---|---|
| モデルファミリー | GPT Realtime 1.5(音声最適化バリアント) |
| 主要モダリティ | 音声対音声(S2S) |
| 入力タイプ | 音声(ストリーミング)、テキスト |
| 出力タイプ | 音声(ストリーミング)、テキスト、構造化ツール呼び出し |
| API | Realtime API(WebRTC / 永続的なストリーミングセッション) |
| レイテンシ特性 | 低レイテンシでライブ会話型インタラクション向けに最適化 |
| セッションモデル | 状態を保持するストリーミングセッション |
| ツール利用 | 関数呼び出しおよびツール統合をサポート |
| 想定ユースケース | ライブ音声エージェント、アシスタント、対話型システム |
注: 正確なトークン上限やコンテキストウィンドウサイズは、公開サマリーでは目立って文書化されていません。このモデルは、極端に長いコンテキストセッションよりもリアルタイム応答性を重視する位置づけです。
gpt-realtime-1.5 とは?
gpt-realtime-1.5 は、ライブ会話システム向けに設計された、低レイテンシの音声対音声最適化モデルです。従来のリクエスト・レスポンス型モデルとは異なり、永続的なストリーミングセッションを通じて動作し、自然なターンテイキング、割り込み処理、動的な音声対話を可能にします。
最大コンテキスト長よりも会話フローの速度が重要となるアプリケーション向けに特化して構築されています。
主な機能
- 真の音声対音声インタラクション — ライブ音声入力を受け取り、リアルタイムで音声応答をストリーミングします。
- 低レイテンシアーキテクチャ — 音声エージェントにおいてサブ秒レベルの会話応答性を実現するよう設計されています。
- ストリーミングファースト設計 — 永続的なセッション(WebRTC またはストリーミングプロトコル)を介して動作します。
- 自然なターンテイキング — 割り込み処理と動的な会話フローをサポートします。
- ツール呼び出し対応 — リアルタイムセッション中に構造化された関数呼び出しを実行できます。
- 本番対応の音声エージェント基盤 — 対話型アシスタント、キオスク、組み込みデバイス向けに特化して構築されています。
ベンチマークと性能上の位置づけ
OpenAI は gpt-realtime-1.5 を、従来のリアルタイムモデルを発展させたものとして位置づけており、以前のリリースと比較して、指示追従性の向上、長時間の音声セッション中の安定性向上、より自然なプロソディを実現しています。
コーディング重視のモデル(例: Codex バリアント)とは異なり、性能はリーダーボード型ベンチマークよりも、会話レイテンシ、音声の自然さ、セッション安定性によって評価されます。
gpt-realtime-1.5 と関連モデルの比較
| 機能 | gpt-realtime-1.5 | gpt-audio-1.5 |
|---|---|---|
| 主な目的 | ライブ音声インタラクション | 音声対応チャットワークフロー |
| レイテンシ | 最小遅延向けに最適化 | 品質と速度のバランス重視 |
| セッションタイプ | 永続的ストリーミングセッション | 標準的な Chat Completions フロー |
| コンテキストサイズ | 応答性向けに最適化 | より大きなコンテキストをサポート |
| 最適な用途 | リアルタイム音声エージェント | 音声対応の会話アシスタント |
それぞれを選ぶべき場合
- コールセンター、キオスク、AI 受付、またはライブ組み込みアシスタントには gpt-realtime-1.5 を選んでください。
- より長い会話メモリやマルチモーダルワークフローを必要とする音声対応チャットアプリには gpt-audio-1.5 を選んでください。
代表的なユースケース
- AI コールセンターエージェント
- スマートデバイスアシスタント
- 対話型キオスク
- ライブ個別指導システム
- リアルタイム語学練習ツール
- 音声制御アプリケーション
- GPT realtime 1.5 API へのアクセス方法
ステップ 1: API キーを取得する
cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証情報である API キーを取得します。個人センターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。

ステップ 2: GPT realtime 1.5 API にリクエストを送信する
API リクエストを送信し、リクエストボディを設定するには、「gpt-realtime-1.5」エンドポイントを選択します。リクエストメソッドとリクエストボディは、当社ウェブサイトの API ドキュメントから取得できます。当社ウェブサイトでは、利便性のために Apifox テストも提供しています。<YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えてください。base url は Chat Completions です。
質問またはリクエストを content フィールドに入力してください。これがモデルの応答対象になります。API レスポンスを処理して生成された回答を取得します。
ステップ 3: 結果を取得して確認する
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データを返します。