O

gpt-realtime-1.5

入力:$3.2/M
出力:$12.8/M
文脈:32,000
最大出力:4,096
音声入力・音声出力に最適な音声モデル。
新着
商用利用

gpt-realtime-1.5 の技術仕様

項目gpt-realtime-1.5(公開上の位置づけ)
モデルファミリーGPT Realtime 1.5(音声最適化バリアント)
主要モダリティ音声から音声(S2S)
入力タイプ音声(ストリーミング)、テキスト
出力タイプ音声(ストリーミング)、テキスト、構造化されたツール呼び出し
APIRealtime API(WebRTC/永続ストリーミングセッション)
レイテンシプロファイル低遅延のライブ対話に最適化
セッションモデルステートフルなストリーミングセッション
ツールの利用関数呼び出しおよびツール統合に対応
対象ユースケースライブ音声エージェント、アシスタント、インタラクティブシステム

注: 正確なトークン上限やコンテキストウィンドウのサイズは公開概要では目立って記載されていません。モデルは極端に長いコンテキストセッションよりも、リアルタイムの応答性を重視する位置づけです。


gpt-realtime-1.5 とは?

gpt-realtime-1.5 は、ライブ会話システム向けに設計された低遅延の音声対音声最適化モデルです。従来のリクエスト—レスポンス型モデルと異なり、永続的なストリーミングセッションで動作し、自然なターンテイキング、中断への対応、動的な音声対話を可能にします。

最大コンテキスト長よりも会話の流れの速さを重視するアプリケーション向けに特化して設計されています。


主な機能

  1. 真の音声対音声インタラクション — ライブ音声入力を受け取り、応答音声をリアルタイムにストリーミングします。
  2. 低遅延アーキテクチャ — 音声エージェントでサブ秒の会話応答性を実現する設計。
  3. ストリーミング優先の設計 — 永続セッション(WebRTC またはストリーミングプロトコル)で動作。
  4. 自然なターンテイキング — 割り込み処理と動的な会話フローに対応。
  5. ツール呼び出しに対応 — リアルタイムセッション中に構造化された関数呼び出しをトリガー可能。
  6. 本番運用に耐える音声エージェント基盤 — インタラクティブなアシスタント、キオスク、組み込みデバイス向けに特化して構築。

ベンチマークとパフォーマンスの位置づけ

OpenAI は、gpt-realtime-1.5 を、従来のリアルタイムモデルの進化版として位置づけており、長時間の音声セッションにおける命令追従性の向上、安定性、より自然なプロソディを実現したとしています。

コーディング特化型モデル(例:Codex 系)とは異なり、リーダーボード式のベンチマークではなく、会話のレイテンシ、音声の自然さ、セッションの安定性といった指標で性能を評価します。


gpt-realtime-1.5 と関連モデルの比較

機能gpt-realtime-1.5gpt-audio-1.5
主目的ライブ音声インタラクション音声対応のチャットワークフロー
レイテンシ最小遅延に最適化品質と速度のバランス
セッションタイプ永続ストリーミングセッション標準の Chat Completions フロー
コンテキストサイズ応答性重視で最適化より大きなコンテキストに対応
最適な用途リアルタイム音声エージェント音声対応の会話型アシスタント

それぞれを選ぶべき場面

  • コールセンター、キオスク、AI 受付、ライブ対応の組み込みアシスタントには gpt-realtime-1.5 を選択。
  • より長い会話メモリやマルチモーダルなワークフローを要する音声対応チャットアプリには gpt-audio-1.5 を選択。

代表的なユースケース

  • AI コールセンターエージェント
  • スマートデバイスアシスタント
  • インタラクティブキオスク
  • ライブ講師システム
  • リアルタイム言語練習ツール
  • 音声制御アプリケーション
  • GPT realtime 1.5 API のアクセス方法

ステップ 1: API キーに登録

cometapi.com にログインしてください。まだユーザーでない場合は、まずご登録ください。CometAPI コンソール にサインインします。インターフェース用のアクセス認証 API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー: sk-xxxxx を取得して送信します。

cometapi-key

ステップ 2: GPT realtime 1.5 API にリクエストを送信

API リクエストを送信するには “gpt-realtime-1.5” エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドおよびリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため、当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベース URL は Chat Completions です。

質問やリクエストを content フィールドに挿入します—モデルはその内容に応答します。API レスポンスを処理して、生成された回答を取得します。

ステップ 3: 結果を取得して検証

生成された回答を取得するために API レスポンスを処理します。処理後、API はタスクのステータスと出力データを返します。

よくある質問

その他のモデル