GPT-5.4-2026-03-05 の技術仕様
| Item | GPT-5.4-2026-03-05 |
|---|---|
| Model family | GPT-5 |
| Provider | OpenAI |
| Release date | 2026年3月5日 |
| Context window | 1,050,000 トークン |
| Max output tokens | 128,000 |
| Input types | テキスト、画像 |
| Output types | テキスト |
| Audio | 非対応 |
| Reasoning controls | none, low, medium, high, xhigh |
| Tool support | ウェブ検索、ファイル検索、コードインタープリタ、画像生成 |
| Knowledge cutoff | 2025年8月31日 |
| Snapshot stability | モデル挙動のロック |
GPT-5.4 とは?
GPT-5.4 は、近年の推論およびコーディング系(GPT-5.3-Codex の成果を含む)の改善を統合した、プロフェッショナルな知識労働を対象とする統合フロンティアリリースです。長時間の深い推論が可能な「Thinking」モデルであり、最高の性能/スループットを求める顧客向けの「Pro」バリアントとして位置づけられています。本リリースの主要なテーマは、(1) より長いコンテキストとドキュメント規模の理解、(2) ツールと“コンピュータ利用”能力の向上(アプリ制御、スプレッドシート/プレゼン編集)、(3) 事実誤りの低減と強化された多段階計画です。
GPT-5.4 の主な機能
- 巨大なロングコンテキスト対応(実験的に 1M+ トークン): GPT-5.4 は実験的に 1.05M トークンのセッションに対応(価格/制限あり)し、書籍全体/コードベース全体の推論や複数ドキュメントの統合が可能です。一般提供では標準ウィンドウは ≈272K トークンのままです。
- マルチステップなツール利用とネイティブな“コンピュータ利用”の改善: エージェント的ワークフロー向けにデスクトップ/ブラウザ制御(コンピュータ利用インターフェイス経由のキーボード/マウス)、ラウンド間で持続するウェブ検索、新しい Tool Search によるコネクタ/ツールの効率的発見が強化されました。OpenAI は複数のコンピュータ利用およびウェブエージェント系ベンチマークで最先端の成功率を報告しています。
- スプレッドシート、ドキュメント、プレゼンの生成/編集: オフィスワークフローに特化したチューニングを実施。社内ベンチマークではスプレッドシート・モデリングやプレゼン品質で大幅な向上を確認。リリースに合わせて ChatGPT for Excel のアドインも提供されました。
- 操舵性(ステアラビリティ)と推論モード: 「Thinking」モードは長時間タスク向けに明示的な計画/前書きを生成し、応答途中での指示変更(ステアリング)に対応します。推論負荷レベルにより、レイテンシとより深い連鎖的推論のトレードオフが可能です。
- 強化されたマルチモーダル理解: 高解像度の画像やチャート(画像入力)の解釈が向上し、文書理解やプレゼンテーションに活用できます。
- セーフティ方針: OpenAI は GPT-5.4 を高いサイバー能力を持つモデルとして扱い、GPT-5.3-Codex の緩和策に類似した強化されたセーフガードを適用しています。
ベンチマーク性能
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval(勝利または同点) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro (Public) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 と比較可能なモデル
| Model | Context Window | Key Strength |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | 最先端の推論 + エージェントワークフロー |
| GPT-5.3 Instant | Smaller | 日常タスクの高速処理 |
| Claude Opus / Sonnet | ~200k tokens | 長文推論 |
| Gemini 3 Pro | ~1M tokens | マルチモーダル推論 |
重要な違い: GPT-5.4 は、外部ツールと統合した場合に特に、プロフェッショナルな生産性ワークフローとエージェント機能に重点を置いています。
代表的なプロダクション用途
- エンタープライズ文書およびコンプライアンスのワークフロー: 長い契約書の処理、義務の抽出、複数ドキュメント群にまたがるコメント作成(単一セッションでの統合に 272K→1M のコンテキストオプションが有効)。
- スプレッドシート自動化と財務モデリング: 数式生成、英語仕様からのマルチシートモデル構築、入力の照合 — OpenAI は投資銀行ジュニアレベルのタスクで大きな向上を報告。
- エージェント的自動化と“コンピュータ利用”: 自動化されたブラウザ/デスクトップワークフロー(インストール、QA、ツール編成)や多段階ツールチェーン(Zapier 連携がパートナーとして言及)。
- ソフトウェア工学とコード保守: コード生成、リファクタリング、ターミナル/CLI エージェントタスク(Terminal-Bench での向上を報告)。大規模コードベースではロングコンテキストが有効だが、タスクのヒューリスティクスでの検証が必要。
- ナレッジワーカー支援: リサーチ統合(BrowseComp の改善)、スライド生成およびプレゼンのビジュアルデザイン。
GPT-5.4 API へのアクセス方法
ステップ 1: API キーの登録
cometapi.com にログインしてください。まだユーザーでない場合は、まず登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証用 API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。

ステップ 2: GPT-5.4 API にリクエストを送信
“gpt-5.4” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトの API ドキュメントから取得できます。当社サイトでは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベース URL は Chat Completions と Responses です。
質問や依頼内容を content フィールドに挿入します — これにモデルが応答します。API レスポンスを処理して生成された回答を取得します。
ステップ 3: 結果の取得と検証
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。




.webp)