GPT-5.3 Codex の技術仕様
| 項目 | GPT-5.3 Codex(公開仕様) |
|---|---|
| モデルファミリー | GPT-5.3(Codex バリアント — エージェント型コーディング最適化) |
| 入力タイプ | テキスト、コード、ツール/ターミナルのコンテキスト、(限定的な)Vision(Codex アプリのインターフェース経由) |
| 出力タイプ | テキスト(自然言語、コード、パッチ、シェルコマンド)、構造化ログ、テスト結果 |
| 長文脈処理 | 長時間セッション中に100,000トークンごとにコンパクションをトリガー(システムカードで報告) |
| リリース/公開日 | 2026年2月5日(OpenAI の発表とシステムカード) |
GPT-5.3 Codex とは
GPT‑5.3 Codex は、長期的なソフトウェアエンジニアリング、ツール駆動型ワークフロー、高忠実度のセキュリティ研究/防御ワークフローに最適化された、OpenAI のフラッグシップのエージェント型コーディングモデルです。GPT‑5.2 Codex のコーディング能力を基盤に、推論力の向上、長時間タスクの信頼性強化、そしてサイバーおよびデュアルユース領域に合わせた追加の安全制御を組み合わせています。
GPT-5.3 Codex の主な特長
🧪 最先端のコーディング能力
- 最先端の結果 を SWE-Bench Pro や Terminal-Bench 2.0 といった業界ベンチマークで達成—効率性の向上と言語の多様性を包含。
- 複数日にわたるビルド、テスト、リファクタリング、デプロイ、デバッグといった 複雑な開発ワークフロー を想定して設計。
🛠️ プロフェッショナルワークフローへの統合
- ウェブゲーム、デスクトップアプリ、分析などの構築において、リサーチ、ツール呼び出し、複雑な実行 を含むタスクをエンドツーエンドで遂行。
- ウェブ開発の改良:一般的なコーディングプロンプトに対する「妥当なデフォルト出力」が向上し、生成コードに自動化された UX 改善を適用。
📊 幅広い領域での作業
- GDPval のようなナレッジワーク系ベンチマークで、44の職種にわたるプロフェッショナルな生産性タスクにおいて GPT-5.2 と同等のパフォーマンスを発揮。
- 視覚的なデスクトップタスクのパフォーマンスを評価する OSWorld-Verified により、ヒューマンベースラインに近づく強力なデスクトップコンピューティング能力を示す。
🔐 サイバーセキュリティ対応力
- OpenAI の Preparedness Framework において、サイバーセキュリティタスクでの 高い能力 に分類された初の Codex。
ベンチマークパフォーマンス(選抜指標)
| ベンチマーク | GPT-5.3 Codex | GPT-5.2 Codex | GPT-5.2 |
|---|---|---|---|
| SWE-Bench Pro | 56.8 % | 56.4 % | 55.6 % |
| Terminal-Bench 2.0 | 77.3 % | 64.0 % | 62.2 % |
| OSWorld-Verified | 64.7 % | 38.2 % | 37.9 % |
| GDPval (wins/ties) | 70.9 % | – | 70.9 % |
| Cybersecurity CTF | 77.6 % | 67.4 % | 67.7 % |
| SWE-Lancer IC Diamond | 81.4 % | 76.0 % | 74.6 % |
ベンチマークは、コーディング、エージェント的タスク、実世界の生産性タスク全般で GPT-5.3 Codex が従来モデルを上回ることを示しています。
GPT-5.3 Codex と GPT-5.2-Codex と競合の比較
| 機能 | GPT-5.3-Codex | GPT-5.2-Codex | Claude Opus 4.6 |
|---|---|---|---|
| コーディング性能 | ⚡ 業界トップクラス | 高い | 中〜高 |
| 文脈推論 | 強力 | 中程度 | 強力 |
| 長時間タスク | 優秀 | 良好 | 非常に強力 |
| エージェント的なコンピュータ操作 | 優秀 | 中程度 | 中核ではない |
| サイバーセキュリティタスク | 高い | 中程度 | 顕著な報告なし |
| リアルタイム制御 | あり | 限定的 | 未記載 |
Claude Opus 4.6 に関する注記:同日にリリースされ、一般的なワークフローとコーディングの強化を対象にし、コンテキストサポートを拡張しているが、GPT-5.3 Codex のようにエージェントコンピューティングに特化してはいない。
代表的なエンタープライズ用途
- テストおよび検証ループを伴う、リポジトリ規模のリファクタリングと自動 PR 生成。
- Trusted Access プログラム内での、脆弱性トリアージ、リバースエンジニアリング、防御研究の支援。
- 人間の検証を組み込んだ CI/CD オーケストレーションと自動回帰テスト。
- 要件を複数ファイルのスキャフォールドやテストハーネスへと変換する、設計 → プロトタイピングのワークフロー。
- GPT-5.3 Codex API へのアクセス方法
手順 1: API キーの取得
cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI console にサインインします。インターフェースのアクセス認証である API キーを取得します。個人センターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。

手順 2: GPT-5.3 Codex API にリクエストを送信
“gpt-5.3-codex” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトの API ドキュメントから取得できます。当社サイトでは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベースURLは Chat Completions です。
content フィールドに質問またはリクエストを挿入します—これがモデルの応答対象です。API レスポンスを処理して生成された回答を取得します。
手順 3: 結果を取得して検証
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクステータスと出力データを返します。