GPT-5.3 Codex の技術仕様
| 項目 | GPT-5.3 Codex(公開仕様) |
|---|---|
| モデルファミリー | GPT-5.3(Codex バリアント — エージェント指向のコーディング最適化) |
| 入力タイプ | テキスト、コード、ツール/ターミナルコンテキスト、(限定的)Codex アプリインターフェース経由のビジョン |
| 出力タイプ | テキスト(自然言語、コード、パッチ、シェルコマンド)、構造化ログ、テスト結果 |
| 長コンテキスト処理 | 長時間のセッションでは 100,000 トークンごとに圧縮がトリガー(システムカードに記載) |
| リリース/公開日 | 2026年2月5日(OpenAI のアナウンスおよびシステムカード) |
GPT-5.3 Codex とは
GPT‑5.3 Codex は、長期的なソフトウェアエンジニアリング、ツール駆動のワークフロー、高忠実度のセキュリティ研究/防御ワークフローに最適化された、OpenAI のフラッグシップとなるエージェント型コーディングモデルです。GPT‑5.2 Codex のコーディング能力に、推論の改善、長時間タスクの信頼性向上、サイバーおよびデュアルユース領域に合わせた追加の安全制御を組み合わせています。
GPT-5.3 Codex の主な機能
🧪 最先端のコーディング能力
- SWE-Bench Pro や Terminal-Bench 2.0 など業界のコーディングベンチマークでの最先端の結果—高い効率性と言語多様性を含む。
- 複数日にわたるビルド、テスト、リファクタリング、デプロイ、デバッグといった複雑な開発ワークフロー向けに設計。
🛠️ プロフェッショナルなワークフロー統合
- ウェブゲームやデスクトップアプリの構築、分析など、リサーチ、ツール呼び出し、複雑な実行を含むタスクをエンドツーエンドで実行。
- ウェブ開発の改善:一般的なコーディングプロンプトに対する「妥当なデフォルト出力」の向上、および生成コードにおける UX の自動改善。
📊 幅広い領域での作業
- GDPval のようなナレッジワーク系ベンチマークで、44 の職種にわたるプロダクティビティタスクにおいて GPT-5.2 に匹敵する性能を発揮。
- 視覚的なデスクトップタスクのパフォーマンスを人間のベースラインに近い水準で評価する OSWorld-Verified により、強力なデスクトップコンピューティング能力を示す。
🔐 サイバーセキュリティ対応性
- OpenAI の Preparedness Framework において、サイバーセキュリティタスクで High capability と分類された初の Codex。
ベンチマーク性能(抜粋指標)
| ベンチマーク | GPT-5.3 Codex | GPT-5.2 Codex | GPT-5.2 |
|---|---|---|---|
| SWE-Bench Pro | 56.8 % | 56.4 % | 55.6 % |
| Terminal-Bench 2.0 | 77.3 % | 64.0 % | 62.2 % |
| OSWorld-Verified | 64.7 % | 38.2 % | 37.9 % |
| GDPval (wins/ties) | 70.9 % | – | 70.9 % |
| Cybersecurity CTF | 77.6 % | 67.4 % | 67.7 % |
| SWE-Lancer IC Diamond | 81.4 % | 76.0 % | 74.6 % |
ベンチマークは、GPT-5.3 Codex がコーディング、エージェント的タスク、実世界の生産性タスク全般で従来モデルを上回っていることを示します。
GPT-5.3 Codex vs GPT-5.2-Codex vs 競合
| 機能 | GPT-5.3-Codex | GPT-5.2-Codex | Claude Opus 4.6 |
|---|---|---|---|
| コーディング性能 | ⚡ 業界最先端 | 高い | 中〜高 |
| 文脈推論 | 強い | 中程度 | 強い |
| 長時間タスク | 優秀 | 良好 | 非常に強い |
| エージェント的なコンピュータ操作 | 優秀 | 中程度 | 中心機能ではない |
| サイバーセキュリティタスク | 高い | 中程度 | 顕著な報告なし |
| リアルタイム制御 | あり | 限定的 | 未記載 |
Claude Opus 4.6 に関する注記: 同日にリリースされ、一般的なワークフローとコーディング強化を対象に文脈長の拡張をサポートするが、GPT-5.3 Codex のようにエージェント型コンピューティングに特化した最適化は行われていない。
代表的なエンタープライズユースケース
リポジトリ規模のリファクタリングと、テスト/検証ループを備えた自動 PR 生成。
Trusted Access プログラムの枠内での脆弱性トリアージ、リバースエンジニアリング、防御的研究の支援。
人間の確認を挟んだ検証付きの CI/CD オーケストレーションと自動回帰テスト。
要件を複数ファイルのスキャフォールドやテストハーネスへと変換する設計→プロトタイピングのワークフロー。
GPT-5.3 Codex API の利用方法
ステップ 1: API キーに登録
cometapi.com にログインしてください。まだ当社のユーザーでない場合は、まず登録してください。CometAPI コンソールにサインインします。インターフェイスのアクセス認証である API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー: sk-xxxxx を取得して送信します。

ステップ 2: GPT-5.3 Codex API にリクエストを送信
API リクエストを送信するには「gpt-5.3-codex」エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントをご参照ください。利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベース URL は Responses です。
コンテンツフィールドに質問やリクエストを挿入します—モデルが応答するのはこの内容です。API レスポンスを処理して生成された回答を取得します。
ステップ 3: 結果の取得と検証
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。