GPT-5.3 Codex：機能、ベンチマーク、入手方法

2026年2月5日、OpenAIはGPT-5.3-Codexを発表しました。これは、先進的なコーディング能力と、より広範なプロフェッショナルな推論、高速な推論処理、より深い「エージェント的」ワークフローを統合した、Codexファミリーの重点的なアップグレードです。本リリースでは新しいCodexデスクトップアプリが提供され、Codexエコシステム（CLI、IDE拡張、Web）全体でのアクセスが拡大します。APIアクセスは（「近日中」）とされています。

What is GPT-5.3-Codex ?

GPT-5.3-Codexは、OpenAIのCodexラインにおける最新のエージェント的コーディングモデルです。開発者のワークフロー内部で動作し、ツール（ターミナル、エディタ、Webエンドポイント）と対話し、計画、ツール活用、反復的なデバッグを必要とする長期的なエンジニアリングタスクを実行するよう、特化して学習・調整されています。OpenAIは、GPT-5.2-Codexのコーディングの強みと、GPT-5.2由来の推論力およびプロフェッショナル知識の向上を統合し、より協働的なエンジニアリングの相棒のように振る舞う単一モデルとして、GPT-5.3-Codexを位置づけています。

Origins and design goals

エージェント的ワークフロー: 単発の回答生成にとどまらず、時間をかけて一連のアクション（例：テスト実行、パッチ適用、再実行）を編成できるように調整されています。
ツール統合: Codexは、開発者ツール—CLI、デバッガ、パッケージマネージャ—を安全かつ信頼性高く利用し、セッション間で状態を保持することを想定しています。
実務的な開発支援: 目的は実用性です。コンテキストスイッチを減らし、トラブルシューティングを加速し、ルーチン作業（テスト、リファクタ、コード検索）を自動化し、ユーザーによる協調的な舵取りを支援します。

What’s new in GPT-5.3-Codex?

GPT-5.3-Codexは、直近の前世代と比べて、複数の具体的な変更とプロダクトレベルの改善を導入しています。

1. Codexユーザー向けの高速な推論

OpenAIは、推論スタックの改良とインフラ最適化により、GPT-5.3-CodexがCodexユーザーに対して約25%高速に動作すると報告しています。この速度向上は、対話型デバッグ時の低レイテンシと、より長く滑らかなエージェント的実行を可能にする点の両方で意義づけられています。

2. 推論とコーディング能力の統合

「コーディング専用」にとどまらず、GPT-5.2-Codexの最先端のコーディング性能に、GPT-5.2由来の強化されたプロフェッショナル推論を統合。ドキュメント読解、マルチステップ移行の計画、コードと併せて根拠やテスト証跡を提示する、といった研究色の強いタスクにも強くなっています。

3. 実行中の協調と操作性の向上

ユーザー視点での大きな変更として、モデルが「作業中」におけるコラボレーター風の対話が改善されました。Codexは進捗をより頻繁に報告し、実行の途中でステアリング指示を受け付け、複数ステップのタスクを跨いでコンテキストと状態を保持します。これにより、ユーザーはエージェントの実行中に割り込み、修正や指示出しが可能になります。プロダクトノートでは、この「ステア」挙動がCodexツール全体で安定化されつつあると記されています。

4. Codexデスクトップアプリ（より密なクライアント間同期）

OpenAIはCodexアプリをリリースしました。このアプリはセッション履歴や設定をCodex CLIやIDE拡張と同期し、開発者がエディタやターミナルで開始した作業を、状態を失うことなくデスクトップアプリで引き継げるようにします。アプリはエージェント的ワークフローの調整ハブとして位置づけられています。

5. エージェント的な長時間実行の最適化

GPT-5.3-Codexは、長時間の実行、ツール呼び出しとのインタリーブ、タスク途中でのステアリング（中断/再開、目標変更）が必要なタスクに明示的に最適化されています。これにより、複雑なリファクタ、マルチモジュールの機能開発、リポジトリ横断の作業における性能が向上します。

GPT-5.3-Codex on benchmarks

	GPT-5.3-Codex (xhigh)	GPT-5.2-Codex (xhigh)	GPT-5.2 (xhigh)
SWE-Bench Pro (Public)	56.8%	56.4%	55.6%
Terminal-Bench 2.0	77.3%	64.0%	62.2%
OSWorld-Verified	64.7%	38.2%	37.9%
GDPval (wins or ties)	70.9%	-	70.9% (high)
Cybersecurity Capture The Flag Challenges	77.6%	67.4%	67.7%
SWE-Lancer IC Diamond	81.4%	76.0%	74.6%

Representative benchmark results

Terminal-Bench 2.0: GPT-5.3-Codexは**約77.3%**とされ、前世代に比べてコマンドラインやターミナル・ワークフローでの熟達度が大きく向上したことを示しています。
SWE-Bench Pro: 複数言語と産業的課題を網羅する厳格なソフトウェア工学ベンチマークで**約56.8%**とされ、前モデルに対する着実な改善が報告されています。
OSWorld-VerifiedとサイバーセキュリティCTF指標: OpenAIのシステムカードとレポートでは、一般的な「コンピュータ利用」ベンチマーク（OSWorld）およびサイバーセキュリティのCTF系タスクでの改善（GPT-5.2-Codex比の明確な伸び）が示されています。

How can developers and organizations access GPT-5.3-Codex?

In which products and interfaces is it available today?

Codexアプリ（デスクトップ & Web）： OpenAIは、CLIやIDE拡張と設定・セッションを同期する専用Codexアプリを公開しました。多くのユーザーにとって、GUIと永続状態を備えたエージェント実行の主要手段となります。
Codex CLI： ターミナル中心のユーザーは、Codexをコマンドラインで利用できます。ローカルのリポジトリやワークフローと統合可能です。
IDE拡張： 一般的なIDE（Visual Studio Code、JetBrainsファミリー）向けプラグインにより、エディタ内でCodexが提案、ローカルテスト実行、インラインでの変更適用を行います。
Webインターフェース： ChatGPT/Codexの標準Webページ経由で、インストール不要で利用できます。

重要な提供状況の注意: OpenAIは、GPT-5.3-Codexが有料のChatGPTプランにおいてCodex各面で利用可能であり、APIアクセスは安全性の作業が完了次第提供予定であると述べています。

GPT-5.3 Codex APIの提供を待つ間、開発者は移行準備として、同等に多機能なGPT-5.2 CodexをCometAPIで利用できます。GPT-5.3 Codex APIがリリースされた際には、ゼロからやり直すのではなく数分でアップグレード可能です。

1. Codexアプリ（デスクトップ）

対象: GUI中心の調整面を求める個人開発者とチーム
内容: CLIやIDEからのセッション履歴・設定を同期し、実行中のエージェントタスクとログを可視化。長時間の実行を束ねるハブとして機能します。
開始方法: CodexアプリでChatGPTアカウントにサインイン。IDE/CLIで開始したセッションがアプリに表示されます。

2. Codex CLI（ターミナル）

対象: ターミナル中心の開発者、DevOps、SRE
内容: Codexアクションの実行、コマンド実行、テスト実行、プロジェクトに沿った構造化フィードバックの受領。自動化やスクリプトでモデルをツールとして活用可能。
開始方法: OpenAIの開発者ドキュメントにあるパッケージと手順に従ってCodex CLIをインストールし、ChatGPTアカウントまたはチームの認証情報でサインイン。対象リポジトリを指定します。

3. IDE拡張（VS Codeなど）

対象: エディタ中心の開発者
内容: エディタ内支援、プルリクエストレビューの自動化（例：PRで@codexタグを付けて自動レビューを依頼）、エディタから離れずにエージェント的フローを実行。拡張はアカウントベースのサインインをサポートし、多くのワークフローでAPIキーの取り回しが不要です。

4. Web/ChatGPT

対象: 軽量・探索的なユーザー、プロダクトマネージャー、Webアクセスを希望するチーム
内容: 有料サブスクライバー向けにChatGPTインターフェースからGPT-5.3-Codexを利用可能。ブラウザですぐにCodex機能へアクセスできます。

5. API（近日提供）

対象: CI/CDパイプライン、自動化ツール群、独自プラットフォームにCodexを組み込みたい企業
期待される内容: OpenAIはGPT-5.3-CodexのAPIアクセス提供を準備中と述べています

What does GPT-5.3-Codex mean for the developer ecosystem?

短期的な影響

ルーチン作業の生産性向上: 多くのチームで、テスト、リファクタ、デバッグの反復が高速化します。IDEとCLIの統合により、エージェント的ワークフローの採用摩擦も低減します。
新しい協働パターン: エンジニアはAIを「チームメイト」として扱う場面が増え、ステアリング指示の発行、エージェント出力のレビュー、コード整形やスキャフォールディング、定型修正といった反復的だが重要な作業をモデルに委ねるようになります。

長期的な業界への影響

ツールチェーンの集約: （アプリ＋CLI＋IDE）の統合エージェントツーリングは、チームがCodex中心のワークフローを受け入れれば、ツール断片化の軽減につながる可能性があります。
競争と特化: Anthropicなどの同週リリースが示すように、各プロバイダーは（巨大なコンテキストウィンドウ vs エージェント的コーディング速度など）異なるニッチに特化しつつあり、企業はブランドではなくユースケースでモデルを選ぶ流れが強まりそうです。

役割と人材

当面は代替ではなく拡張: Codexは多くの開発タスクを自動化しますが、特に本番の安全性が関わる場面では、アーキテクチャ、安全性、重要な推論、ガバナンスに人間のエンジニアが不可欠です。Codexは役割の消失ではなく、労力配分の変化をもたらします。

開発者は今すぐGPT-5.2 CodexをCometAPI経由で利用できます。まずはPlaygroundでモデルの能力を試し、詳細な手順はAPI guideをご確認ください。利用前に、CometAPIにログインしてAPIキーを取得していることを確認してください。CometAPIは、公式価格よりもはるかに低い価格で統合を支援します。

Ready to Go?→ 今すぐサインアップ

AIに関するヒント、ガイド、ニュースの最新情報は、VK、X、Discordをフォローしてください。