GPT-5.3 Codex: 기능, 벤치마크, 그리고 얻는 방법

2026년 2월 5일, OpenAI는 고급 코딩 능력에 더 폭넓은 전문적 추론, 더 빠른 추론 속도, 더 깊은 “에이전트형” 워크플로를 결합한 Codex 제품군의 집중 업그레이드인 GPT-5.3-Codex를 발표했다. 이번 출시에는 새로운 Codex 데스크톱 앱이 포함되고, Codex 생태계(CLI, IDE 확장, 웹) 전반으로 접근이 확대되었으며, API 접근은(“곧” 제공 예정이라고 약속) 추후 제공될 예정이다.

GPT-5.3-Codex란 무엇인가?

GPT-5.3-Codex는 OpenAI의 Codex 라인에서 최신의 에이전트형 코딩 모델로, 개발자 워크플로 내부에서 동작하고 도구(터미널, 에디터, 웹 엔드포인트)와 상호작용하며, 계획 수립·도구 사용·반복 디버깅이 필요한 장기 엔지니어링 작업을 수행하도록 특화되어 학습·튜닝된 모델이다. OpenAI는 GPT-5.2-Codex의 코딩 강점과 GPT-5.2의 추론 및 전문 지식 향상을 결합한 후속작으로 GPT-5.3-Codex를 포지셔닝하며, 협업하는 엔지니어 팀원처럼 작동하도록 설계된 단일 모델이라고 소개한다.

기원과 설계 목표

에이전트형 워크플로: 모델은 단일 답변 생성이 아니라 시간에 걸친 작업 시퀀스(예: 테스트 실행, 코드 패치, 재실행)를 오케스트레이션하도록 튜닝되었다.
도구 통합: Codex는 개발자 도구—CLI, 디버거, 패키지 관리자—를 안전하고 신뢰성 있게 사용하며, 세션 간 상태를 보존하도록 설계되었다.
실용적 개발자 지원: 목표는 실용성이다. 컨텍스트 전환을 줄이고, 트러블슈팅을 가속하며, 반복 작업(테스트, 리팩터링, 코드 검색)을 자동화하고, 인간 사용자의 협업적 스티어링을 지원한다.

GPT-5.3-Codex의 신규 사항은?

GPT-5.3-Codex는 직전 세대와 비교해 몇 가지 구체적 변화와 제품 수준의 개선을 도입했다.

1. Codex 사용자 대상 더 빠른 추론

OpenAI에 따르면 추론 스택 개선과 인프라 최적화로 GPT-5.3-Codex는 Codex 사용자 기준 약 25% 더 빠르게 동작한다. 이 속도 향상은 대화형 디버깅 시 낮은 지연과 더 길고 매끄러운 에이전트형 실행을 모두 가능하게 한다.

2. 추론과 코딩 강점의 통합

GPT-5.3-Codex는 순수한 “코딩 전용”이 아니라, GPT-5.2-Codex의 최전선 코딩 성능과 GPT-5.2의 향상된 전문적 추론을 결합해 문서 읽기, 다단계 마이그레이션 계획, 코드와 함께 근거 및 테스트 증거를 제시하는 등 리서치 성격의 작업에 더 능숙해졌다.

3. 실행 중 협업성과 스티어링 향상

주요 사용자 측면 변화로, 모델이 “작업 중” 더 자주 진행 상황을 보고하고, 실행 도중 스티어링 지시를 수용하며, 다단계 작업 전반에서 컨텍스트와 상태를 유지한다—즉, 사용자가 에이전트가 실행하는 도중에 중단·수정·지시할 수 있다. 제품 노트에 따르면 이러한 “스티어” 동작이 Codex 도구 전반에 걸쳐 안정화되고 있다.

4. Codex 데스크톱 앱(및 더 촘촘한 크로스 클라이언트 동기화)

OpenAI는 Codex 앱을 출시하여 세션 기록과 구성을 Codex CLI 및 IDE 확장과 동기화한다—개발자는 에디터나 터미널에서 시작한 작업을 상태를 잃지 않고 데스크톱 앱에서 이어갈 수 있다. 이 앱은 에이전트형 워크플로의 조정 허브로 포지셔닝된다.

5. 장시간 에이전트형 동작

GPT-5.3-Codex는 장시간 실행이 가능하고, 도구 호출과 교차되며, 작업 중 스티어링(일시중지/재개, 목표 변경)이 필요한 작업에 최적화되었다. 이를 통해 복잡한 리팩터링, 다중 모듈 기능 작업, 저장소 간 작업에서의 역량이 향상된다.

벤치마크에서의 GPT-5.3-Codex

	GPT-5.3-Codex (xhigh)	GPT-5.2-Codex (xhigh)	GPT-5.2 (xhigh)
SWE-Bench Pro (Public)	56.8%	56.4%	55.6%
Terminal-Bench 2.0	77.3%	64.0%	62.2%
OSWorld-Verified	64.7%	38.2%	37.9%
GDPval (wins or ties)	70.9%	-	70.9% (high)
Cybersecurity Capture The Flag Challenges	77.6%	67.4%	67.7%
SWE-Lancer IC Diamond	81.4%	76.0%	74.6%

대표 벤치마크 결과

Terminal-Bench 2.0: GPT-5.3-Codex는 **약 77.3%**를 기록했다고 하며, 이는 이전 세대 대비 커맨드라인 및 터미널 워크플로에서의 숙련도 향상을 시사하는 큰 도약이다.
SWE-Bench Pro: 다양한 언어와 산업 과제를 포괄하는 엄격한 소프트웨어 엔지니어링 벤치마크에서 **약 56.8%**로 보고되었으며, 이전 모델 대비 소폭이지만 유의미한 개선이다.
OSWorld-Verified 및 사이버보안 CTF 지표: OpenAI의 시스템 카드와 보고서에 따르면 일반적인 “컴퓨터 사용” 벤치마크(OSWorld)와 사이버보안 CTF 스타일 과제에서 개선이 관측되며(GPT-5.2-Codex 대비 두드러진 상승), 성능 향상을 보였다.

개발자와 조직은 GPT-5.3-Codex에 어떻게 접근할 수 있나?

현재 어떤 제품과 인터페이스에서 사용할 수 있나?

Codex app (desktop & web): OpenAI는 CLI와 IDE 확장과 세션·구성을 동기화하는 전용 Codex 앱을 출시했다. 많은 사용자에게 이 앱은 GUI와 지속 상태를 갖춘 에이전트 워크플로 실행의 주된 수단이 된다.
Codex CLI: 터미널 중심 사용자는 로컬 저장소와 워크플로에 통합된 커맨드라인 인터페이스를 통해 Codex와 상호작용할 수 있다.
IDE extensions: 일반적인 IDE(Visual Studio Code, JetBrains 계열)용 플러그인으로 에디터 내에서 코드 제안, 로컬 테스트 실행, 인플레이스 변경 수행이 가능하다.
Web interface: ChatGPT/Codex 페이지를 통한 표준 웹 접근으로 많은 사용자에게 설치 없이 사용 가능한 옵션을 제공한다.

중요한 이용 가능성 안내: OpenAI는 GPT-5.3-Codex가 Codex 전반에서 유료 ChatGPT 플랜에 제공된다고 밝히며, API 접근은 아직 활성화되지 않았고 안전성 작업을 거쳐 제공될 예정이라고 했다.

GPT-5.3 Codex API를 기다리는 동안, 개발자들은 CometAPI 에서 동일하게 기능이 풍부한 GPT-5.2 Codex를 사용하여 GPT-5.3 Codex로의 마이그레이션을 준비할 수 있다. GPT-5.3 Codex API가 출시되면, 처음부터 다시 시작하지 않고도 몇 분 만에 업그레이드할 수 있다.

1. Codex app (desktop)

대상: GUI 중심의 조정 화면을 원하는 개인 개발자와 팀
기능: CLI와 IDE에서의 세션 기록 및 구성을 동기화하고, 실행 중인 에이전트 작업과 로그를 표출하며, 장시간 작업의 허브 역할을 수행
시작 방법: Codex 앱에서 ChatGPT 계정으로 로그인; IDE/CLI에서 시작한 세션이 앱에 표시됨

2. Codex CLI (terminal)

대상: 터미널 중심 개발자, DevOps 엔지니어, SRE
기능: Codex 액션 실행, 명령 실행, 테스트 실행, 프로젝트와 인라인으로 구조화된 피드백 수신. 모델을 도구로 활용한 자동화와 스크립팅에 유용
시작 방법: OpenAI 개발자 문서의 패키지와 지침에 따라 Codex CLI 설치, ChatGPT 계정 또는 팀 자격 증명으로 로그인, 대상 저장소 지정

3. IDE extensions (VS Code 등)

대상: 에디터 중심 개발자
기능: 에디터 내 지원, Pull Request 자동 리뷰(예: PR에서 @codex 태그로 자동 리뷰 요청), 에디터를 떠나지 않고 에이전트형 플로 실행. 많은 워크플로에서 계정 기반 로그인 지원—API 키 설정 불필요
시작 방법: 해당 IDE용 확장 설치 후 계정으로 로그인

4. Web/ChatGPT

대상: 가벼운 사용 또는 탐색 목적 사용자, 프로덕트 매니저, 웹 액세스를 원하는 팀
기능: 유료 가입자를 대상으로 ChatGPT 인터페이스를 통해 GPT-5.3-Codex 제공. 브라우저에서 Codex 기능에 즉시 접근 가능

5. API (곧 제공 예정)

대상: Codex를 CI/CD 파이프라인, 자동화 도구, 독점 플랫폼에 내장하려는 기업
예상 내용: OpenAI는 GPT-5.3-Codex의 API 접근을 준비 중이라고 밝혔다

개발자 생태계에 GPT-5.3-Codex가 의미하는 바

단기적 영향

일상 작업 생산성 향상: 많은 팀에서 테스트, 리팩터링, 디버깅의 반복이 더 빨라질 것이다. IDE와 CLI 통합은 에이전트형 워크플로 도입의 마찰을 줄인다.
새로운 협업 패턴: 엔지니어는 AI를 “팀원”처럼 상호작용하게 되며—스티어링 명령을 내리고, 에이전트 출력을 검토하며, 코드 포매팅·스캐폴딩·루틴 수정과 같은 반복적이지만 중요한 작업을 모델에 신뢰하는 흐름이 늘어난다.

장기적 산업 효과

툴체인 통합: 통합된 에이전트형 도구(앱 + CLI + IDE)는 팀이 단일 Codex 중심 워크플로를 채택할 경우 도구 분절화를 줄일 수 있다.
경쟁과 전문화: 같은 주의 Anthropic 등 출시 사례는 공급자들이 서로 다른 틈새(예: 거대한 컨텍스트 윈도 vs. 에이전트형 코딩 속도)에 집중하고 있음을 보여주며, 이는 엔터프라이즈가 브랜드가 아닌 사용 사례에 따라 모델을 선택하도록 압박할 것이다.

역할과 인력

(현재로서는) 대체가 아닌 보강: Codex가 많은 개발 작업을 자동화하더라도, 특히 프로덕션 안전이 걸린 경우 아키텍처·안전·핵심 추론·거버넌스를 위해 인간 엔지니어는 여전히 필수적이다. Codex는 역할을 없애기보다는 노력의 분포를 바꾼다.

개발자는 지금 CometAPI를 통해 GPT-5.2 Codex에 접근할 수 있다. 시작하려면 Playground에서 모델의 역량을 탐색하고, 자세한 지침은 API guide를 참고하라. 접근 전에 CometAPI에 로그인하고 API 키를 발급받아야 한다. CometAPI는 통합을 돕기 위해 공식 가격보다 훨씬 낮은 가격을 제공한다.

Ready to Go?→ 오늘 바로 가입하고 시작하세요 !

AI 관련 더 많은 팁, 가이드, 뉴스를 원한다면 우리의 VK, X 및 Discord를 팔로우하세요!