2025 년 4 월 17 일: OpenAI 수요일, o3와 o4-mini라는 두 가지 획기적인 AI 모델을 출시하며 인공지능 추론 능력에 있어 상당한 발전을 이루었습니다. 이 모델들은 시각적 이해와 고급 문제 해결 기술을 통합하여 복잡한 작업의 성능을 향상시키도록 설계되었습니다.

o3: 인간 수준의 추론을 향한 발전
o3 모델은 현재까지 OpenAI에서 가장 정교한 추론 시스템으로 자리매김했습니다. 다양한 벤치마크에서 탁월한 성능을 입증했습니다.
- 수학: AIME 96.7 시험에서 한 문제만 놓쳐 2024%의 점수를 받았습니다.
- 과학적 추론: GPQA 다이아몬드 벤치마크에서 87.7%를 기록하며 대학원 수준의 과학 문제를 다루었습니다.
- 소프트웨어 공학: SWE-Bench 검증 코딩 테스트에서 71.7%의 정확도를 달성했습니다.
- 일반 정보: 높은 컴퓨팅 설정에서 87.5%의 점수를 기록하며 ARC-AGI 벤치마크에서 인간과 유사한 한계점을 넘어섰습니다.
이러한 성과는 o3가 기억된 패턴을 넘어 새로운 작업에 적응할 수 있는 능력을 보여줌으로써 인공 일반 지능(AGI)을 향한 중요한 단계로 자리매김하게 해줍니다.
도 참조 GPT-4.1: 이게 뭐고, 어떻게 사용할 수 있나요?
o4-mini: 효율적이고 다재다능함
o4-mini 모델은 성능 저하 없이 더욱 컴팩트하고 비용 효율적인 대안을 제공합니다. 수학, 코딩, 시각적 분석 등의 작업에 탁월하여 다양한 용도에 적합합니다.
시각적 추론 및 향상된 도구 자율성의 혁신
o3와 o4-mini는 이미지, 스케치, 화이트보드 콘텐츠 등 시각적 입력을 통해 추론하는 기능을 제공합니다. 이러한 통합을 통해 모델은 분석 과정의 일부로 이미지 조작(예: 확대/축소 또는 회전)을 수행하여 문제 해결 능력을 향상시킬 수 있습니다.
OpenAI는 이러한 모델에 "의도적 정렬(deliberative alignment)"이라는 새로운 학습 패러다임을 구현했습니다. 이 접근 방식을 통해 AI는 사람이 작성한 안전 기준에 맞춰 구조화된 추론을 수행하여 안전 기준 준수를 강화하고 상황에 맞는 응답을 제공할 수 있습니다.
CEO 샘 알트먼은 OpenAI의 모델 명명 규칙이 복잡하다는 것을 인정했으며, 더 직관적인 명명 시스템이 곧 나올 것이라고 밝혔습니다.
도 참조 GPT-4o는 NSFW 사진을 생성할 수 있나요?
접근성 및 향후 개발
o3 및 o4-mini 모델은 이제 ChatGPT Plus, Pro 및 Team 사용자에게 제공됩니다. 이번 출시는 OpenAI가 최근 GPT-4.1 모델을 공개한 것과 맞물려, OpenAI의 AI 개발에 대한 빠른 진전을 보여줍니다.
CEO 샘 알트먼은 OpenAI의 모델 명명 규칙이 복잡하다는 것을 인정했으며, 더 직관적인 명명 시스템이 곧 나올 것이라고 밝혔습니다.
이러한 발전은 안전성과 접근성에 중점을 두는 동시에 AI 역량의 경계를 넓히려는 OpenAI의 노력을 강조합니다.
OpenAI는 사용자 터미널에서 로컬로 실행되는 오픈 소스 코드 에이전트인 Codex CLI도 출시했습니다. Codex CLI는 사용자에게 AI 모델(o3 및 o4-mini(곧 GPT-4.1 지원 예정) 포함)을 사용자 컴퓨터에서 실행 중인 코드 및 작업에 간단하고 명확하게 연결할 수 있는 방법을 제공합니다. Codex CLI는 오픈 소스이며, 현재 GitHub에서 이용할 수 있습니다.
OpenAI의 최신 모델과 기능에 대한 자세한 내용은 CometAPI를 방문하세요. 오3 API 및 O4 미니 APICometAPI를 통해 o3 API와 O4 Mini API에 액세스하고 통합하는 방법을 설명합니다.



