27일 목요일에 진행되는 흥미진진한 라이브 스트리밍 이벤트에서 OpenAI GPT-4.5의 연구 미리보기를 공개했습니다. GPT-XNUMX는 자사의 주력 대규모 언어 모델의 최신 버전입니다. 이 회사의 대표들은 이 새로운 버전을 지금까지 가장 유능하고 다재다능한 채팅 모델이라고 극찬했습니다. 처음에는 소프트웨어 개발자와 ChatGPT Pro 구독자에게 공개됩니다.
GPT-4.5의 출시는 OpenAI의 일종의 시대의 종식을 알릴 것입니다. 이번 달 초 X에 올린 게시물에서 OpenAI의 CEO 샘 알트먼은 이 모델이 응답하기 전에 쿼리를 숙고하기 위해 추가 컴퓨팅 파워를 사용하지 않는 마지막 모델이 될 것이라고 말했습니다.

GPT 4.5란 무엇인가요?
GPT 4.5는 OpenAI가 지금까지 선보인 가장 큰 모델입니다. 전문가들은 GPT-4가 모델이 훈련될 때 조정되는 값인 최대 1.8조 4.5억 개의 매개변수를 가질 수 있다고 추정했습니다. 비지도 학습을 확장함으로써 GPT XNUMX는 추론 없이도 패턴을 인식하고, 연결을 도출하고, 창의적인 통찰력을 생성하는 능력을 향상시킵니다.
GPT 4.5는 컴퓨팅과 데이터를 확장하고 아키텍처와 최적화 혁신을 통해 비지도 학습을 확장한 사례입니다. 그리고 GPT-4.5는 사용자 상호작용에서 더 자연스럽고, 더 광범위한 지식을 포괄하며, 사용자 의도를 더 잘 이해하고 대응할 수 있어 환각이 감소하고 광범위한 주제에 걸쳐 더 높은 신뢰성을 제공합니다.
GPT 4.5의 업그레이드와 기능은 무엇입니까?
EQ 업그레이드:
GPT-4.5의 가장 큰 특징은 향상된 "감성 지능"(EQ)으로, 보다 자연스럽고 따뜻하며 매끄러운 대화 경험을 제공할 수 있습니다. OpenAI CEO 샘 알트먼은 소셜 미디어에 "AI가 사려 깊은 사람과 대화하는 것 같은 기분을 느낀 것은 이번이 처음입니다. 정말 귀중한 조언을 제공하고, 심지어 AI가 이렇게 훌륭한 답변을 할 수 있다는 사실에 놀라며 의자에 기대 앉았습니다."라고 공유했습니다.
인간 선호도 테스트에서 사용자들은 일반적으로 GPT 4.5의 응답이 GPT-4o보다 인간의 의사소통 습관과 더 일치한다고 믿습니다. 구체적으로, 새로운 모델은 창의적 지능(56.8%), 전문적 이슈(63.2%), 일상적 이슈(57.0%)에서 더 높은 평가를 받았습니다.
환각 감소:
대규모 "비지도 학습"을 통해 GPT 4.5는 지식 정확도와 "환각"(거짓 정보) 감소에 상당한 진전을 이루었습니다.
- SimpleQA 평가에서 62.5%의 정확도를 달성, 환각률은 37.1%로 낮아졌습니다.
- PersonQA 데이터 세트에서 0.78의 정확도 달성, GPT-4o(0.28) 및 o1(0.55)보다 훨씬 우수

지식 기반 확장 및 표현 업그레이드
효율성이 극적으로 증가했습니다: 컴퓨팅 전력 소비는 10배 감소했고, 지식 기반은 두 배로 늘었지만 비용은 더 높았습니다(Pro 사용자는 월 $200에 우선 경험을 제공합니다). 또한 GPT 4.5는 아키텍처와 혁신에서 최적화되어 제어 가능성, 뉘앙스 이해 및 자연스러운 대화 기능이 향상되었으며, 특히 글쓰기, 프로그래밍, 실제 문제 해결 및 높은 수준의 공감이 필요한 대화형 시나리오에 적합합니다.
기술 아키텍처 하이라이트
컴퓨팅 파워 업그레이드: Microsoft Azure 슈퍼컴퓨팅 학습을 기반으로, 컴퓨팅 파워는 GPT-10의 40배이며, 컴퓨팅 효율성은 10배 이상 향상되었으며, 여러 데이터 센터에 걸친 분산 학습이 지원됩니다.
안전 최적화: 기존의 감독 미세 조정(SFT)과 RLHF를 통합하고, 새로운 감독 기술을 도입하여 유해한 출력의 위험을 줄입니다.
다중 모드 제한: 아직 음성/비디오는 지원되지 않지만 SVG 애니메이션 디자인과 저작권 없는 음악 생성을 돕기 위해 이미지 이해 기능이 추가되었습니다.
관련 주제:8년 가장 인기 있는 2025가지 AI 모델 비교
GPT 4.5 API 가격 설명: 정말 가치가 있을까?
GPT‑4.5는 12.8조 개의 매개변수와 128k 토큰 컨텍스트 윈도우를 갖춘 거대한 아키텍처를 기반으로 구축되었습니다. 이 엄청난 규모와 컴퓨팅 집약적 설계에는 프리미엄 가격이 적용됩니다. 예를 들어, 750k 입력 토큰과 250k 출력 토큰이 있는 워크로드는 약 147달러가 들 수 있습니다. 이는 GPT‑30o와 같은 이전 모델보다 약 34~4배 더 비쌉니다.
GPT 시리즈 가격 비교

새로운 모델은 현재 ChatGPT Pro 사용자를 대상으로 연구 미리보기로 제공되고 있으며, 향후 2주 동안 Plus, Team, Enterprise 및 Education 사용자에게 출시될 예정입니다.
GPT 4.5 대 다른 언어 모델
디자인 쓰기의 미적 직관력이 업그레이드되어 다른 모델보다 창의적인 작업과 감정적 상호 작용에 더 적합해졌습니다. 추론은 다운그레이드되어 "가장 강력한 모델"이라는 포지셔닝을 분명히 포기했습니다. 추론 능력은 경쟁자보다 뒤처집니다. GPT-4.5는 대화형 AI의 기준을 높였지만, 높은 가격으로 인해 대중 시장 솔루션이 아닌 전문 도구가 되었습니다.
주요 AI 모델에 대한 포괄적인 API 가격 비교
| 모델 | 입력 비용(1M 토큰당) | 출력 비용(1M 토큰당) | 컨텍스트 창 | 코멘트 |
| GPT‑4.5 | 75 | 150 | 128만 토큰 | 고급 감정 및 대화 기능을 위한 프리미엄 가격 |
| GPT‑4o | 2.5 | 10 | 128만 토큰 | 빠르고 다중 모드 지원을 갖춘 비용 효율적인 기준선 |
| 클로드 3.7 소네트 | 3 | 15 | 200만 토큰 | 매우 경제적이며 텍스트와 이미지를 모두 지원합니다. |
| 딥시크 R1 | ~ $ 0.55 | ~ $ 2.19 | 64만 토큰 | 공격적인 가격 책정, 캐싱을 통해 대량 사용 사례의 비용을 더욱 절감할 수 있습니다. |
| 구글 제미니 2.0 플래시 | ~ $ 0.15 | ~ $ 0.60 | 최대 1M 토큰 | 방대한 컨텍스트 용량을 갖춘 초저가, 대량 작업에 이상적 |
기술적 역량 및 비용 균형
컨텍스트 및 다중 모달리티:
**GPT‑4.5:**128k 토큰 컨텍스트를 지원하지만 텍스트 전용입니다.
클로드 3.7 소네트: 더욱 향상된 장기 컨텍스트 성능을 위해 더 큰 200k 토큰 창과 이미지 처리 기능을 제공합니다.
**Google Gemini 2.0 플래시:**광범위한 콘텐츠 처리에 적합한 인상적인 1M 토큰 창을 자랑합니다(단, 텍스트 품질은 다를 수 있음).
전문 업무:
**코딩 벤치마크:**GPT‑4.5는 코딩 작업(예: SWE‑Bench)에서 약 38%의 정확도를 달성하는 반면, Claude 3.7 Sonnet은 기술 작업에서 훨씬 더 뛰어난 비용 효율성과 성능을 제공합니다.
**감성 지능:**GPT‑4.5는 섬세하고 감정적으로 풍부한 대화를 전달하는 데 탁월하여 고객 지원 및 코칭 애플리케이션에 이상적입니다.
결론
GPT-4.5는 "마지막 비추론 모델"입니다. 비지도 학습 기능은 o-시리즈 추론 기술과 통합되어 5월 말에 출시될 GPT-4.5의 길을 열 것입니다. GPT-XNUMX의 출시는 기술적 업그레이드일 뿐만 아니라 인간-기계 협업 모델의 재구성이기도 합니다. 높은 가격과 컴퓨팅 파워 병목 현상은 논란의 여지가 있지만, 감정적 공명과 실용성에서 획기적인 진전을 이루어 AI를 교육, 의료 및 기타 분야에 통합하는 새로운 패러다임을 제공합니다. AI는 무한한 개발 잠재력을 가지고 있습니다!
GPT 4.5에 대한 일반적인 FAQ
그 한계는 무엇입니까?
그것은 사고의 사슬 추론이 부족하고, 크기 때문에 더 느릴 수 있습니다. 또한 오디오나 비디오와 같은 멀티모달 출력을 생성하지 않습니다.
100% 정확한 답변을 내놓을 수 있나요?
아니요. GPT-4.5는 일반적으로 이전 모델보다 환각이 적지만 사용자는 여전히 중요하거나 민감한 출력을 확인해야 합니다.
GPT-4.5는 이미지를 지원합니까?
네, GPT-4.5는 이미지 입력을 허용하고, SVG 이미지를 인라인으로 생성하고, DALL·E를 통해 이미지를 생성할 수 있습니다.
GPT-4.5는 웹 검색을 지원하나요?
네, GPT-4.5는 검색 기능을 통해 최신 정보에 접근할 수 있습니다.
어떤 파일이나 파일 유형과 호환되나요?
GPT-4.5는 모든 파일과 파일 유형을 지원합니다.
