OpenAI가 출시를 발표했습니다. GPT-OSS, 두 개의 개방형 언어 모델로 구성된 패밀리—gpt-oss-120b 및 gpt-oss-20b—GPT-2.0 이후 첫 번째 주요 오픈웨이트(open-weight) 제공을 위한 관대한 Apache 2 라이선스에 따라 제공됩니다. 5년 2025월 XNUMX일에 발표된 이 발표는 이러한 모델이 독점적인 대안에 비해 훨씬 저렴한 비용으로 최첨단 추론 성능을 제공하며, 무엇보다도 로컬 및 클라우드 인프라 모두에 구축할 수 있다는 점을 강조합니다.
기술 아키텍처
GPT-OSS 시리즈는 다음을 활용합니다. 전문가 혼합(MoE) 성능과 효율성의 균형을 맞추는 변압기 아키텍처.
- gpt-oss-120b: 총 매개변수는 117억 개이며, 토큰당 5.1억 개의 매개변수를 활성화하고, 전문가 128명(토큰당 4명 활성화)을 고용하고, 36개 계층으로 구성됩니다.
- gpt-oss-20b: 총 매개변수는 21억 개이며, 토큰당 3.6억 개의 매개변수를 활성화하고, 전문가 32명(토큰당 4명 활성화)을 고용하고, 24개 계층으로 구성됩니다.
두 모델 모두 메모리 효율적인 추론을 위해 교대로 밀집되고 국소적으로 대역화된 희소한 주의 패턴과 그룹화된 다중 쿼리 주의를 사용합니다.
성능 및 안전성 평가
OpenAI는 다음과 같이 보고합니다. gpt-oss-120b 경쟁 코딩(Codeforces), 일반 문제 해결(MMLU 및 HLE), 건강 관련 쿼리(HealthBench)를 포함한 다양한 내부 벤치마크에서 자사 독점 o4-mini 모델의 성능과 동일하거나 더 뛰어난 성능을 보였습니다. 한편, gpt-oss-20b 크기가 작음에도 불구하고 경쟁 수학(AIME 3 및 2024)과 건강 작업에서 기존 o2025-mini보다 우수한 성능을 보입니다.
또한, 외부 전문가들이 안전 방법론을 검토하여 OpenAI의 폐쇄형 가중치 제품과 동일한 엄격한 안전 기준을 준수함을 확인했습니다. OpenAI의 안전 자문 그룹은 또한 고위험 기능(생물, 화학, 사이버)을 탐색하기 위해 gpt-oss-120b를 적대적으로 미세 조정했습니다. 그러나 개방형 가중치 공개가 기존 개방형 모델보다 이러한 위협 벡터를 크게 강화한다는 증거는 발견되지 않았습니다.
접근성 및 배포
GPT OSS의 주요 이정표는 다음과 같습니다. 로컬 실행:
- gpt-oss-20b 최신 GPU가 장착된 고성능 노트북에서 실행 가능하므로 오프라인 또는 온프레미스 애플리케이션이 가능합니다.
- gpt-oss-120b 단일 엔터프라이즈급 GPU에서 실행되도록 최적화되어 있어 대규모 컴퓨팅 클러스터가 없는 중간 규모 조직에서도 사용할 수 있습니다.
- 데이터 주권 및 개인정보 보호: GPT-OSS는 모든 추론을 사내에서 처리하므로 금융, 의료, 정부와 같은 분야에 중요한 규제 및 보안 위험이 최소화됩니다.
- 원활한 통합: Hugging Face Transformers(v4.55.0)의 사전 구성된 지원과 Northflank의 컨테이너화된 배포 가이드를 통해 로컬 서버를 실행하는 것만큼 간단하게 GPT-OSS를 시작할 수 있습니다.
OpenAI의 CEO인 샘 알트먼은 "GPT OSS를 통해 개발자와 조직이 최첨단 AI를 완전 소유 및 맞춤형 자산으로 활용할 수 있도록 지원합니다."라고 말했습니다. "이번 출시는 최고 수준의 안전성과 성능 기준을 유지하는 동시에 고급 언어 모델에 대한 접근성을 확대하는 전환점을 마련합니다."
OpenAI는 이러한 강력한 모델을 오픈소스로 공개함으로써 더욱 역동적인 혁신 생태계를 조성하고, 맞춤형 미세 조정, 새로운 플러그인, 그리고 AI를 발전시키는 창의적인 애플리케이션을 장려하고자 합니다. 개발자와 기업은 OpenAI의 GitHub 저장소에서 모델을 즉시 다운로드하여 로컬 추론, 맞춤형 통합, 그리고 특화된 안전성 평가를 실험해 볼 수 있습니다.
시작 가이드
CometAPI는 OpenAI의 GPT 시리즈, Google의 Gemini, Anthropic의 Claude, Midjourney, Suno 등 주요 공급업체의 500개 이상의 AI 모델을 단일 개발자 친화적인 인터페이스로 통합하는 통합 API 플랫폼입니다. CometAPI는 일관된 인증, 요청 형식 지정 및 응답 처리를 제공하여 애플리케이션에 AI 기능을 통합하는 과정을 획기적으로 간소화합니다. 챗봇, 이미지 생성기, 음악 작곡가 또는 데이터 기반 분석 파이프라인 등 어떤 제품을 구축하든 CometAPI를 사용하면 AI 생태계 전반의 최신 혁신 기술을 활용하면서 반복 작업을 더 빠르게 수행하고 비용을 관리하며 공급업체에 구애받지 않을 수 있습니다.
개발자는 액세스할 수 있습니다 GPT-OSS-20B 및 GPT-OSS-120B 을 통하여 코멧API, 나열된 최신 모델 버전은 기사 발행일을 기준으로 합니다. 시작하려면 모델의 기능을 살펴보세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. 코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.
