Claude Mythos(Opus 5) 유출: 무슨 일이 있었고 앞으로 무엇을 기대할 수 있나

2026년 3월 29일 현재, “Claude Mythos” 이야기는 공식 공개 출시라기보다 Anthropic의 다음 큰 도약으로 보이는 사전 미리보기 유출에 가깝다. 회사는 공개 검색 가능한 데이터 캐시에 블로그 초안 콘텐츠를 실수로 노출해, Anthropic이 “획기적 변화(step change)”이자 “지금까지 우리가 개발한 것 중 가장 강력한 모델”이라고 묘사한 미공개 모델을 드러냈다. Anthropic는 소수의 얼리 액세스 고객과 함께 해당 모델을 개발·테스트 중임을 확인했다.

이 점이 중요한 이유는 Anthropic의 현재 공개 모델 라인업이 여전히 Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5를 중심으로 하고 있기 때문이다. 즉, 이번 유출은 확인된 공개 제품 출시가 아니라 Anthropic이 준비 중일 수 있는 다음 티어를 엿보게 하는 유출이다.

현재 CometAPI는 이미 Claude Opus 4.6 및 Claude Sonnet 4.6과 같은 최첨단 Claude 모델에 대한 API를 제공하고 있다. Claude Mythos가 CometAPI에 등록되는 즉시, Gemini와 OpenAI의 최상위 모델과의 비교 테스트를 수행할 수 있다. CometAPI는 최고의 모델을 집대성한다.

Claude Mythos란 무엇인가?

Claude Mythos는 현재까지 Anthropic의 가장 진보한 AI 모델로, 유출된 내부 문서에서는 “우리가 개발한 AI 모델 중 단연 가장 강력하다”고 묘사되어 있다. 이는 지금까지 Claude 능력의 정점이었던 Opus 라인업 위에 위치하는 새로운 성능 티어—내부적으로 “Capybara”라고 불림—를 도입한다.

Anthropic의 현재 모델 패밀리는 명확한 계층을 따른다:

Opus: 가장 크고 가장 능력이 뛰어나며 가장 비쌈(예: Claude Opus 4.6 및 2025년 11월에 출시된 이전 Opus 4.5).
Sonnet: 속도와 지능의 균형.
Haiku: 가벼운 작업에 가장 빠르고 비용 효율적.

Mythos/Capybara는 훨씬 더 크고 연산 집약적인 모델로 이 틀을 깨뜨린다. 블로그 초안에는 “지금까지 가장 강력했던 Opus 모델보다 더 크고 더 지능적”이라고 명시되어 있다. “Mythos”라는 이름은 “지식과 아이디어를 연결하는 깊은 결합 조직”을 떠올리게 하려는 의도로 지어졌으며, 도메인 전반에서 더 깊고 통합적인 추론을 시사한다.

이는 사소한 점진적 업데이트가 아니다. Anthropic 대변인은 회사가 “추론, 코딩, 사이버보안에서 의미 있는 진전을 보인 범용 모델을 개발 중”이며, 이를 “획기적 변화이자 지금까지 우리가 만든 모델 중 가장 능력이 뛰어난 모델”로 본다고 확인했다. 훈련은 완료되었고, 현재 소수의 얼리 액세스 고객과 함께 실제 환경 테스트가 진행 중이다.

맥락을 위해 보면, Claude의 발전은 매우 빠르게 진행됐다. Claude 3 Opus(2024)가 초기 벤치마크를 세운 뒤 Claude 3.5 Sonnet, Claude 4 변형, 그리고 2025년의 Opus 4.5/4.6이 뒤를 이었다. Mythos는 논리적으로 그 후속작—커뮤니티가 “Opus 5”로 추정해 온—으로 보이며, 프런티어 AI를 새로운 영역으로 밀어 올리는 동시에 중대한 안전성 문제를 제기한다.

Claude Mythos는 어떻게 유출되었나?

유출은 2026년 3월 27일 무렵, Anthropic의 콘텐츠 관리 시스템(CMS)에서 발생한 단순하지만 당혹스러운 사람 실수에 의한 설정 오류로 일어났다. 초안 블로그 게시물, 이미지, PDF, 오디오 파일, 내부 문서를 포함한 거의 3,000개의 미공개 자산이 공개 검색 가능한 데이터 저장소(일명 “data lake”)에 방치되어 있었다.

자산은 기본적으로 “공개”로 설정되어 있었고 URL을 추측할 수 있었다. 보안 연구원 Roy Paz(LayerX Security)와 Alexandre Pauwels(University of Cambridge)가 이 캐시를 발견해 언론에 알렸다.

유출된 자료에는 다음이 포함됐다:

거의 동일한 두 개의 블로그 초안(하나는 “Claude Mythos”, 다른 하나는 “Claude Capybara”를 제목으로 사용).
제목과 예정된 게시 날짜가 포함된 구조화된 웹페이지 데이터.
과거 출시에서 사용되지 않은 마케팅 자산.
Anthropic CEO Dario Amodei가 주최한 초대 전용 CEO 리트릿에 관한 내부 PDF.

Anthropic는 CMS 구성의 “사람 실수”였음을 신속히 확인하고 공개 접근을 차단했다. 악의적 의도나 모델 가중치 유출을 시사하는 증거는 없으며, 마케팅 및 기획 문서만 노출된 것으로 보인다.

이 사건은 AI 업계의 커져가는 취약성을 부각한다. 빠른 반복과 내부 문서화 속도가 안전한 게시 워크플로를 앞지르는 경향이 있다는 점이다. 다른 연구소에서도 유사한 유출이 있었지만, 이번 사건은 공개되지 않은 플래그십 모델에 대해 이례적으로 자세한 통찰을 제공했다.

유출된 벤치마크와 성능 주장

정확한 수치 점수는 유출된 초안에 공개되지 않았으며, Anthropic도 아직 공식 벤치마크를 발표하지 않았다. 그러나 서술은 두 초안 모두에서 명확하며 일관된다:

“이전의 최고 모델인 Claude Opus 4.6과 비교해, Capybara는 소프트웨어 코딩, 학술적 추론, 사이버보안 등 다양한 테스트에서 극적으로 더 높은 점수를 획득합니다.”

이 모델은 또한 “현재 사이버 역량 면에서 다른 어떤 AI 모델보다 훨씬 앞서” 있으며, “방어자들의 대응을 훨씬 앞지르는 방식으로 취약점을 악용할 수 있는 모델의 물결을 예고한다”고 묘사된다.

이 벤치마크 범주들은 실제로 무엇을 측정하나?

Software Coding(예: SWE-Bench Verified, HumanEval, LiveCodeBench): 버그 수정, 기능 구현, 리포지토리 수준의 이해 등 실제 소프트웨어 엔지니어링 과제. Opus 4.6은 이미 많은 코딩 리더보드에서 선두권이었고, 여기서 “극적인” 도약이 사실이라면 Mythos는 현재 시니어 엔지니어가 필요한 복잡한 다중 파일 코드베이스를 자율적으로 처리할 수 있음을 의미한다.
Academic Reasoning(예: GPQA, MMLU-Pro, MATH, FrontierMath): 대학원 수준의 과학·수학·다단계 논리 문제. 향상은 더 강한 연쇄적 추론과 지식 종합 능력을 시사한다.
Cybersecurity: 취약점 발굴, 익스플로잇 생성, 레드팀 시뮬레이션, 방어 강화. 가장 강조된—그리고 가장 우려스러운—영역이다.

이전 Claude 모델(Opus 4.5/4.6)이 이미 강력한 결과를 달성했지만(예: Opus 4.5는 SWE-Bench Verified에서 ~80.9%를 기록), 유출된 주장은 Mythos를 질적으로 다른 급에 위치시킨다.

모델 특성 및 기술 프로필

벤치마크 외에도, 초안은 다음과 같은 핵심 특성을 보여준다:

Scale and Cost: “우리가 제공하기에도 매우 비싸며, 고객이 사용하기에도 매우 비쌀 것.” 이는 막대한 파라미터 규모와 높은 추론 비용을 시사하며, 초기에는 엔터프라이즈 및 고부가가치 용도에 한정될 가능성이 크다.
Reasoning Depth: 지식 도메인 간 “깊은 결합 조직”에 대한 강조는 뛰어난 장문 컨텍스트 이해와 교차 도메인 종합을 시사한다.
Agentic Capabilities: 초기 접근은 고급 코딩 에이전트와 사이버보안 도구가 필요한 조직에 초점을 둔 것으로 보인다.
Safety-First Philosophy: Anthropic의 헌법적 AI 접근과 일관되게, 특히 사이버보안에서의 위험 평가를 폭넓은 출시 이전에 우선한다.

사이버보안 함의: 가장 큰 경고 신호

가장 눈에 띄는 점은 모델의 이중용도 가능성에 대한 Anthropic 자체의 경고다. 사이버 역량에서 “멀리 앞서” 있기에, Mythos는 다음을 가능케 할 수 있다:

제로데이 취약점의 자율적 발굴
대규모 정교한 익스플로잇 코드 생성
방어자가 대응하기 전에 더 빠르게 고도화된 지속 위협(APT) 시뮬레이션

초안은 회사가 “각별한 주의를 기울여 행동”하고, “다가오는 AI 기반 익스플로잇의 물결”에 대비하도록 방어자들과 결과를 공유하고자 한다고 명시한다.

시장 반응은 즉각적이었다. 사이버보안주는 2026년 3월 27~28일에 급락했는데, 공격적 AI 역량이 방어 도구를 앞지를 수 있다는 위험이 가격에 반영된 것이다.

이는 더 넓은 업계 추세와도 일치한다. OpenAI 역시 GPT-5.3-Codex와 같은 모델에서 높은 사이버 역량을 경고해 왔다. 실제 사건에서도 국가 행위자(예: 중국의 한 그룹)가 침투 작전에 Claude 변형을 사용한 사례가 이미 나타났다. Mythos는 이러한 위협을 더욱 증폭시킬 수 있다.

긍정적 측면: 방어 조직이 조기 접근을 통해 보안 코딩, 자동 패치, 위협 헌팅을 가속화할 수 있어, 장기적으로 인터넷을 더 안전하게 만드는 데 기여할 수 있다.

비교 표: Claude Mythos vs. 이전 모델

Aspect	Claude Opus 4.6 (현재 플래그십)	Claude Mythos / Capybara (유출)	핵심 요지
Tier	Opus	새로운 “Capybara” 티어(Opus 상위)	아키텍처의 큰 도약
Coding Performance	강함(예: ~80.9% SWE-Bench)	극적으로 더 높음	시니어 엔지니어 생산성과 견줄/능가할 잠재력
Academic Reasoning	뛰어남	극적으로 더 높음	더 깊은 다단계 논리와 지식 통합
Cybersecurity	유능함(취약점 탐지)	현존 어떤 모델보다 크게 앞섬	질적 도약; 듀얼유스 위험 증대
Inference Cost	높음(Opus 가격대)	매우 높음(더 높은 비용)	초기에는 엔터프라이즈 한정
Release Status	일반 제공 중	얼리 액세스 테스트만	안전을 우선한 점진적 롤아웃
Overall Capability	2025년 기준 최첨단	“획기적 변화” / “역대 최고 성능”	새로운 프런티어 벤치마크

결론: 다음 AI 시대를 엿보게 한 유출

Claude Mythos 유출은 Anthropic의 로드맵을 여과 없이 보여주는 드문 사례다. 이는 핵심 역량에서 진정한 “획기적 변화”를 달성했음을 확인하는 동시에, 그러한 강력함과 함께 따르는—특히 사이버보안에서의—심대한 위험을 인정한다. 이름이 Opus 5이든 새로운 Capybara 티어이든, Mythos는 프런티어 AI가 역량이 안전한 배포 타임라인을 앞지르는 국면으로 접어들었음을 알린다.

CometAPI 이용을 시작할 준비가 되셨나요? 먼저 회원으로 가입해 무료 $1 크레딧을 받고, Claude Mythos가 라이브될 때 알림을 받으세요.