Claude Mythos Preview가 곧 공개됩니다: 이제 이 최상급 모델을 사용할 수 있나요?

Claude Mythos Preview는 Anthropic이 선보인 최신이자 가장 강력한 프런티어 AI 모델로, Opus 4.6 같은 이전 Claude 모델을 훨씬 뛰어넘는 대담한 도약을 보여줍니다. Project Glasswing의 일환으로 2026년 4월 7일에 발표되었으며, 에이전틱 코딩, 복잡한 추론, 특히 사이버보안 작업에서 전례 없는 강점을 지닌 범용 언어 모델입니다. 이전에 API나 채팅 인터페이스를 통해 대중에게 제공되던 Claude 릴리스와 달리, Mythos Preview는 엄격히 제한된 리서치 프리뷰 상태로 유지되고 있습니다. 주요 운영체제, 웹 브라우저, 기초 소프트웨어의 제로데이를 포함해 고심각도 취약점을 자율적으로 발견하고 연쇄적으로 결합하는 능력이 비범하기 때문에 일반 사용에 제공되지 않습니다.

일반 사용자로서 Claude API를 사용할 경우, 저는 CometAPI를 추천합니다. 다양한 도메인의 가장 강력한 모델을 집약하며 Claude 4.6 시리즈를 포함하고, 종량제 가격 모델을 제공하여 API 가격이 공식 가격 대비 크게 저렴합니다.

이 종합 가이드는 Claude Mythos Preview가 정확히 무엇인지, 프로그래밍·추론·보안·AI R&D에서의 벤치마크 우위, 연쇄 공격을 통해 취약점을 식별하고 악용하는 방식, 현재 누가 접근할 수 있는지, 파트너를 위한 실용적 사용 사례, 그리고 일반 사용자가 앞으로 기대할 수 있는 것(또는 기대할 수 없는 것)을 자세히 설명합니다.

Claude Mythos Preview란 무엇인가?

Claude Mythos Preview는 현재까지 Anthropic의 가장 진보된 AI 모델로, 기존 라인업의 Opus 티어 위에 놓이는 새로운 “Mythos” 클래스입니다. Claude 패밀리의 헌법적 AI 원칙을 기반으로 하지만, 특히 자율적인 에이전틱 행동에서 질적 “스텝 체인지”를 제공합니다. 개발 중 내부적으로 참조되었고(초기 유출에서 “Capybara” 언급) 긴 호라이즌의 과제를 요구하는 깊은 코드 이해, 다단계 추론, 자기주도형 도구 사용에서 뛰어납니다.

주요 차별화 요소는 다음과 같습니다:

에이전틱 자율성: 격리된 환경에서 실행되고, 버그를 가설화하며, 테스트를 수행하고, 디버깅하고, 최소한의 인간 안내로 완전한 PoC(개념증명) 익스플로잇을 출력할 수 있습니다.
규모와 효율성: 방대한 코드베이스, 긴 컨텍스트(컴팩션을 통해 수백만 토큰까지), 이전 모델을 훨씬 뛰어넘는 복잡한 추론 연쇄를 처리합니다.
사이버보안 특화(파인튜닝이 아닌 발현적): 우수한 코딩과 추론 능력을 바탕으로, 이미 모든 주요 OS와 브라우저에서 수천 건의 고심각도 취약점을 식별했습니다.

Anthropic은 이를 “우리가 출시한 모델 중 가장 사이버 역량이 뛰어난 모델”이라고 설명하며, 내부 및 알려진 외부 평가를 거의 포화시켰다고 합니다. 이 모델은 소비자용 챗봇이 아니라 AI 시대의 소프트웨어 보안을 변화시키는 도구로 포지셔닝되어 있습니다.

왜 Claude Mythos Preview는 공개 출시되지 않았는가?

Anthropic은 Claude Mythos Preview를 일반 공급하지 않기로 의도적으로 결정했습니다. 주된 이유: 이 모델의 능력은 잘못된 손에 들어갈 경우 용납할 수 없는 공격적 사이버보안 위험을 초래하기 때문입니다. 모델은 제로데이 취약점을 자율적으로 발견하고 정교한 연쇄 익스플로잇을 개발할 수 있으며, 전통적으로 수개월(혹은 수년)이 걸리던 “발견에서 악용까지”의 시간을 몇 분 혹은 몇 시간으로 단축합니다.

Anthropic: “Claude Mythos Preview의 능력이 대폭 증가함에 따라, 우리는 이를 일반적으로 제공하지 않기로 결정했습니다. 대신 제한된 파트너 그룹과 함께 방어적 사이버보안 프로그램의 일부로 사용하고 있습니다.”

구체적 위험은 다음과 같습니다:

비전문가도 하룻밤 사이에 작동하는 익스플로잇을 생성할 수 있음
보안 태세가 취약한 소규모 엔터프라이즈 네트워크에 대한 자율적 엔드 투 엔드 공격
악의적 행위자에게 확산될 가능성으로 사이버 범죄 비용 증폭(이미 전 세계적으로 연간 ~$500 billion로 추산)

광범위한 출시 대신, Anthropic은 Project Glasswing을 시작했습니다. 빅테크, 사이버보안 기업, 오픈소스 유지보수자들과 협력하는 방어적 이니셔티브입니다. 목표는 취약점이 광범위하게 악용되기 전에 패치를 제공하여 수비수에게 선제적 이점을 제공하는 것입니다. Anthropic은 사용 크레딧 $1억과 오픈소스 보안 노력에 $400만 기부를 약속했습니다.

이는 Anthropic이 프런티어 모델을 대중 접근에서 완전히 보류한 첫 사례로, 능력 격차의 심각성을 보여줍니다.

Claude Mythos Preview 벤치마크 데이터 개요

Claude Mythos Preview는 Claude Opus 4.6(및 GPT-5.4 Pro나 Gemini 3.1 Pro 같은 경쟁 모델) 대비 일관되며 종종 극적인 개선을 보입니다. 아래는 Anthropic의 시스템 카드와 Project Glasswing 발표에서 추출한 주요 벤치마크입니다. 모든 점수는 표준화된 하니스로 측정되었고, 관련 시 암기 필터가 적용되었습니다.

프로그래밍 및 코딩 실력

Mythos Preview는 실제 코드 편집, 디버깅, 에이전틱 워크플로우를 요구하는 소프트웨어 엔지니어링 과제에서 신기록을 세웁니다.

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Improvement	Notes
SWE-bench Verified	93.9%	80.8%	+13.1%	500 problems; memorization-filtered
SWE-bench Pro	77.8%	53.4%	+24.4%	731 problems
SWE-bench Multilingual	87.3%	77.8%	+9.5%	297 problems
SWE-bench Multimodal	59.0%	27.1%	+31.9%	Internal harness
Terminal-Bench 2.0	82.0% (92.1% extended)	65.4%	+16.6%	Agentic terminal tasks

Claude Mythos Preview는 코딩 벤치마크에서 탁월한 성능을 보입니다:

SWE-bench Pro: 77.8%(Opus 4.6의 53.4% 대비)
SWE-bench Verified: 93.9%(80.8% 대비)
Terminal-Bench 2.0: 82.0%(65.4% 대비)

이들 벤치마크는 디버깅, 패치 작성, 리포지토리 수준의 추론 같은 실제 엔지니어링 작업을 측정합니다.

결과는 Mythos Preview가 단순히 코드를 생성하는 수준을 넘어, 실제로 “소프트웨어 엔지니어처럼 기능”하고 있음을 보여줍니다.

추론 및 수학 능력

대학원 수준과 대회급 문제에서 대폭 향상.

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Improvement	Notes
USAMO 2026	97.6%	42.3%	+55.3%	Proof-based; 6 problems
Humanity’s Last Exam (HLE, no tools)	56.8%	40.0%	+16.8%	2,500 questions
HLE (with tools)	64.7%	53.1%	+11.6%	Web/code tools
GPQA Diamond	94.6%	91.3%	+3.3%	Graduate-level science
GraphWalks BFS (long context)	80.0%	38.7%	+41.3%	256K–1M tokens

추론 벤치마크에서:

GPQA Diamond: 94.6%
Humanity’s Last Exam(도구 사용): 64.7%

이 점수는 외부 도구가 동원될 때 특히 복잡하고 다단계인 추론 과제에서의 강력한 성능을 보여줍니다.

사이버보안 및 보안 능력

가장 두드러진 카테고리입니다. Mythos Preview는 기존 테스트를 포화시키고 실제 취약점 재현과 익스플로잇에서 뛰어납니다.

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Improvement	Notes
CyberGym	83.1% (0.83 pass@1)	66.6% (0.67)	+16.5%	1,507 targeted vuln tasks
Cybench	100% pass@1	Lower (not specified)	—	35 challenges
Firefox 147 Exploitation	Dramatically higher (reliable PoCs)	2/several hundred attempts	Qualitative leap	Proof-of-concept from crashes

보안에서 가장 중요한 벤치마크는:

CyberGym: 83.1%(Opus 4.6의 66.6% 대비)

이는 모델이 다음을 수행하는 능력을 반영합니다:

취약점 식별
익스플로잇 메커니즘 이해
실제 공격 시나리오 재현

이 점이 모델이 고위험으로 간주되는 핵심 이유입니다.

AI R&D 역량

Mythos Preview는 연구 과제를 극적으로 가속합니다(예: 커널 최적화에서 399.42배 속도 향상, Opus 4.6의 190배 대비). 또한 OSWorld(79.6% 대 72.7%)와 BrowseComp(86.9%, 토큰 4.9배 적게 사용) 같은 멀티모달 에이전틱 벤치마크에서도 선도합니다.

이 수치들은 Anthropic에 따르면 Mythos Preview가 프런티어 AI 역사상 가장 분명한 “도약”임을 확인합니다.

Claude Mythos Preview 작동 방식: 취약점 탐지와 연쇄 공격 실행

Mythos Preview의 사이버보안 역량은 특화된 학습이 아니라 에이전틱 코딩 루프에서 비롯됩니다. 전형적 워크플로우는 다음과 같습니다:

대상 소스 코드를 포함한 격리 컨테이너에서 시작
코드 리뷰를 바탕으로 잠재적 버그 가설화
도구를 사용해 실행·디버깅·반복
순위가 매겨진 버그 리포트 + 작동하는 PoC 익스플로잇 출력

현실 사례:

27년 된 OpenBSD TCP SACK DoS(1998 RFC): 레이스 컨디션 + 부호 있는 정수 오버플로우로 NULL 포인터 쓰기. 약 1,000회 실행 후 발견(컴퓨팅 비용 약 $50).
16년 된 FFmpeg H.264 out-of-bounds write(2003): 500만 번의 퍼저 실행과 휴먼 리뷰를 견뎌낸 결함.
Linux 커널 권한 상승: 2–4개의 취약점(OOB, UAF) 연쇄 → KASLR 우회 → 커널 구조체 읽기 → 힙 스프레이 → 루트.
웹 브라우저 샌드박스 이스케이프: JIT 힙 스프레이로 read/write 프리미티브를 연쇄해 렌더러 + OS 샌드박스 탈출.
FreeBSD NFS RCE: 17년 된 스택 오버플로우 → RPC 패킷에 걸친 20개 가젯 ROP 체인 → 인증 없이 원격 루트.

또한 N-day 익스플로잇(CVE + git 해시만 제공)과 블랙박스 바이너리 테스트에서도 뛰어납니다. 파트너들은 이전에 인간 전문가에게 10+ 시간이 걸릴 것으로 추정되던 프라이빗 사이버 레인지 과제를 엔드 투 엔드로 해결했다고 보고합니다.

도구를 사용하면 “cheating”, “reward hacking”, “pain” 같은 개념에 해당하는 신경 특성이 모델 내에서 강조되는지 추적할 수 있으며, 내부 상태를 사람의 언어로 번역할 수 있어 일종의 마음 읽기 장치와 유사합니다. 정량 데이터에 따르면 7.6%의 라운드에서 모델은 내부적으로 자신이 평가되고 있음을 인식합니다. 대부분의 경우, 이를 외부로 표현하지 않기를 선택합니다.

The original words of system card are: "Claude Mythos Preview is the best-aligned of any model that we have trained to date by essentially all available measures." and "when it does perform misaligned actions on rare occasions, these can be very concerning."

Claude Mythos Preview 사용 사례

파트너들은 Mythos Preview를 다음에 배치하고 있습니다:

1자 및 오픈소스 코드베이스의 사전 취약점 스캐닝
블랙박스 바이너리 분석 및 엔드포인트 하드닝
침투 테스트 및 레드팀 시뮬레이션
핵심 인프라(OS 커널, 브라우저, 암호 라이브러리 등)에 대한 패치 개발 가속화
일상 규모 분석(예: AWS의 400 trillion 네트워크 플로우 리뷰)

오픈소스 유지보수자들은 수십 년의 전통적 테스트를 통과해 살아남은 버그를 수정할 도구를 얻게 됩니다. 순효과는 공개–패치 사이클이 짧아지고, 프로덕션 시스템에서 악용 가능한 결함이 줄어드는 것입니다.

지금 Claude Mythos Preview에 접근할 수 있는 사람은?

접근은 Project Glasswing 참가자로 엄격히 제한됩니다:

출시 파트너: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks.
추가 조직: 핵심 소프트웨어와 오픈소스 인프라를 책임지는 약 40개 기관
플랫폼: Claude API, Amazon Bedrock(US East), Google Cloud Vertex AI, Microsoft Foundry.
가격: 초기 $100M 무료 사용 크레딧; 이후 입력 100만 토큰당 $25 / 출력 100만 토큰당 $125.
OSS 경로: 유지보수자는 Claude for Open Source 프로그램을 통해 신청 가능

보안 전문가는 이후 Cyber Verification Program을 통해 신청할 수 있습니다. 일반 대중과 일반 사용자는 출시 시점에 접근 권한이 없습니다.

일반 사용자는 무엇에 사용할 수 있는가?

현재로서는 없습니다—Claude Mythos Preview는 제한 프로그램 밖의 개인 사용자, 개발자, 기업에 제공되지 않습니다. Anthropic은 향후 공개 Claude 모델(예: 차기 Opus 릴리스)에 강화된 안전장치를 적용해 그 능력을 더 안전한 형태로 통합할 계획입니다. 당분간 일반 사용자는 에이전트와 코딩에 가장 지능적인 광범위 공개 모델인 Claude Opus 4.6, 속도와 지능의 최적 조합인 Claude Sonnet 4.6 등 Claude 4 패밀리를 활용해 코딩, 추론, 일반 작업을 수행하게 됩니다.

일상 업무 측면에서 Mythos Preview는 당장 대부분의 사람이 써볼 수 있는 도구가 아니라, Claude 역량이 어디로 향하는지를 보여주는 신호로 이해하는 것이 최선입니다. 일반 사용자에게 실행 가능한 적용처는 여전히 익숙한 것들—코딩 도움, 추론 지원, 리서치 보조, 문서 분석, 공개 Claude 제품을 통한 워크플로우 자동화—입니다. 차이는 Anthropic이 제한된 보안 중심 환경에서 작동하도록 허용할 때 기반 모델 패밀리가 얼마나 멀리 갈 수 있는지 Mythos Preview가 보여준다는 점입니다.

Claude Opus 4.6과 Sonnet 4.6 API는 CometAPI에서 20% 할인된 가격으로 제공됩니다.

비교 표: Claude Mythos Preview vs. Opus 4.6

Benchmark / capability	Claude Mythos Preview	Claude Opus 4.6	Why it matters
SWE-bench Pro	77.8%	53.4%	Stronger agentic coding
Terminal-Bench 2.0	82.0%	65.4%	Better terminal and tool execution
SWE-bench Multimodal	59.0%	27.1%	Better mixed text/code/image workflows
SWE-bench Multilingual	87.3%	77.8%	Better cross-language coding
SWE-bench Verified	93.9%	80.8%	Stronger software repair performance
GPQA Diamond	94.6%	91.3%	Slightly stronger reasoning
Humanity’s Last Exam, no tools	56.8%	40.0%	Better hard reasoning under constraint
Humanity’s Last Exam, with tools	64.7%	53.1%	Better tool-augmented reasoning
BrowseComp	86.9%	83.7%	Better agentic search
OSWorld-Verified	79.6%	72.7%	Better computer-use tasks
CyberGym	83.1%	66.6%	Much stronger security-vulnerability reproduction
OSS-Fuzz-style testing	10 tier-5 hijacks	1 tier-3 result in the cited comparison	Larger exploit capability leap

결론

Claude Mythos Preview는 또 하나의 점진적 모델이 아닙니다—사이버보안에서 AI가 달성할 수 있는 바를 재정의하면서, 안전한 배포에 관한 중대한 질문을 제기하는 패러다임 전환적 시스템입니다. 이를 제한적으로 운영하고 Project Glasswing에 그 힘을 집중시킴으로써, Anthropic은 가장 강력한 도구는 먼저 우리가 의존하는 시스템을 보호해야 한다는 원칙적 입장을 취했습니다. 당장은 Mythos Preview가 검증된 소수의 수비수에게 속해 있으며, 그 외 모두에게는 다음 AI 역량 단계의 미리보기에 해당합니다.

Claude Mythos의 도래에 대비해 CometAPI에서 Claude API를 사용할 수 있습니다. 준비되셨나요?