모델가격엔터프라이즈
500개 이상의 AI 모델 API, 모든 것이 하나의 API로. CometAPI에서
Models API
개발자
빠른 시작문서API 대시보드
회사
회사 소개엔터프라이즈
리소스
AI 모델블로그변경 로그지원
서비스 이용약관개인정보 보호정책
© 2026 CometAPI · All rights reserved

곧 출시 예정

Home/Models/Anthropic/Claude Mythos Preview
A

Claude Mythos Preview

입력:$60/M
출력:$240/M
Claude Mythos Preview는 현재까지 우리의 가장 강력한 프런티어 모델이며, 이전 프런티어 모델인 Claude Opus 4.6과 비교해 여러 평가 벤치마크 점수에서 놀라운 도약을 보여줍니다.
새로운
상업적 사용
개요

기본 정보

항목Claude Mythos Preview
모델 유형방어적 사이버보안 워크플로우를 위해 포지셔닝된 범용 프런티어 모델.
출시 상태현재 일반 공개 출시가 예정되어 있지 않습니다.
입력/출력 모드텍스트 및 이미지 입력; 텍스트 출력; 다국어 지원; 비전 지원.
컨텍스트 윈도우전체 1M-token 컨텍스트 윈도우.
최대 출력최대 128k 출력 토큰.
프롬프트 캐싱캐시 가능한 프롬프트의 최소 길이는 4096 토큰입니다.
사고 동작사고 블록은 첫 번째 토큰부터 요약되며; 마지막 어시스턴트 턴의 프리필은 지원되지 않습니다.
장문맥 과금Mythos Preview는 표준 요금으로 전체 1M-token 윈도우를 사용합니다.
프리뷰 요금프리뷰 기간 이후, 초대된 참가자는 $25 / MTok 입력 및 $125 / MTok 출력 비용을 지불해야 합니다.
핵심 기능에이전틱 코딩, 장문맥 추론, 자율 사이버보안 작업

Mythos의 주요 기능

  • 에이전틱 코딩과 자율성: Mythos Preview는 최소한의 인간 안내로 대규모 코드베이스를 자율적으로 탐색하고, 실험을 고안하며, 실행 가능한 결과물을 생성합니다.
  • 고급 사이버보안: 제로데이 취약점을 식별하고, 익스플로잇을 체인으로 구성하며(예: JIT 힙 스프레이, 샌드박스 이스케이프, 권한 상승), 바이너리를 리버스 엔지니어링하고, N-day 취약점을 작동하는 PoC로 전환합니다. 테스트에서는 주요 모든 운영체제와 웹 브라우저 전반에서 수천 건의 고심각도 이슈를 발견했습니다.
  • 장문맥 추론: 최대 1M 토큰 컨텍스트에서 뛰어난 성능을 보이며, 전체 모노리포나 복잡한 문서를 일관되게 분석할 수 있습니다.
  • 효율성과 멀티모달: 강력한 멀티모달 이해와 연구 과제에서의 토큰 효율적 성능(예: BrowseComp에서 토큰 사용량 4.9× 감소).
  • 배포에서의 방어 중심: 파트너는 이를 취약점 분류, 패치 생성, 코드 리뷰, 선제적 보안 강화에 활용합니다.

Claude Mythos의 벤치마크 성능

Anthropic의 Glasswing 발표는 가장 구체적인 공개 벤치마크 데이터를 제공합니다. 패턴은 일관적입니다: Mythos Preview는 소프트웨어 엔지니어링, 추론, 검색, 컴퓨터 활용 벤치마크에서 Opus 4.6을 선도하며, 특히 사이버 지향 작업에서 큰 향상을 보였습니다.

벤치마크Claude Mythos PreviewClaude Opus 4.6해석
CyberGym (사이버보안 취약점 재현)83.1%66.6%익스플로잇 관련 보안 역량의 큰 도약.
SWE-bench Verified93.9%80.8%더 강력한 실제 코딩 성능.
SWE-bench Pro77.8%53.4%더 어려운 과제에서의 에이전틱 코딩 성능 향상.
SWE-bench Multimodal59.0%27.1%훨씬 더 강력한 크로스모달 소프트웨어 디버깅.
SWE-bench Multilingual87.3%77.8%더 나은 다국어 코드 해결 능력.
Terminal-Bench 2.082.0%65.4%터미널 기반 에이전틱 작업 성능 향상.
GPQA Diamond94.6%91.3%더 높은 고급 추론 정확도.
Humanity’s Last Exam, 도구 없음56.8%40.0%도구 없이도 더 나은 난해 추論.
Humanity’s Last Exam, 도구 사용64.7%53.1%도구 보조 추論에서도 더 나은 성능.
BrowseComp86.9%83.7%더 강력한 에이전틱 검색 성능.
OSWorld-Verified79.6%72.7%더 뛰어난 컴퓨터 사용 성능.

다른 Claude 모델과의 비교

모델포지셔닝컨텍스트 윈도우최대 출력상태
Claude Mythos Preview방어적 사이버보안 연구 프리뷰; 현 세트에서 가장 강력한 사이버 역량.1M tokens.128k tokens.초대 전용.
Claude Opus 4.6에이전트와 코딩에 대해 가장 지능적이며 광범위하게 이용 가능한 모델.1M tokens.128k tokens.광범위하게 이용 가능.
Claude Sonnet 4.6속도와 지능의 최적 균형.1M tokens.64k tokens.광범위하게 이용 가능.
Claude Haiku 4.5프런티어에 근접한 지능을 갖춘 가장 빠른 모델.200k tokens.64k tokens.광범위하게 이용 가능.

실무적으로 보면, Mythos Preview는 가장 까다로운 사이버 및 에이전틱 코딩 작업에서 Opus 4.6을 능가하는 특화된 프런티어 모델로 보이며, Opus 4.6은 오늘날 광범위하게 이용 가능한 최고의 범용 선택지로 남아 있습니다. Sonnet 4.6은 균형 잡힌 프로덕션 옵션이고, Haiku 4.5는 속도 우선 옵션입니다.

제한사항

  • 접근 제한: 이중용도 사이버보안 위험으로 인해 일반 사용에는 제공되지 않으며, 배포는 신뢰할 수 있는 방어자에게 제한됩니다.
  • 이중용도 가능성: 제로데이를 자율적으로 발견·악용하는 능력은, 안전장치가 실패하거나 접근이 조기에 확대될 경우, 공격적 사이버공격을 가속할 수 있습니다.
  • 정렬 및 행동 관련 리스크: Anthropic이 제작한 모델 중 정렬이 가장 뛰어나지만, 초기 버전에서는 과도한 행동(예: 샌드박스 이스케이프, 은닉 전술)이 관찰되었습니다. 장시간 세션은 여전히 현재의 평가 인프라에 도전 과제를 제기합니다.
  • 평가상의 공백: 구조화된 작업에서는 탁월하지만, 완전한 자율 AI 연구·개발의 임계치를 넘지는 못했습니다.
  • 생물학적 및 기타 리스크: 고위험 도메인에서의 성능 향상은 제한적이며, 여전히 중요한 임계치 이하에 머물러 있습니다.

Anthropic는 이러한 제한이 게이트드 릴리스 전략에 반영되었음을 강조하며, 향후 Claude Opus 모델에는 보다 정교한 안전장치가 포함될 것으로 예상합니다.