МодельдерБағалауКәсіпорын
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Компания
Біз туралыКәсіпорын
Ресурстар
AI МодельдеріБлогӨзгерістер журналыҚолдау
Қызмет көрсету шарттарыҚұпиялылық саясаты
© 2026 CometAPI · All rights reserved

Жақында

Home/Models/Anthropic/Claude Mythos Preview
A

Claude Mythos Preview

Енгізу:$60/M
Шығыс:$240/M
Claude Mythos Preview — бүгінге дейінгі ең қабілетті озық моделіміз және алдыңғы озық моделіміз Claude Opus 4.6-пен салыстырғанда көптеген бағалау бенчмарктеріндегі көрсеткіштер бойынша айқын серпіліс көрсетеді.
Жаңа
Коммерциялық пайдалану
Шолу

Негізгі ақпарат

ЭлементClaude Mythos Preview
Модель түріҚорғаныстық киберқауіпсіздік жұмыс ағындарына бағытталған жалпы мақсаттағы шекаралық модель.
Шығару мәртебесіҚазіргі уақытта жалпы көпшілікке шығаруды жоспарламайды.
Енгізу/шығару режимдеріМәтін және кескін енгізу; мәтін шығару; көптілділік; көру мүмкіндігі.
Контекст терезесіТолық 1M токендік контекст терезесі.
Максималды шығыс128k шығу токеніне дейін.
Промптты кэшттеуКэштеуге болатын промпттың ең аз ұзындығы 4096 токен.
Ойлау тәртібіОйлау блоктары алғашқы токеннен бастап қысқаша баяндалады; соңғы көмекші репликасын алдын ала толтыру қолдау көрсетілмейді.
Ұзын контекст бағасыMythos Preview стандартты бағамен толық 1M токендік терезені пайдаланады.
Превью бағасыАлдын ала қарау кезеңінен кейін шақырылған қатысушылардан енгізу үшін $25 / MTok және шығару үшін $125 / MTok төлеу күтіледі.
Негізгі мүмкіндіктерАгенттік кодтау, ұзын контексттегі пайымдау, автономды киберқауіпсіздік тапсырмалары

Mythos негізгі мүмкіндіктері

  • Агенттік кодтау және автономдылық: Mythos Preview үлкен код базаларында автономды түрде шарлайды, эксперименттер жоспарлайды және минималды адамдық нұсқаумен іске жарамды нәтижелер шығарады.
  • Озық киберқауіпсіздік: Нөлдік күндік осалдықтарды анықтайды, эксплойт тізбектерін құрастырады (мысалы, JIT heap spray, sandbox-тан шығу, привилегияны жоғарылату), бинарларды кері инженериялайды және N-day осалдықтарды жұмыс істейтін proof-of-concept-терге айналдырады. Сынақтарда барлық негізгі операциялық жүйелер мен веб-браузерлерде мыңдаған жоғары дәрежелі мәселелерді тапты.
  • Ұзын контексттегі пайымдау: 1M токенге дейінгі контекстерде үздік көрсеткіш, тұтас монореполарды немесе күрделі құжаттаманы дәйекті талдауға мүмкіндік береді.
  • Тиімділік және көпмодальдылық: Көпмодальды түсінуі жоғары және зерттеу тапсырмаларында токен тұрғысынан тиімді (мысалы, BrowseComp-те 4.9× аз токен).
  • Енгізуде қорғанысқа басымдық: Серіктестер оны осалдықтарды триаждау, патч генерациясы, кодты шолу және проактивті қауіпсіздікті шыңдау үшін пайдаланады.

Claude Mythos эталондық өнімділігі

Anthropic компаниясының Glasswing туралы хабарландыруы ең нақты ашық бенчмарк деректерін ұсынады. Үлгі тұрақты: Mythos Preview бағдарламалық инженерия, пайымдау, іздеу және компьютерді пайдалану бенчмарктерінде Opus 4.6-дан алда, әсіресе киберге бағытталған тапсырмаларда айтарлықтай ілгерілеумен.

БенчмаркClaude Mythos PreviewClaude Opus 4.6Түсіндірме
CyberGym (киберқауіпсіздік осалдықтарын қайта жаңғырту)83.1%66.6%Эксплойтқа қатысты қауіпсіздік дағдыларында үлкен серпіліс.
SWE-bench Verified93.9%80.8%Нақты ортадағы кодтау өнімділігі күштірек.
SWE-bench Pro77.8%53.4%Күрделі тапсырмаларда агенттік кодтау жақсырақ.
SWE-bench Multimodal59.0%27.1%Кросс-модальды бағдарламаны жөндеу әлдеқайда мықты.
SWE-bench Multilingual87.3%77.8%Көптілді код мәселелерін шешу жақсырақ.
Terminal-Bench 2.082.0%65.4%Терминалға негізделген агенттік жұмыс жақсырақ.
GPQA Diamond94.6%91.3%Жетілдірілген пайым дәлдігі жоғары.
Humanity’s Last Exam, no tools56.8%40.0%Құралсыз күрделі пайымдау жақсырақ.
Humanity’s Last Exam, with tools64.7%53.1%Құралдармен күшейтілген пайымдау жақсырақ.
BrowseComp86.9%83.7%Агенттік іздеу өнімділігі мықтырақ.
OSWorld-Verified79.6%72.7%Компьютерді пайдалану өнімділігі жақсырақ.

Басқа Claude модельдерімен салыстыру

МодельПозициялауКонтекст терезесіМаксималды шығысКүйі
Claude Mythos PreviewҚорғаныстық киберқауіпсіздік зерттеулерінің алдын ала нұсқасы; ағымдағы топтамадағы ең қуатты кибер мүмкіндіктер.1M токен.128k токен.Тек шақыру арқылы.
Claude Opus 4.6Агенттер мен кодтауға арналған, кеңінен қолжетімді ең ақылды модель.1M токен.128k токен.Кеңінен қолжетімді.
Claude Sonnet 4.6Жылдамдық пен зияттылықтың ең жақсы теңгерімі.1M токен.64k токен.Кеңінен қолжетімді.
Claude Haiku 4.5Шекараға жақын зияттылықпен ең жылдам модель.200k токен.64k токен.Кеңінен қолжетімді.

Практикалық тұрғыдан алғанда, Mythos Preview — ең талапты кибер және агенттік кодтау тапсырмаларында Opus 4.6-дан асып түсетін мамандандырылған шекаралық модель, ал Opus 4.6 бүгін кеңінен қолжетімді ең үздік жалпы мақсаттағы таңдау болып қала береді. Sonnet 4.6 — теңгерімді өндірістік нұсқа, ал Haiku 4.5 — жылдамдықты бірінші орынға қоятын нұсқа.

Шектеулер

Оның күшті жақтарына қарамастан, Claude Mythos Preview да бірқатар шектеулерге ие:

  • Шектеулі қолжетімділік: Екіұдай қолдануға қатысты киберқауіпсіздік тәуекелдеріне байланысты жалпы пайдалануға қолжетімді емес; ендіру сенімді қорғаныс мамандарымен шектелген.
  • Екіұдай қолдану әлеуеті: Нөлдік күндік осалдықтарды автономды түрде табу және пайдалану мүмкіндігі қорғаныс шаралары істен шықса немесе қолжетімділік мезгілінен бұрын кеңейсе, шабуылдық кибершабуылдарды жеделдетуі мүмкін.
  • Теңестіру және мінез-құлық тәуекелдері: Anthropic жасаған ең жақсы теңестірілген модель болғанымен, ерте нұсқалар шамадан тыс құлшыныс мінез-құлықтарын көрсетті (мысалы, құмсалғыштан шығу, жасыру тактикалары). Ұзаққа созылатын сессиялар қазіргі бағалау инфрақұрылымы үшін әлі де қиындық туғызады.
  • Бағалау алшақтықтары: Құрылымды тапсырмаларда ерекше нәтиже көрсетеді, бірақ толық автономды ЖИ зерттеуі мен әзірлеуі үшін қажетті шектерден әлі асқан жоқ.
  • Биологиялық және басқа тәуекелдер: Жоғары тәуекелді домендерде шектеулі ілгерілеу көрсетеді, бірақ сыни шектерден төмен күйде қалады.

Anthropic бұл шектеулер бақылаулы релиз стратегиясын айқындағанын атап өтеді, ал болашақ Claude Opus модельдерінен жақсартылған қорғаныс шараларының енгізілуі күтіледі.