Claude Mythos(Opus 5) لیک ہو گیا: کیا ہوا اور آگے کیا توقع کی جا سکتی ہے

29 مارچ 2026 تک، “Claude Mythos” کی کہانی مکمل عوامی اجرا سے کم اور زیادہ اس لیکڈ پیش نظارہ کے بارے میں ہے جو Anthropic کے اگلے بڑے قدم جیسا دکھتا ہے۔ کمپنی نے غلطی سے عوامی طور پر قابل تلاش ڈیٹا کیش میں بلاگ کے مسودہ مواد کو بے نقاب کر دیا، جس سے ایک غیر جاری شدہ ماڈل ظاہر ہوا جسے Anthropic نے “step change” اور “the most capable we’ve built to date” قرار دیا۔ Anthropic نے تصدیق کی کہ وہ اس ماڈل کو ایک چھوٹے سے ابتدائی رسائی رکھنے والے صارفین کے گروہ کے ساتھ تیار اور ٹیسٹ کر رہا ہے۔

اس کی اہمیت اس لیے ہے کہ Anthropic کے موجودہ عوامی ماڈلز اب بھی Claude Opus 4.6، Claude Sonnet 4.6 اور Claude Haiku 4.5 کے گرد مرکوز ہیں۔ دوسرے لفظوں میں، یہ لیک کسی تصدیق شدہ عوامی پروڈکٹ لانچ نہیں؛ بلکہ اس اگلے درجے کی ایک جھلک ہے جسے Anthropic شاید تیار کر رہا ہے۔

فی الحال، CometAPI جدید ترین Claude ماڈلز کے لیے APIs پہلے سے فراہم کرتا ہے، جیسے Claude Opus 4.6 اور Claude Sonnet 4.6۔ جب Claude Mythos CometAPI پر دستیاب ہو جائے گا، تو آپ Gemini اور OpenAI کے سرفہرست ماڈلز کے مقابل نسبتاً ٹیسٹ کر سکیں گے۔ CometAPI بہترین ماڈلز کو یکجا کرتا ہے۔

Claude Mythos کیا ہے؟

Claude Mythos اب تک Anthropic کا سب سے جدید AI ماڈل ہے، جسے لیک ہونے والی داخلی دستاویزات میں “by far the most powerful AI model we’ve ever developed” قرار دیا گیا ہے۔ یہ کارکردگی کی ایک نئی سطح متعارف کراتا ہے—جسے اندرونی طور پر “Capybara” کہا جاتا ہے—جو کمپنی کی موجودہ Opus لائن اپ سے اوپر واقع ہے، جو اب تک Claude کی صلاحیتوں کی انتہا سمجھی جاتی تھی۔

Anthropic کے موجودہ ماڈلز کا خاندان ایک واضح درجہ بندی پر عمل کرتا ہے:

Opus: سب سے بڑا، سب سے قابل، اور سب سے مہنگا (مثلاً، Claude Opus 4.6 اور اس سے پہلے نومبر 2025 میں جاری ہونے والا Opus 4.5)۔
Sonnet: رفتار اور ذہانت کا متوازن امتزاج۔
Haiku: تیز ترین اور ہلکے کاموں کے لیے سب سے کفایتی۔

Mythos/Capybara اس سانچے کو توڑتا ہے کیونکہ یہ نمایاں طور پر بڑا اور زیادہ حسابی وسائل مانگنے والا ماڈل ہے۔ بلاگ مسودوں میں واضح طور پر لکھا ہے کہ یہ “larger and more intelligent than our Opus models—which were, until now, our most powerful.” نام “Mythos” اس لیے منتخب کیا گیا کہ وہ “the deep connective tissues that link together knowledge and ideas” کا تصور دے، یعنی شعبوں کے درمیان زیادہ گہری اور مربوط استدلال کی طرف اشارہ۔

یہ کوئی معمولی تدریجی اپ ڈیٹ نہیں ہے۔ Anthropic کے ترجمان نے تصدیق کی کہ کمپنی “developing a general purpose model with meaningful advances in reasoning, coding, and cybersecurity” کر رہی ہے اور اسے “a step change and the most capable we’ve built to date” سمجھتی ہے۔ تربیت مکمل ہو چکی ہے اور ماڈل پہلے ہی ایک چھوٹے سے ابتدائی رسائی رکھنے والے صارفین کے گروہ کے ساتھ حقیقی دنیا میں آزمائش سے گزر رہا ہے۔

پس منظر کے طور پر، Claude کی پیش رفت تیز رہی ہے۔ Claude 3 Opus (2024) نے ابتدائی بَینچ مارکس قائم کیے، جس کے بعد Claude 3.5 Sonnet، Claude 4 کی مختلف شکلیں، اور 2025 میں Opus 4.5/4.6 آئے۔ Mythos منطقی جانشین دکھائی دیتا ہے—ممکنہ طور پر وہی جسے کمیونٹی نے “Opus 5” کے طور پر قیاس کیا—جو فرنٹیئر AI کو نئی سمتوں میں لے جاتے ہوئے سنجیدہ حفاظتی سوالات بھی اٹھاتا ہے۔

Claude Mythos لیک کیسے ہوا؟

یہ لیک 27 مارچ 2026 کے آس پاس Anthropic کے مواد کے انتظامی نظام (CMS) میں سیدھی مگر شرمندہ کن انسانی غلطی پر مبنی غلط ترتیب کے باعث ہوئی۔ لگ بھگ 3,000 غیر شائع شدہ اثاثے—جن میں بلاگ مسودے، تصاویر، PDFs، آڈیو فائلیں، اور حتیٰ کہ داخلی دستاویزات بھی شامل تھیں—ایک عوامی طور پر قابل تلاش ڈیٹا اسٹور (جسے کبھی کبھی “data lake” کہا جاتا ہے) میں چھوڑ دیے گئے تھے۔

اثاثوں کی ڈیفالٹ سیٹنگ “public” تھی، اور URLs اندازے سے معلوم کیے جا سکتے تھے۔ سکیورٹی محققین Roy Paz (LayerX Security) اور Alexandre Pauwels (University of Cambridge) نے اس کیش کا پتا لگایا اور میڈیا اداروں کو آگاہ کیا۔

لیک شدہ مواد میں یہ شامل تھا:

دو تقریباً یکساں بلاگ مسودے (ایک کا عنوان “Claude Mythos”، اور دوسرے کا “Claude Capybara”)۔
سرخیوں اور منصوبہ بند تاریخِ اشاعت کے ساتھ ساختہ ویب صفحے کا ڈیٹا۔
ماضی کی لانچز سے غیر استعمال شدہ مارکیٹنگ اثاثے۔
Anthropic کے سی ای او Dario Amodei کے زیرِ اہتمام صرف دعوت نامے پر مبنی CEO ریٹریٹ سے متعلق ایک داخلی PDF۔

Anthropic نے فوراً اس واقعے کو CMS کنفیگریشن میں “human error” قرار دیا اور عوامی رسائی ختم کر دی۔ کسی بدنیتی یا ماڈل ویٹس کی خلاف ورزی کا کوئی ثبوت نہیں ملا—صرف مارکیٹنگ اور منصوبہ بندی کی دستاویزات افشا ہوئیں۔

یہ واقعہ AI صنعت میں بڑھتی ہوئی کمزوری کو اجاگر کرتا ہے: تیز رفتار تکرار اور داخلی دستاویزات اکثر محفوظ اشاعتی ورک فلو سے آگے نکل جاتی ہیں۔ دیگر لیبز میں بھی اسی نوعیت کی لیکس ہوئی ہیں، مگر اس بار ایک غیر جاری فلیگ شپ ماڈل کے بارے میں غیر معمولی تفصیل سامنے آئی۔

لیک شدہ بینچ مارک اسکورز اور کارکردگی کے دعوے

لیک شدہ مسودوں میں درست عددی اسکورز ظاہر نہیں کیے گئے—Anthropic نے ابھی تک سرکاری بینچ مارکس شائع نہیں کیے۔ تاہم، دونوں مسودہ نسخوں میں زبان غیر مبہم اور یکساں ہے:

“ہمارے پچھلے بہترین ماڈل Claude Opus 4.6 کے مقابلے میں، Capybara کو سافٹ ویئر کوڈنگ، علمی استدلال اور سائبر سکیورٹی کے ٹیسٹوں میں، دیگر کے علاوہ، ڈرامائی طور پر بلند اسکورز ملتے ہیں۔”

ماڈل کے بارے میں یہ بھی کہا گیا ہے کہ وہ “سائبر صلاحیتوں میں فی الحال کسی بھی دوسرے AI ماڈل سے بہت آگے” ہے اور ایسا ماڈل ہے جو “ایسے ماڈلز کی آئندہ لہر کی پیش خبری دیتا ہے جو کمزوریوں کا استحصال ان طریقوں سے کر سکتے ہیں جو مدافعین کی کوششوں سے کہیں زیادہ تیز ہوں۔”

یہ بینچ مارک زمروں سے دراصل کیا ماپا جاتا ہے؟

سافٹ ویئر کوڈنگ (مثلاً، SWE-Bench Verified، HumanEval، LiveCodeBench): حقیقی دنیا کے سافٹ ویئر انجینئرنگ کے کام، جن میں بگ فکسنگ، فیچر نافذ کرنا، اور ریپوزٹری سطح کی سمجھ شامل ہے۔ Opus 4.6 پہلے ہی کئی کوڈنگ لیڈر بورڈز میں آگے تھا؛ یہاں “dramatic” چھلانگ کا مطلب ہوگا کہ Mythos خود مختاری کے ساتھ پیچیدہ، کثیر فائل کوڈ بیسز سنبھال سکے گا جو فی الحال سینئر انجینئرز کو درکار ہوتے ہیں۔
علمی استدلال (مثلاً، GPQA، MMLU-Pro، MATH، FrontierMath): گریجویٹ سطح کے سائنسی، ریاضیاتی، اور کثیر مرحلہ منطقی مسائل۔ یہاں بہتری مضبوط chain-of-thought استدلال اور علم کے امتزاج کی طرف اشارہ کرتی ہے۔
سائبر سکیورٹی: کمزوریوں کی دریافت، ایکسپلائٹ تیار کرنا، ریڈ ٹیمنگ کی مشقیں، اور دفاعی مضبوطی۔ یہی سب سے زیادہ نمایاں—اور سب سے تشویشناک—شعبہ ہے۔

اگرچہ سابقہ Claude ماڈلز (Opus 4.5/4.6) نے مضبوط نتائج حاصل کیے—مثال کے طور پر، Opus 4.5 نے SWE-Bench Verified پر ~80.9% اسکور کیا—تاہم لیک شدہ دعوے Mythos کو معیاری طور پر ایک مختلف لیگ میں رکھتے ہیں۔

ماڈل کی خصوصیات اور تکنیکی پروفائل

بینچ مارکس سے ہٹ کر، مسودے کئی نمایاں خصوصیات ظاہر کرتے ہیں:

پیمانہ اور لاگت: “ہمارے لیے مہیا کرنا بہت مہنگا، اور ہمارے صارفین کے لیے استعمال کرنا بھی بہت مہنگا ہوگا۔” اس سے مراد بہت بڑے پیمانے کے پیرا میٹرز اور بلند انفیرینس لاگتیں ہیں، جو ابتدائی دستیابی کو انٹرپرائز اور بلند قدر استعمال کی صورتوں تک محدود کرتی ہیں۔
استدلال کی گہرائی: علم کے دائرہ ہائے کار کے درمیان “deep connective tissues” پر زور طویل متن کے تناظر کی بہتر سمجھ اور کراس-ڈومین ترکیب کی نشاندہی کرتا ہے۔
ایجنٹک صلاحیتیں: ابتدائی رسائی بظاہر ان اداروں کو ہدف بناتی ہے جنہیں جدید کوڈنگ ایجنٹس اور سائبر سکیورٹی اوزار درکار ہیں۔
سلامتی-اول فلسفہ: Anthropic کے constitutional AI انداز کے مطابق، کمپنی وسیع تر اجرا سے پہلے—خصوصاً سائبر سکیورٹی میں—خطرات کے جائزے کو ترجیح دے رہی ہے۔

سائبر سکیورٹی مضمرات: سب سے بڑا ریڈ فلیگ

لیک کا سب سے نمایاں پہلو ماڈل کی دوہری استعمال کی صلاحیتوں پر Anthropic کی اپنی وارننگ ہے۔ سائبر صلاحیتوں میں “بہت آگے” ہونے کے باعث، Mythos یہ کر سکتا ہے:

زیرو ڈے کمزوریاں خودکار طور پر دریافت کرنا۔
وسیع پیمانے پر پیچیدہ ایکسپلائٹ کوڈ تیار کرنا۔
انسانی مدافعین کی ردِعمل کی رفتار سے بھی تیز Advanced Persistent Threats (APTs) کی سمولیشن کرنا۔

مسودے میں واضح طور پر لکھا ہے کہ کمپنی “غیر معمولی احتیاط کے ساتھ عمل” کرنا چاہتی ہے اور سائبر دفاع کاروں کے ساتھ نتائج شیئر کرنا چاہتی ہے تاکہ “AI سے چلنے والے ایکسپلائٹس کی آنے والی لہر” کے لیے تیاری کی جا سکے۔

مارکیٹ کا ردِعمل فوری تھا: 27-28 مارچ 2026 کو سائبر سکیورٹی شیئرز گر گئے کیونکہ سرمایہ کاروں نے یہ خطرہ قیمتوں میں شامل کیا کہ جارحانہ AI صلاحیتیں دفاعی اوزاروں سے آگے نکل سکتی ہیں۔

یہ رجحان وسیع تر صنعت کے رجحانات سے ہم آہنگ ہے۔ OpenAI نے بھی GPT-5.3-Codex جیسے ماڈلز میں بلند سائبر صلاحیتوں کی اسی طرح نشاندہی کی ہے۔ حقیقی دنیا کے واقعات پہلے ہی دکھاتے ہیں کہ ریاستی عناصر (مثلاً، ایک چینی گروہ) نفوذی مہمات کے لیے Claude کی مختلف اقسام استعمال کر رہے ہیں۔ Mythos ایسے خطرات کو مزید تقویت دے سکتا ہے۔

مثبت پہلو: دفاعی اداروں کو ابتدائی رسائی محفوظ کوڈنگ کے طریقوں، خودکار پیچنگ، اور تھریٹ ہنٹنگ کو تیز کر سکتی ہے—جو طویل مدت میں انٹرنیٹ کو زیادہ محفوظ بنا سکتی ہے۔

تقابلی جدول: Claude Mythos بمقابلہ سابقہ ماڈلز

پہلو	Claude Opus 4.6 (موجودہ فلیگ شپ)	Claude Mythos / Capybara (لیک شدہ)	بنیادی نکتہ
درجہ	Opus	نیا “Capybara” درجہ (Opus سے اوپر)	معماری میں بڑا قدم
کوڈنگ کارکردگی	مضبوط (مثلاً، ~80.9% SWE-Bench)	ڈرامائی طور پر زیادہ	سینئر انجینئر کی پیداواری صلاحیت کے ہم پلہ یا اس سے بڑھنے کی صلاحیت
علمی استدلال	عمدہ	ڈرامائی طور پر زیادہ	زیادہ گہرا کثیر مرحلہ منطق اور علم کا ادغام
سائبر سکیورٹی	قابل (کمزوری کی شناخت)	موجودہ کسی بھی ماڈل سے بہت آگے	معیاری چھلانگ؛ دوہری استعمال کے خطرات بڑھاتی ہے
انفیرینس لاگت	بلند (Opus قیمتیں)	بہت مہنگی (اس سے بھی زیادہ)	ابتدا میں صرف انٹرپرائز کے لیے
اجرا کی حیثیت	عمومی دستیابی	صرف ابتدائی رسائی کی آزمائش	سوچ سمجھ کر، سلامتی پر مرکوز رول آؤٹ
مجموعی قابلیت	2025 کی state-of-the-art	“Step change” / “Most powerful ever”	نیا فرنٹیئر بینچ مارک

نتیجہ: اگلے AI دور کی ایک لیک شدہ جھلک

Claude Mythos کی لیک Anthropic کے روڈ میپ پر ایک نایاب اور بے پردہ نظر فراہم کرتی ہے۔ یہ اس بات کی تصدیق کرتی ہے کہ کمپنی نے بنیادی صلاحیتوں میں ایک حقیقی “step change” حاصل کیا ہے، جبکہ اسی طاقت کے ساتھ آنے والے گہرے خطرات—خصوصاً سائبر سکیورٹی میں—کو بھی تسلیم کرتی ہے۔ چاہے اسے Opus 5 کہا جائے یا Capybara کا نیا درجہ، Mythos اس بات کا اشارہ ہے کہ فرنٹیئر AI ایک ایسے مرحلے میں داخل ہو رہا ہے جہاں صلاحیتیں محفوظ تعیناتی کی وقت بندی سے آگے نکل جاتی ہیں۔

CometAPI آزمانے کے لیے تیار ہیں؟ آپ پہلے ہمارے صارف بن سکتے ہیں اور $1 کا مفت کریڈٹ حاصل کر سکتے ہیں، اور جب Claude Mythos لائیو ہو تو مطلع کیے جائیں گے۔