Claude Mythos(Opus 5) หลุด: เกิดอะไรขึ้น และคาดหวังอะไรได้บ้าง

CometAPI
AnnaMar 29, 2026
Claude Mythos(Opus 5) หลุด: เกิดอะไรขึ้น และคาดหวังอะไรได้บ้าง

ณ วันที่ 29 มีนาคม 2026 เรื่องราวเกี่ยวกับ “Claude Mythos” ไม่ได้เป็นการเปิดตัวสู่สาธารณะอย่างเสร็จสมบูรณ์ หากแต่เป็นพรีวิวที่รั่วไหลซึ่งดูเหมือนก้าวสำคัญถัดไปของ Anthropic บริษัทได้เปิดเผยร่างเนื้อหาในบล็อกโดยไม่ได้ตั้งใจผ่านแคชข้อมูลที่ค้นหาได้สาธารณะ เผยให้เห็นโมเดลที่ยังไม่เปิดตัวซึ่ง Anthropic อธิบายว่าเป็น “การเปลี่ยนแปลงแบบก้าวกระโดด” และ “โมเดลที่มีความสามารถมากที่สุดที่เราเคยสร้างมาจนถึงปัจจุบัน” Anthropic ยืนยันว่ากำลังพัฒนาและทดสอบโมเดลนี้กับลูกค้ากลุ่ม Early Access ขนาดเล็ก

ประเด็นนี้สำคัญเพราะไลน์อัปโมเดลสาธารณะปัจจุบันของ Anthropic ยังยึดอยู่ที่ Claude Opus 4.6, Claude Sonnet 4.6 และ Claude Haiku 4.5 กล่าวอีกนัยหนึ่ง การรั่วไหลครั้งนี้ไม่ใช่การเปิดตัวผลิตภัณฑ์สาธารณะอย่างเป็นทางการ หากแต่เป็นภาพแอบเห็นของระดับถัดไปที่ Anthropic อาจกำลังเตรียมการ

ปัจจุบัน CometAPI มี API สำหรับโมเดล Claude ล้ำสมัยแล้ว เช่น Claude Opus 4.6 และ Claude Sonnet 4.6 เมื่อ Claude Mythos พร้อมใช้งานบน CometAPI คุณจะสามารถทำการทดสอบเปรียบเทียบกับโมเดลชั้นนำจาก Gemini และ OpenAI ได้ CometAPI รวบรวมโมเดลที่ดีที่สุดไว้

Claude Mythos คืออะไร?

Claude Mythos เป็นโมเดล AI ที่ล้ำหน้าที่สุดของ Anthropic จนถึงปัจจุบัน โดยในเอกสารภายในที่รั่วไหลออกมาบรรยายว่าเป็น “โมเดล AI ที่ทรงพลังที่สุดเท่าที่เราเคยพัฒนามาอย่างทิ้งห่าง” มันนำเสนอระดับสมรรถนะใหม่—ซึ่งภายในเรียกว่า “Capybara”—ที่อยู่เหนือไลน์อัป Opus เดิมของบริษัท ซึ่งจนถึงตอนนี้ถือเป็นจุดสูงสุดของความสามารถของ Claude

ตระกูลโมเดลปัจจุบันของ Anthropic มีลำดับชั้นที่ชัดเจนดังนี้:

  • Opus: ใหญ่ที่สุด มีความสามารถสูงสุด และราคาแพงที่สุด (เช่น Claude Opus 4.6 และ Opus 4.5 รุ่นก่อนหน้าที่ออกในเดือนพฤศจิกายน 2025)
  • Sonnet: สมดุลระหว่างความเร็วและความฉลาด
  • Haiku: เร็วที่สุดและคุ้มค่าที่สุดสำหรับงานเบา

Mythos/Capybara ทำลายกรอบนี้ด้วยการเป็นโมเดลที่ใหญ่กว่าและใช้ทรัพยากรคำนวณสูงกว่าอย่างมีนัยสำคัญ ร่างบล็อกโพสต์ระบุชัดเจนว่าเป็น “ใหญ่กว่าและฉลาดกว่าโมเดล Opus ของเรา—ซึ่งจนถึงตอนนี้เป็นโมเดลที่ทรงพลังที่สุดของเรา” ชื่อ “Mythos” ถูกเลือกเพื่อสื่อถึง “เนื้อเยื่อการเชื่อมโยงลึกที่ร้อยเรียงความรู้และความคิดเข้าด้วยกัน” บ่งชี้การให้เหตุผลที่ลึกและบูรณาการมากขึ้นข้ามโดเมน

นี่ไม่ใช่การอัปเดตแบบค่อยเป็นค่อยไปเล็กน้อย โฆษกของ Anthropic ยืนยันว่าบริษัทกำลัง “พัฒนาโมเดลอเนกประสงค์ที่มีความก้าวหน้าที่มีความหมายในด้านการให้เหตุผล การเขียนโค้ด และความมั่นคงปลอดภัยไซเบอร์” และมองว่าเป็น “การก้าวกระโดด และเป็นโมเดลที่มีความสามารถมากที่สุดที่เราเคยสร้างจนถึงปัจจุบัน” การฝึกสอนได้เสร็จสิ้นแล้ว และโมเดลกำลังผ่านการทดสอบการใช้งานจริงกับกลุ่มลูกค้า Early Access ขนาดเล็ก

เพื่อให้เห็นภาพ พัฒนาการของ Claude เกิดขึ้นอย่างรวดเร็ว Claude 3 Opus (2024) วางมาตรฐานในช่วงต้น ตามมาด้วย Claude 3.5 Sonnet, ตระกูล Claude 4 และ Opus 4.5/4.6 ในปี 2025 Mythos ดูจะเป็นทายาทโดยตรง—ซึ่งชุมชนคาดเดาว่าอาจเป็น “Opus 5”—ผลักดัน AI แนวหน้าสู่ดินแดนใหม่พร้อมยกระดับคำถามด้านความปลอดภัยอย่างจริงจัง

Claude Mythos รั่วไหลได้อย่างไร?

การรั่วไหลเกิดขึ้นเมื่อประมาณวันที่ 27 มีนาคม 2026 เนื่องจากการกำหนดค่าที่ผิดพลาดจากความผิดพลาดของมนุษย์ในระบบจัดการเนื้อหา (CMS) ของ Anthropic ที่เรียบง่ายแต่ชวนอับอาย มีทรัพยากรที่ยังไม่เผยแพร่เกือบ 3,000 รายการ—รวมถึงร่างบล็อกโพสต์ รูปภาพ ไฟล์ PDF ไฟล์เสียง และแม้แต่เอกสารภายใน—ถูกทิ้งไว้ในแหล่งเก็บข้อมูลที่ค้นหาได้สาธารณะ (มักเรียกว่า “data lake”)

ทรัพยากรถูกตั้งค่าเป็น “สาธารณะ” โดยปริยาย พร้อม URL ที่คาดเดาได้ นักวิจัยด้านความปลอดภัย Roy Paz (LayerX Security) และ Alexandre Pauwels (University of Cambridge) ค้นพบแคชดังกล่าวและแจ้งต่อสื่อมวลชน

วัสดุที่รั่วไหลประกอบด้วย:

  • ร่างบล็อกโพสต์สองชิ้นที่แทบเหมือนกัน (ชิ้นหนึ่งใช้ชื่อ “Claude Mythos” อีกชิ้น “Claude Capybara”)
  • ข้อมูลหน้าเว็บแบบมีโครงสร้างที่มีส่วนหัวและวันเผยแพร่ที่วางแผนไว้
  • ทรัพยากรการตลาดที่ไม่ได้ใช้จากการเปิดตัวครั้งก่อน
  • ไฟล์ PDF ภายในเกี่ยวกับงานพักผ่อนสำหรับ CEO แบบเชิญเท่านั้น ซึ่งจัดโดย CEO ของ Anthropic คือ Dario Amodei

Anthropic ยืนยันอย่างรวดเร็วว่าเหตุการณ์เกิดจาก “ความผิดพลาดของมนุษย์” ในการตั้งค่า CMS และได้ปิดการเข้าถึงสาธารณะแล้ว ไม่มีหลักฐานบ่งชี้ความประสงค์ร้ายหรือการรั่วไหลของน้ำหนักโมเดล—มีเพียงเอกสารด้านการตลาดและการวางแผนที่ถูกเปิดเผย

เหตุการณ์นี้สะท้อนช่องโหว่ที่เพิ่มขึ้นในอุตสาหกรรม AI: จังหวะการพัฒนาอย่างรวดเร็วและเอกสารภายในมักแซงหน้ากระบวนการเผยแพร่ที่ปลอดภัย การรั่วไหลในลักษณะนี้เคยเกิดขึ้นกับห้องปฏิบัติการอื่นเช่นกัน แต่ครั้งนี้ให้ข้อมูลเชิงลึกที่ละเอียดผิดปกติเกี่ยวกับโมเดลเรือธงที่ยังไม่เปิดตัว

คะแนน Benchmark และคำกล่าวอ้างด้านสมรรถนะที่รั่วไหล

คะแนนตัวเลขที่แน่นอนไม่ได้ถูกเปิดเผยในร่างที่รั่วไหล—Anthropic ยังไม่ได้เผยแพร่ Benchmark อย่างเป็นทางการ อย่างไรก็ตาม ภาษาในเอกสารทั้งสองฉบับชัดเจนและสอดคล้องต้องกัน:

“เมื่อเทียบกับโมเดลที่ดีที่สุดก่อนหน้านี้ของเรา Claude Opus 4.6, Capybara ได้คะแนนที่ สูงขึ้นอย่างมาก ในการทดสอบด้านการเขียนซอฟต์แวร์ การให้เหตุผลเชิงวิชาการ และความมั่นคงปลอดภัยไซเบอร์ เป็นต้น”

โมเดลยังถูกอธิบายเพิ่มเติมว่า “ในปัจจุบันนำหน้าโมเดล AI อื่นใดในด้านความสามารถทางไซเบอร์อย่างมาก” และเป็นโมเดลที่ “เป็นสัญญาณของคลื่นลูกใหม่ของโมเดลที่สามารถใช้ประโยชน์จากช่องโหว่ได้เร็วกว่าความพยายามของฝ่ายป้องกันอย่างมาก”

หมวดหมู่ Benchmark เหล่านี้วัดอะไรจริงๆ?

  • ซอฟต์แวร์โค้ดดิ้ง (เช่น SWE-Bench Verified, HumanEval, LiveCodeBench): งานวิศวกรรมซอฟต์แวร์ในโลกจริง รวมถึงการแก้บั๊ก การเพิ่มฟีเจอร์ และความเข้าใจในระดับรีโพสิทอรี Opus 4.6 นำในลีดเดอร์บอร์ดด้านโค้ดหลายรายการอยู่แล้ว; หาก “ก้าวกระโดด” ที่นี่เป็นจริง หมายความว่า Mythos อาจจัดการโค้ดเบสแบบหลายไฟล์ที่ซับซ้อนได้อย่างอัตโนมัติในระดับที่ปกติต้องอาศัยวิศวกรอาวุโส
  • การให้เหตุผลเชิงวิชาการ (เช่น GPQA, MMLU-Pro, MATH, FrontierMath): ปัญหาวิทยาศาสตร์ คณิตศาสตร์ และตรรกะหลายขั้นตอนในระดับบัณฑิตศึกษา ความก้าวหน้าที่นี่บ่งชี้ถึงความสามารถ chain-of-thought ที่แข็งแรงขึ้นและการสังเคราะห์ความรู้
  • ความมั่นคงปลอดภัยไซเบอร์: การค้นหาช่องโหว่ การสร้างโค้ดโจมตี การจำลองการทดสอบเจาะระบบ (red team) และการเสริมความมั่นคงเชิงรับ นี่เป็นด้านที่เน้นย้ำมากที่สุด—และน่ากังวลที่สุด

แม้โมเดล Claude รุ่นก่อน (Opus 4.5/4.6) จะทำผลงานได้แข็งแกร่ง—เช่น Opus 4.5 ทำได้ราว ~80.9% บน SWE-Bench Verified—แต่คำกล่าวอ้างที่รั่วไหลวางตำแหน่ง Mythos ไว้ในระดับที่แตกต่างอย่างมีคุณภาพ

ลักษณะโมเดลและโปรไฟล์ทางเทคนิค

นอกเหนือจาก Benchmark ร่างเอกสารยังเผยคุณลักษณะสำคัญหลายประการ:

  • ขนาดและต้นทุน: “มีค่าใช้จ่ายสูงมากสำหรับเราที่จะให้บริการ และจะมีค่าใช้จ่ายสูงมากสำหรับลูกค้าที่จะใช้งาน” บ่งชี้จำนวนพารามิเตอร์มหาศาลและต้นทุนอินเฟอเรนซ์สูง ทำให้การให้ใช้งานช่วงแรกจำกัดอยู่ในองค์กรและกรณีการใช้งานมูลค่าสูง
  • ความลึกด้านการให้เหตุผล: การเน้น “เนื้อเยื่อการเชื่อมโยงลึก” ระหว่างโดเมนความรู้ สื่อถึงความเข้าใจบริบทระยะยาวและการสังเคราะห์ข้ามโดเมนที่เหนือกว่า
  • ความสามารถเชิงตัวแทน (Agentic): การเข้าถึงช่วงต้นดูเหมือนมุ่งไปที่องค์กรที่ต้องการเอเจนต์โค้ดดิ้งขั้นสูงและเครื่องมือด้านความมั่นคงปลอดภัยไซเบอร์
  • ปรัชญา Safety-First: สอดคล้องกับแนวทาง Constitutional AI ของ Anthropic บริษัทให้ความสำคัญกับการประเมินความเสี่ยง—โดยเฉพาะด้านความมั่นคงปลอดภัยไซเบอร์—ก่อนการเปิดให้ใช้อย่างกว้างขวาง

นัยยะด้านความมั่นคงปลอดภัยไซเบอร์: ธงแดงที่ใหญ่ที่สุด

ประเด็นที่สะดุดตาที่สุดของการรั่วไหลคือคำเตือนของ Anthropic เองเกี่ยวกับศักยภาพการใช้สองทาง (dual-use) ของโมเดล โดยการที่ “นำหน้าอย่างมาก” ในความสามารถด้านไซเบอร์ Mythos อาจ:

  • ค้นพบช่องโหว่แบบ zero-day ได้โดยอัตโนมัติ
  • สร้างโค้ดโจมตีที่ซับซ้อนได้ในปริมาณมาก
  • จำลองภัยคุกคามแบบต่อเนื่องขั้นสูง (APT) ได้เร็วกว่าที่ฝ่ายป้องกันของมนุษย์จะตอบสนองได้

ร่างเอกสารระบุชัดว่าบริษัทต้องการ “ดำเนินการด้วยความระมัดระวังเป็นพิเศษ” และแบ่งปันข้อค้นพบกับฝ่ายป้องกันไซเบอร์เพื่อเตรียมรับ “คลื่นของการโจมตีที่ขับเคลื่อนด้วย AI ที่กำลังจะมาถึง”

ปฏิกิริยาตลาดเกิดขึ้นทันที: หุ้นกลุ่มความมั่นคงปลอดภัยไซเบอร์ร่วงลงในวันที่ 27–28 มีนาคม 2026 เนื่องจากนักลงทุนประเมินความเสี่ยงว่าความสามารถเชิงรุกของ AI อาจแซงหน้าเครื่องมือเชิงรับ

สิ่งนี้สอดคล้องกับแนวโน้มในอุตสาหกรรมที่กว้างขึ้น OpenAI ก็ชี้ธงความสามารถไซเบอร์ระดับสูงในโมเดลอย่าง GPT-5.3-Codex เช่นกัน เหตุการณ์จริงแสดงให้เห็นแล้วว่ามีผู้เล่นระดับรัฐ (เช่น กลุ่มจากจีน) ใช้รุ่นย่อยของ Claude ในปฏิบัติการแทรกซึม Mythos จะยกระดับภัยคุกคามลักษณะดังกล่าวให้รุนแรงยิ่งขึ้น

ด้านบวก: การให้เข้าถึงแก่หน่วยงานเชิงป้องกันตั้งแต่เนิ่นๆ อาจเร่งแนวปฏิบัติการเขียนโค้ดอย่างปลอดภัย การแพตช์อัตโนมัติ และการไล่ล่าภัยคุกคาม—อาจทำให้อินเทอร์เน็ตปลอดภัยขึ้นในระยะยาว

ตารางเปรียบเทียบ: Claude Mythos กับโมเดลก่อนหน้า

ประเด็นClaude Opus 4.6 (เรือธงปัจจุบัน)Claude Mythos / Capybara (ที่รั่วไหล)สาระสำคัญ
ระดับชั้นOpusระดับ “Capybara” ใหม่ (เหนือ Opus)การก้าวกระโดดด้านสถาปัตยกรรมครั้งใหญ่
สมรรถนะด้านโค้ดดิ้งแข็งแกร่ง (เช่น ~80.9% บน SWE-Bench)สูงขึ้นอย่างมากอาจทัดเทียมหรือเหนือกว่าผลิตภาพของวิศวกรอาวุโส
การให้เหตุผลเชิงวิชาการยอดเยี่ยมสูงขึ้นอย่างมากตรรกะหลายขั้นที่ลึกขึ้นและการบูรณาการความรู้ที่มากกว่า
ความมั่นคงปลอดภัยไซเบอร์มีความสามารถ (การตรวจจับช่องโหว่)นำหน้าทุกโมเดลในปัจจุบันอย่างมากการก้าวกระโดดเชิงคุณภาพ; เพิ่มความเสี่ยงการใช้สองทาง
ต้นทุนอินเฟอเรนซ์สูง (ระดับราคา Opus)แพงมาก (สูงยิ่งกว่า)ช่วงแรกจำกัดสำหรับองค์กร
สถานะการปล่อยใช้งานเปิดให้ใช้งานทั่วไปทดสอบแบบ Early Access เท่านั้นการปล่อยใช้งานแบบรอบคอบ เน้นความปลอดภัยเป็นหลัก
ความสามารถโดยรวมล้ำสมัยระดับปี 2025“การก้าวกระโดด” / “ทรงพลังที่สุดเท่าที่เคยมี”มาตรฐานแนวหน้ารุ่นใหม่

บทสรุป: ภาพแอบเห็นสู่ยุคถัดไปของ AI ที่รั่วไหลออกมา

การรั่วไหลของ Claude Mythos มอบมุมมองที่หาได้ยากและไม่ผ่านการกรองต่อโรดแมปของ Anthropic มันยืนยันว่าบริษัทได้บรรลุ “การก้าวกระโดด” ที่แท้จริงในความสามารถแกนหลัก ขณะเดียวกันก็ยอมรับความเสี่ยงเชิงลึก—โดยเฉพาะด้านความมั่นคงปลอดภัยไซเบอร์—ที่มากับพลังดังกล่าว ไม่ว่าจะถูกเรียกว่า Opus 5 หรือระดับ Capybara ใหม่ Mythos บ่งชี้ว่า AI แนวหน้ากำลังก้าวสู่ช่วงที่ความสามารถแซงหน้ากรอบเวลาการเปิดใช้งานอย่างปลอดภัย

Ready to experience CometAPI? คุณสามารถสมัครเป็นผู้ใช้ของเราก่อนได้ รับเครดิตฟรี $1 และรับการแจ้งเตือนเมื่อ Claude Mythos เปิดให้ใช้งานจริง

เข้าถึงโมเดลชั้นนำ ด้วยต้นทุนต่ำ

อ่านเพิ่มเติม