GPT-5 มีพารามิเตอร์กี่ตัว? นี่คือสิ่งที่เราพบจริงๆ

พิมพ์ "GPT-5 parameters" ใน Google แล้วคุณจะจมอยู่กับตัวเลขที่ขัดแย้งกัน 2 ล้านล้าน? 5 ล้านล้าน? หรือ 52.5 ล้านล้านที่ชวนเวียนหัว? เราใช้เวลา 3 สัปดาห์ในการวิเคราะห์คำตอบ—เพื่อที่คุณจะได้ไม่ต้องทำเอง

GPT-5 เปิดตัวเมื่อ 7 สิงหาคม 2025 ถือเป็นการออกรุ่นใหญ่ที่สุดของ OpenAI นับจาก GPT-4 แต่ต่างจากรุ่นก่อน หน้าไส้ของโมเดลนี้จงใจถูกปิดบัง หลังจากวิเคราะห์รูปแบบ latency ของ API ข้ามอ้างอิงคะแนน benchmark กับโมเดลที่ทราบขนาด และคุยกับวิศวกรที่ทดสอบ GPT-5 ภายใต้โหลดจริงระดับใหญ่ 3 สัปดาห์ นี่คือสิ่งที่เรามั่นใจจริง—และสิ่งที่อุตสาหกรรมยังเดาอยู่

GPT-5 มีพารามิเตอร์กี่ตัว

ความลับที่ไม่ลับของวงการ AI: ไม่มีใครรู้จริงๆ ว่า GPT-5 ใหญ่แค่ไหน

กระทู้ Reddit ฟันธงที่ 52.5 ล้านล้านพารามิเตอร์ พรีเซนเทชันของ Samsung ที่ SemiCon Taiwan ที่หลุดออกมาบอก 3-5 ล้านล้าน นักวิเคราะห์อุตสาหกรรมเผื่อไว้ที่ "ช่วงประมาณ 2-5 ล้านล้าน" เอกสารทางการของ OpenAI? เงียบสนิท เมื่อนักข่าวถาม ทีม developer relations ตอบอย่างสุภาพว่า "เราไม่เปิดเผยรายละเอียดสถาปัตยกรรมด้วยเหตุผลด้านการแข่งขัน"

ดังนั้นเราจึง…วิเคราะห์เอง

[เปิดเผยทั้งหมด: ต่อไปนี้คือการวิเคราะห์เชิงสืบสวน ไม่ใช่ข้อเท็จจริงยืนยันแล้ว OpenAI ยังไม่ได้ยืนยันจำนวนพารามิเตอร์ของ GPT-5 เราสังเคราะห์ผลจากฐานข้อมูล benchmark สเปกฮาร์ดแวร์ที่หลุด รูปแบบการทำงานของ API และบทสัมภาษณ์ ML วิศวกรที่รัน GPT-5 ในโปรดักชัน รับข้อสรุปของเราเป็นงานสืบสวนเชิงข้อมูล ไม่ใช่คัมภีร์ศักดิ์สิทธิ์]

ทำไม “52.5 ล้านล้านพารามิเตอร์” จึงเป็นไปได้ทางเทคนิค แต่แทบไม่มีความหมายในทางปฏิบัติ

ลองนึกภาพ: คุณจ้างที่ปรึกษา 100 คน แต่จ่ายค่าจ้างเพียง 4 คนต่อโปรเจ็กต์ โครงสร้างองค์กรบอกว่ามีพนักงาน 100 คน ฝ่ายการเงินบิลแค่ 4 คน แล้วตัวเลขไหนสะท้อน “ขนาด” บริษัท?

ทั้งสองก็ใช่ และก็ไม่ใช่ ยินดีต้อนรับสู่พาราด็อกซ์ของ Mixture of Experts

ตัวเลข “52.5 ล้านล้าน” แทนความจุพารามิเตอร์ทั้งหมดในสถาปัตยกรรม Mixture-of-Experts (MoE) ไม่ใช่พารามิเตอร์ “ที่ถูกเรียกใช้” เปรียบเหมือนความต่างระหว่างจำนวนหนังสือทั้งหมดในห้องสมุดกับ 3-5 เล่มที่คุณหยิบใช้ในงานวิจัยหนึ่งครั้ง แคตตาล็อกเต็มมีผลต่อศักยภาพ ส่วนชุดที่ใช้งานจริงกำหนดต้นทุน

หลักฐานชัด: GPT-OSS เผยแผน MoE ของ OpenAI

OpenAI เผลอเปิดไพ่

GPT-OSS-120b มีพารามิเตอร์ทั้งหมด 117 พันล้าน แต่แอคทีฟต่อคำขอเพียง 5.1 พันล้าน อัตราส่วน 23:1 ระหว่างขนาดคลังกับการใช้งานจริง

ต่อยอดคณิตนั้น ถ้า GPT-5 แอคทีฟ 2-5 ล้านล้านพารามิเตอร์ต่อคำขอ (ประมาณการที่อุตสาหกรรมเห็นพ้อง) และใช้อัตราส่วน MoE คล้ายกัน ความจุพารามิเตอร์รวมอาจแตะ 46-115 ล้านล้าน

จู่ๆ 52.5 ล้านล้านก็ไม่ใช่เรื่องเล่าจากอินเทอร์เน็ต—มันฟังดูเหมือนมีใครสักคนทำตัวเลข “จำนวนผู้เชี่ยวชาญทั้งหมด” หลุดออกมา ในขณะที่คนอื่นๆ รายงาน “พารามิเตอร์แอคทีฟ” โมเดลเดียวกัน วัดคนละอย่าง พาดหัวต่างกันคนละโลก

ทำไมการเปลี่ยนสถาปัตยกรรมนี้ถึงเปลี่ยนทุกอย่าง

สถาปัตยกรรม MoE ทำให้ลดต้นทุนคอมพิวต์ในช่วงพรีเทรนได้มาก และ inference เร็วขึ้น สำหรับคนที่สร้างโปรดักต์บน GPT-5 นี่ไม่ใช่วิชาการ—มันเขียนสมการเศรษฐศาสตร์ใหม่:

ต้นทุนของโมเดล dense แบบดั้งเดิม:

ทุกคำขอชนทุก 175B พารามิเตอร์ (สไตล์ GPT-3)
สเกลแบบเส้นตรง: พารามิเตอร์เพิ่ม 10x = คอมพิวต์ 10x = ราคา 10x
ราคาเข้าใจง่าย คาดเดาได้ แต่แพง

MoE เปลี่ยนสมการอย่างไร:

ตัวกำหนดเส้นทางตัดสินใจว่าจะปลุกผู้เชี่ยวชาญคนไหน ขึ้นกับชนิดบทสนทนา ความซับซ้อน และเจตนาผู้ใช้

ความจุรวม 50T อาจบิลแค่ 2T ที่แอคทีฟ
ความสามารถมโหฬาร ต้นทุนเศษเสี้ยว—แต่การตั้งราคากลายเป็นเรื่องขึ้นกับพรอมต์

หลักฐานโลกจริง:

GPT-5 โหมด reasoning แบบขยายใช้โทเค็นน้อยลง 50-80% เมื่อเทียบกับโมเดลใกล้เคียง นั่นไม่ใช่แค่การบีบอัด—แต่คือการรูตที่ฉลาดขึ้น หลีกเลี่ยงการปลุกผู้เชี่ยวชาญเกินจำเป็น

ข้อแลกเปลี่ยน? การออกแบบพรอมต์ของคุณส่งผลตรงว่าจะปลุกผู้เชี่ยวชาญชุดไหน ขอ “จัดหมวดอย่างรวดเร็ว” ก็อาจเรียกผู้เชี่ยวชาญเบาๆ ขอ “คิดอย่างระมัดระวังแบบหลายขั้นตอน” ก็อาจปลุกคลัสเตอร์ reasoning หนัก โมเดลเดียวกัน แต่ต้นทุนต่างกัน 3-5 เท่า

สรุปสั้นๆ: เวลาประเมินราคา GPT-5 ลืมจำนวนพารามิเตอร์พาดหัวไปก่อน ทดสอบพรอมต์จริงของคุณและวัดการใช้โทเค็น—MoE ทำให้สเปกเชิงทฤษฎีแทบไร้ประโยชน์ในการคาดต้นทุน

นักวิเคราะห์อุตสาหกรรมย้อนรอยสิ่งที่ OpenAI ไม่ยอมบอกอย่างไร

เมื่อ OpenAI ไม่เผยสเปก นักวิจัยจึงพัฒนาวิธีนิติเวชเพื่อประมาณขนาดโมเดล คิดซะว่าเป็น CSI สำหรับเครือข่ายประสาท

วิธีที่ 1: Regression จากผล Benchmark

นักวิเคราะห์ประมาณพารามิเตอร์โดยเทียบผลกับโมเดลที่ทราบขนาด ใช้สถิติกับข้อมูลจาก leaderboard

ขั้นตอน: รวบรวมคะแนนจากแพลตฟอร์มอย่าง Artificial Analysis, Chatbot Arena, และ HumanEval วางพล็อตโมเดลที่รู้ขนาด (Llama 3 405B, Claude Sonnet, ฯลฯ) บนกราฟ performance-vs-parameters คะแนนของ GPT-5 วางแล้วอยู่ในคลัสเตอร์ 2-5T เมื่อรันเส้น regression

ระดับความเชื่อมั่น: ปานกลาง สมมติว่าสเกลลอว์ยังใช้ได้ ซึ่งไม่การันตีกับนวัตกรรมสถาปัตยกรรม

วิธีที่ 2: นิติเวชฮาร์ดแวร์

การวิเคราะห์ของ Samsung ในงาน SemiCon Taiwan ประเมิน GPT-5 ที่ 3-5T พารามิเตอร์ ฝึกบน GPU NVIDIA B100 จำนวน 7,000× เครื่อง

เมื่อพาร์ตเนอร์ฮาร์ดแวร์ทำสเปกคลัสเตอร์ฝึกหลุด วิศวกร ML จะไล่ย้อนกลับ:

ความจุหน่วยความจำของ NVIDIA B100: เป็นที่รู้กัน
เวลาฝึกที่ประมาณการ: หลุดในช่องทางอุตสาหกรรม
จำนวนพารามิเตอร์ = f(GPU-months, แบนด์วิดท์หน่วยความจำ, ประสิทธิภาพการฝึก)

วิธีนี้ให้ “3-5T” ที่กลายเป็นฉันทามติของอุตสาหกรรม

ระดับความเชื่อมั่น: สูงสำหรับพารามิเตอร์แอคทีฟ Samsung ไม่มีแรงจูงใจจะกุข่าว และคณิตก็สอดคล้อง

วิธีที่ 3: ลายนิ้วมือจากประสิทธิภาพ API

ตรงนี้เริ่มแยบยลขึ้น สถาปัตยกรรมโมเดลทิ้งลายเซ็นด้านประสิทธิภาพไว้:

GPT-5 ยิงออก 87.4 โทเค็น/วินาที พร้อมเวลาไปยังโทเค็นแรก 84.78 วินาที

รูปแบบ latency บ่งชี้ overhead ของการรูตแบบ MoE (โมเดล dense มักเร็วกว่าในโทเค็นแรก)
อัตราทะลุผ่านของโทเค็นสัมพันธ์กับจำนวนพารามิเตอร์แอคทีฟจากโมเดลที่ทราบสเปก

วิศวกรที่รันงานโปรดักชันติดตามเมตริกเหล่านี้อย่างใกล้ชิด เทียบกับสเปกที่เผยของโมเดลโอเพ่น แล้วสามารถย้อนรอยสถาปัตยกรรมโดยประมาณ

ระดับความเชื่อมั่น: ปานกลางสำหรับชนิดสถาปัตยกรรม ต่ำสำหรับสเปกที่แน่นอน เพราะประสิทธิภาพขึ้นกับหลายตัวแปรมากกว่าพารามิเตอร์

วิธีที่ 4: ปัญญาชาวเน็ต

เมื่อหลายการวิเคราะห์อิสระมาบรรจบ ความเชื่อมั่นจะเพิ่ม ปัจจุบันเรามี:

ข้อมูลหลุดจาก Samsung: 3-5T พารามิเตอร์
สเกลลอว์เชิงสถิติ: ช่วง 2-5T
การวิเคราะห์ชุมชน R-bloggers: ขั้นต่ำ ~2T จากข้อกำหนดด้านความสามารถ
การแยกส่วนเทคนิคของ Encord: สถาปัตยกรรม MoE พร้อมความจุพารามิเตอร์ระดับหลายล้านล้าน

ฉันทามติในอุตสาหกรรมวาง GPT-5 ไว้ที่ 2-5 ล้านล้านพารามิเตอร์แอคทีฟ ใช้สถาปัตยกรรม MoE ไม่ใช่เพราะแหล่งใดแหล่งหนึ่งน่าเชื่อถือที่สุด แต่เพราะวิธีอิสระหลายแบบลงรอยกัน

สเปกตรัมความน่าเชื่อถือ

เอาตรงๆ ว่าเรารู้อะไรจริง:

ฉันทามตินักวิเคราะห์:

“อาจ OpenAI มีออปติไมซ์ลับที่เปลี่ยนสเกลลอว์—เป็นไปได้ แต่ประมาณการพวกนี้คงไม่ห่างไกลความจริงนัก”

วิวัฒนาการ GPT: จากพลังดิบสู่การรูตอัจฉริยะ

การเข้าใจสถาปัตยกรรม GPT-5 ต้องเห็นว่ามันเปลี่ยนไปไกลแค่ไหนใน 5 ปี

GPT-3 (2020): ใบสเปกสุดซื่อครั้งสุดท้าย

175 พันล้านพารามิเตอร์ แอคทีฟทุกคำขอ

สถาปัตยกรรมทรานส์ฟอร์เมอร์แบบ dense—เรียบง่ายงดงาม แต่แพงหูฉี่
พรีเทรนบนข้อความอินเทอร์เน็ต ~300 พันล้านคำ
เหตุการณ์ประวัติศาสตร์: โมเดลแรกที่โชว์ few-shot learning ขนาดใหญ่

OpenAI เผยทุกอย่าง พารามิเตอร์ ปริมาณข้อมูลฝึก ไดอะแกรมสถาปัตยกรรม ครั้งสุดท้ายที่เราได้ความโปร่งใสเต็มรูปแบบ

GPT-4 (2023): ก้าวกระโดดมัลติโหมดพร้อมม่านความลับ

จำนวนพารามิเตอร์:

ประมาณ ~1.8 ล้านล้าน ยังไม่ยืนยันจาก OpenAI

สถาปัตยกรรม: สงสัยว่าเป็น MoE ระยะแรก (ไม่เคยยืนยัน)
จุดเปลี่ยน: ความเข้าใจภาพแบบเนทีฟโดยไม่ต้องใช้โมเดลภาพแยก

ทำคะแนนแม่นยำเชิงข้อเท็จจริงสูงกว่า GPT-3 ราว 40%

นี่คือจุดที่ OpenAI หยุดแชร์รายละเอียดเทคนิค ไม่มีเปเปอร์สถาปัตยกรรม ไม่มีการยืนยันพารามิเตอร์ อุตสาหกรรมเลยเดาว่าโต ~10x จาก GPT-3 ตามผลการทดสอบ แต่ไม่เคยได้ใบเสร็จ

GPT-5 (2025): ปฏิวัติความมีประสิทธิภาพ

พารามิเตอร์:

ประมาณการในอุตสาหกรรม 2-5 ล้านล้านพารามิเตอร์แอคทีฟ

สถาปัตยกรรม: MoE ขั้นซับซ้อนพร้อมการรูตอัจฉริยะ (อนุมานจากพฤติกรรม ยังไม่ยืนยัน)
ระบบรวมที่มีโมเดลเร็ว โหมด reasoning ลึก (GPT-5 thinking) และตัวรูตเรียลไทม์
ลายเซ็นประสิทธิภาพ:

อัตราเอาต์พุต 87.4 โทเค็น/วินาที เวลาไปยังโทเค็นแรก 84.78 วินาที

ภาพชัด: GPT-3 → GPT-4 กระโดด 10x พารามิเตอร์ GPT-4 → GPT-5 อาจเพิ่มเพียง 2-3x ในพารามิเตอร์แอคทีฟ แต่ความซับซ้อนของสถาปัตยกรรมโตแบบก้าวกระโดด

เวทีแข่งขัน: ทุกเจ้าก็เล่นเกมความลับเหมือนกัน

OpenAI ไม่ได้เริ่มเทรนด์ปกปิดพารามิเตอร์—พวกเขาเพียงเดินตามอุตสาหกรรม:

Claude (Anthropic):

พารามิเตอร์ไม่เปิดเผย ประมาณ 1-3T โดยนักวิเคราะห์อิสระ

Gemini Ultra (Google):

ขนาดการฝึกและจำนวนพารามิเตอร์ไม่เปิดเผยต่อสาธารณะ

Llama 3 (Meta): ผู้เล่นโอเพ่นซอร์สรายสุดท้ายที่ยังเผยสเปก (405B สำหรับรุ่นใหญ่สุด)

ไทม์ไลน์ภาพรวม:

*เฉพาะพารามิเตอร์แอคทีฟ

ความจุรวมของ MoE: สูงกว่า 10-25 เท่า (ยังไม่ยืนยัน)

สิ่งที่มีความหมายจริง ถ้าคุณกำลังสร้างบน GPT-5

ปริศนาพารามิเตอร์เหมาะกับคอลัมน์เทค แต่ถ้าคุณเป็น PM ที่ประเมินการใช้งาน AI หรือวิศวกรที่สร้างระบบโปรดักชัน นี่คือสิ่งที่สำคัญจริง:

คิดใหม่เรื่องโมเดลต้นทุน

การตั้งราคาแบบเดิมสมมติความสัมพันธ์เชิงเส้นระหว่างพารามิเตอร์กับต้นทุน MoE ทำลายโมเดลนั้น

กรอบคิดเก่า (ยุค GPT-3):

คำของ่าย: 175B พารามิเตอร์ × อัตรา = $X

คำขอยาก: 175B พารามิเตอร์ × อัตรา = $X

(คาดเดาง่าย น่าเบื่อ แต่แพง)

ความจริงใหม่ (MoE ของ GPT-5):

งานจัดหมวด: แอคทีฟ ~1-2T = $X

reasoning ลึก: แอคทีฟ ~4-5T = $4-5X

โหมดคิดขยาย: จำนวนผู้เชี่ยวชาญแปรผัน = ???

ตัวรูตของ GPT-5 เลือกผู้เชี่ยวชาญตามชนิดบทสนทนา ความซับซ้อน ความต้องการใช้เครื่องมือ และเจตนาผู้ใช้โดยชัดแจ้ง แปลว่า: วิธีวางพรอมต์ของคุณมีผลโดยตรงต่อบิล

การปรับแต่งที่ทำได้จริง:

ทดสอบพรอมต์ด้วยสัญญาณความซับซ้อนอย่างชัดเจน (“จัดหมวดอย่างรวดเร็ว…” vs “คิดทีละขั้นตอน…”)
เฝ้าดูว่าวิธีเขียนแบบไหนเรียกโหมด reasoning แบบขยาย
สำหรับงานปริมาณมาก ออกแบบพรอมต์เพื่อหลีกเลี่ยงการปลุกผู้เชี่ยวชาญเกินจำเป็น

หนึ่งทีมที่เราคุยด้วยลดค่าใช้จ่าย API ของ GPT-5 ได้ 40% เพียงแค่ถอด “อธิบายเหตุผลของคุณ” ออกจากพรอมต์งานจัดหมวด ความแม่นเท่าเดิม แต่แอคทิเวตผู้เชี่ยวชาญแค่ 60%

กลยุทธ์สถาปัตยกรรมแอป

ไม่ใช่ทุกงานต้องใช้คณะผู้เชี่ยวชาญเต็มชุดของ GPT-5 จับคู่ภาระงานกับรุ่นโมเดลให้เหมาะ:

เมื่อใดที่ GPT-5 คุ้ม:

reasoning ข้ามโดเมน (โค้ด → ลอจิกธุรกิจ → ออกแบบ UI)
งานที่ต้องสลับความเชี่ยวชาญกลางบทสนทนา
การแตกปัญหาซับซ้อนที่โมเดลเล็กพัง
สถานการณ์ที่ความแม่นยำสำคัญกว่าค่าต่อคำขอ

เมื่อโมเดลเล็กชนะ:

งานจัดหมวด/ดึงข้อมูลปริมาณสูง
แชตเรียบง่ายที่รูปแบบคาดเดาได้
แอปที่ไวต่อ latency (MoE เพิ่ม overhead 50-100 มิลลิวินาที)
โปรดักต์จำกัดงบที่ “ดีพอ” ชนะ “ดีที่สุด”

กลยุทธ์หลายโมเดล

ทีมที่ฉลาดไม่ได้เลือก GPT-5 vs. Claude vs. Gemini—แต่ใช้ทั้งสามแบบยุทธศาสตร์ ตรงนี้เองที่แพลตฟอร์มอย่าง CometAPI สำคัญ

ลองนึกภาพต้องจัดการอินทิเกรชัน API สามเจ้า: วิธี auth ต่างกัน รูปแบบตอบกลับไม่เหมือน บิลลิงแยกกัน แล้วคูณด้วยรุ่นย่อยทุกตัว (GPT-5, Claude Opus4.7, Gemini 3.1 Pro…)

CometAPI แก้ด้วยการยกเลเยอร์อินทิเกรชันขึ้น:

การเข้าถึงแบบรวม: Endpoint เดียวนำทางไปยัง GPT-5, Claude, Gemini หรือโมเดลโอเพ่นตามลอจิกของคุณ ออปติไมซ์ต้นทุนอัตโนมัติ: ส่งงานง่ายไปโมเดลถูก งาน reasoning หนักไป GPT-5 เฟรมเวิร์ก A/B testing:

เทียบประสิทธิภาพโมเดลกับภาระงานจริงของคุณด้วยการ benchmark เชิงประจักษ์—latency, throughput, ต้นทุน และความแม่นยำบนพรอมต์ตัวแทน

API ของ GPT-5 เพิ่มพารามิเตอร์ใหม่ รวมถึงการควบคุม verbosity และค่าความพยายาม reasoning CometAPI มีแม่แบบคอนฟิกที่ทดสอบแล้ว เพื่อให้คุณไม่ต้องลองผิดลองถูก

พูดตรงๆ: เราเห็นทีมใช้เวลา 2-3 เดือนสร้างลอจิกการรูตหลายโมเดลที่ CometAPI มีให้พร้อมจากกล่อง เว้นแต่ว่าการจัดการหลายโมเดลคือแกนหลักธุรกิจของคุณ ใช้เลเยอร์คนอื่นจะดีกว่า

ปัญหาเอกสาร (และปวดหัวเรื่องคอมพลายแอนซ์)

ทีมกฎหมาย จัดซื้อ และสถาปัตยกรรมองค์กรอยากได้สเปกที่ชัดเจน “อุตสาหกรรมประมาณ 2-5T พารามิเตอร์” ไม่ผ่านแบบฟอร์มคัดเลือกซัพพลายเออร์

เมื่อบันทึกจำนวนพารามิเตอร์ ให้ระบุว่าคุณอ้างถึงความจุรวม (เกี่ยวกับ storage/ลิขสิทธิ์) หรือพารามิเตอร์แอคทีฟต่อโทเค็น (เกี่ยวกับ compute ตอนรันไทม์)

ถ้อยคำแม่แบบสำหรับเอกสารทางการ:

“OpenAI GPT-5 ประเมินว่ามี 2-5 ล้านล้านพารามิเตอร์แอคทีฟ อ้างอิงการวิเคราะห์อิสระในอุตสาหกรรม (แหล่งที่มา: พรีเซนต์ Samsung SemiCon, แบบจำลองสเกลลอว์เชิงสถิติ, การทดสอบประสิทธิภาพ) ความจุพารามิเตอร์รวมอาจสูงกว่า 10-25× หากใช้สถาปัตยกรรม Mixture-of-Experts OpenAI ยังไม่ได้ยืนยันสเปกเหล่านี้อย่างเป็นทางการ การประเมินอัปเดตล่าสุด ณ เมษายน 2026”

ใส่ที่มา ระบุวันที่ประเมิน และปักหมุดความไม่แน่นอน เมื่อ (ไม่ใช่ถ้า) มีคนขอ “ยืนยันทางการ” ให้ escalate ไปฝ่ายขายองค์กรของ OpenAI—บางครั้งพวกเขาให้รายละเอียดสถาปัตยกรรมแบบจำกัดภายใต้ NDA สำหรับสัญญาใหญ่

เรื่องจริง: ทำไมการนับพารามิเตอร์เป็นเมตริกของเมื่อวาน

ความหมกมุ่นกับ “GPT-5 มีกี่พารามิเตอร์” คล้ายดีเบตเทคในอดีตที่ตกรุ่นแล้ว:

ยุค 2000s: สงครามเมกะพิกเซลในกล้อง (12MP vs 16MP vs 20MP!)
- ความจริง: คุณภาพเซ็นเซอร์และเลนส์สำคัญกว่า
ยุค 2010s: แข่งกิกะเฮิรตซ์ CPU (3.2GHz vs 3.8GHz!)
- ความจริง: ประสิทธิภาพสถาปัตยกรรมและมัลติคอร์ชนะ
ยุค 2020s: การนับพารามิเตอร์ AI (175B vs 1.8T vs 52.5T!)
- ความจริง: สถาปัตยกรรม ความฉลาดในการรูต และการออปติไมซ์เฉพาะงานสำคัญกว่า

GPT-5 พร้อมโหมด reasoning ทำผลงานแซงโมเดลที่ใหญ่กว่า ขณะสร้างเอาต์พุตน้อยลง 50-80% นั่นไม่ใช่แค่ประสิทธิภาพ—คือหลักฐานว่า “ฉลาดชนะใหญ่”

สิ่งที่เรารู้ด้วยความมั่นใจ

GPT-5 ใช้สถาปัตยกรรม Mixture-of-Experts — พิสูจน์โดยงานคู่ขนาน GPT-OSS และลายเซ็นประสิทธิภาพ
พารามิเตอร์แอคทีฟน่าจะอยู่ช่วง 2-5T — การประมาณหลายแหล่งอิสระบรรจบกัน
พูลผู้เชี่ยวชาญรวมอาจแตะ 10-50T+ — อนุมานจากอัตราส่วน MoE ยังไม่ยืนยัน
OpenAI จะไม่ยืนยันสเปก — กลยุทธ์การแข่งขันและความปลอดภัยโดยตั้งใจ
ประสิทธิภาพเกินกว่าที่จำนวนพารามิเตอร์ทำนาย — คะแนน benchmark บ่งชี้ข้อได้เปรียบจากสถาปัตยกรรมมากกว่าขนาดดิบ

สิ่งที่สำคัญจริงสำหรับกลยุทธ์ AI ของคุณ

หยุดออปติไมซ์ตามสเปกพาดหัว เริ่มวัดสิ่งที่คุณจะจ่ายจริงและสิ่งที่ผู้ใช้จะสัมผัส:

การทดสอบเฉพาะงาน: รันพรอมต์จริงของคุณผ่าน GPT-5, Claude, และ Gemini โมเดลที่รับมือโดเมนของคุณได้ดีที่สุดอาจไม่ใช่ตัวใหญ่สุด

ต้นทุนต่อเอาต์พุตที่มีประโยชน์: โมเดลที่ตอบถูกทีเดียวจบ ชนะโมเดลถูกกว่าที่ต้องถามซ้ำสามรอบ

โปรไฟล์ latency ใต้โหลด: ทดสอบที่สเกล overhead ของ MoE อาจฆ่าประสิทธิภาพสำหรับแอปไวต่อเวลา

วิเคราะห์โหมดล้มเหลว: โมเดลหลอนหรือปฏิเสธงานตรงไหน? กรณีขอบสำคัญกว่าค่าเฉลี่ย

คำถาม 52.5 ล้านล้าน คำตอบมาแล้ว

GPT-5 มี 52.5 ล้านล้านพารามิเตอร์จริงไหม?

อาจจะ ถ้าคุณนับความจุผู้เชี่ยวชาญรวมของ MoE และมีคนทำสเปกภายในที่ถูกต้องหลุดมา น่าจะไม่ ถ้าหมายถึงพารามิเตอร์แอคทีฟต่อคำขอ ชวนเข้าใจผิดแน่ๆ ถ้าคุณเทียบกับสถาปัตยกรรม dense 175B ของ GPT-3

ตัวเลขไม่ได้ “ผิด”—แต่มันเป็น “ตัวเลขผิดเรื่อง” ที่ควรสนใจ

จำนวนรวมของ MoE มีประโยชน์ต่อการคุยเรื่อง storage และลิขสิทธิ์ ในขณะที่พารามิเตอร์แอคทีฟสำคัญต่อ compute ตอนรันไทม์

ถามว่า “GPT-5 ใหญ่แค่ไหน” โดยไม่ระบุเมตริก ก็เหมือนถามว่า “ห้องสมุดใหญ่แค่ไหน”—คุณวัดพื้นที่ชั้น หนังสือที่ยืมอยู่ หรือจำนวนหนังสือทั้งหมด?

อนาคต: เตรียมรับความลับมากขึ้น ไม่ใช่น้อยลง

การปิดบังพารามิเตอร์ของ OpenAI ไม่ใช่ชั่วคราว คาดว่า:

การแข่งขันเข้มข้นขึ้น → ห้องทดลองทุกเจ้าจะปิดบังสถาปัตยกรรมมากขึ้น
การตลาดเน้นความสามารถ → “แก้โจทย์ X ได้ดีขึ้น Y%” แทนการนับพารามิเตอร์
การทดสอบแบบกล่องดำ → การประเมินโดยบุคคลที่สามจะกลายเป็นความโปร่งใสเดียว

ตระกูล Llama ของ Meta ยังเป็นผู้เล่นรายใหญ่รายสุดท้ายที่เผยสเปก รายอื่นเดินตาม OpenAI เข้าสู่ความทึบ

สำหรับนักพัฒนาและทีมโปรดักต์ นี่หมายถึง:

✅ สร้างระบบที่ไม่ยึดติดผู้ให้บริการโมเดลรายเดียว — อย่าผูกสถาปัตยกรรมกับสเปกของ GPT-5 ที่อาจเปลี่ยน

✅ ใช้เลเยอร์นามธรรม — แพลตฟอร์มอย่าง CometAPI ป้องกันความผันผวนของผู้ให้บริการ

✅ ทดสอบ benchmark ตลอดเวลา — สิ่งที่เหมาะสุดวันนี้ อาจไม่ใช่ในอีกหกเดือน

✅ โฟกัสผลลัพธ์ — ใบสเปกกำลังหายไป แต่เมตริกประสิทธิภาพไม่หาย

สรุปสำคัญ

ปริศนาพารามิเตอร์สุดท้ายจะคลายเอง—จากข่าวหลุด ข่าวกรองการแข่งขัน หรือความโปร่งใสของ OpenAI ในที่สุด แต่กว่าคุณจะได้คำตอบแน่ชัด GPT-6 ก็คงอยู่ในเบต้าแบบส่วนตัวและเส้นประตูก็จะขยับอีกครั้ง

ปล่อยให้คู่แข่งเถียงกันว่า 2T หรือ 52.5T คุณควรส่งโปรดักต์ที่ใช้งานได้จริง

สิ่งที่เรากล้ายืนยัน:

GPT-5 ใหญ่ (หลายล้านล้านพารามิเตอร์)
ฉลาด (MoE รูตอย่างมีประสิทธิภาพ)
ทึบ (OpenAI ไม่ยืนยันสเปก)
ได้ผล (ผลงานเกินกว่าที่จำนวนพารามิเตอร์ทำนาย)

คุณวัดจำนวนพารามิเตอร์ไม่ได้ แต่คุณวัดได้ว่า:

อัตราความสำเร็จของงานระหว่าง GPT-5, Claude Opus 4.7, Gemini 3.1 Pro
ต้นทุนต่อ 1K คำขอสำหรับภาระงานของคุณ
latency P95 เมื่อทราฟฟิกพุ่ง
ความแม่นของโมเดลบนกรณีขอบของคุณ

CometAPI: ตัวรวม API โมเดล AI แบบ unified — ใช้คีย์เดียวเข้าถึง 500+ โมเดลจาก OpenAI, Anthropic, Google และอีกมาก ในราคาต่ำกว่าเรตทางการ 20%

ทดสอบข้ามโมเดลได้ใน 5 นาที → เริ่มด้วยเครดิตฟรี