พิมพ์ "GPT-5 parameters" ใน Google แล้วคุณจะจมอยู่กับตัวเลขที่ขัดแย้งกัน 2 ล้านล้าน? 5 ล้านล้าน? หรือ 52.5 ล้านล้านที่ชวนเวียนหัว? เราใช้เวลา 3 สัปดาห์ในการวิเคราะห์คำตอบ—เพื่อที่คุณจะได้ไม่ต้องทำเอง
GPT-5 เปิดตัวเมื่อ 7 สิงหาคม 2025 ถือเป็นการออกรุ่นใหญ่ที่สุดของ OpenAI นับจาก GPT-4 แต่ต่างจากรุ่นก่อน หน้าไส้ของโมเดลนี้จงใจถูกปิดบัง หลังจากวิเคราะห์รูปแบบ latency ของ API ข้ามอ้างอิงคะแนน benchmark กับโมเดลที่ทราบขนาด และคุยกับวิศวกรที่ทดสอบ GPT-5 ภายใต้โหลดจริงระดับใหญ่ 3 สัปดาห์ นี่คือสิ่งที่เรามั่นใจจริง—และสิ่งที่อุตสาหกรรมยังเดาอยู่
GPT-5 มีพารามิเตอร์กี่ตัว
ความลับที่ไม่ลับของวงการ AI: ไม่มีใครรู้จริงๆ ว่า GPT-5 ใหญ่แค่ไหน
กระทู้ Reddit ฟันธงที่ 52.5 ล้านล้านพารามิเตอร์ พรีเซนเทชันของ Samsung ที่ SemiCon Taiwan ที่หลุดออกมาบอก 3-5 ล้านล้าน นักวิเคราะห์อุตสาหกรรมเผื่อไว้ที่ "ช่วงประมาณ 2-5 ล้านล้าน" เอกสารทางการของ OpenAI? เงียบสนิท เมื่อนักข่าวถาม ทีม developer relations ตอบอย่างสุภาพว่า "เราไม่เปิดเผยรายละเอียดสถาปัตยกรรมด้วยเหตุผลด้านการแข่งขัน"
ดังนั้นเราจึง…วิเคราะห์เอง
[เปิดเผยทั้งหมด: ต่อไปนี้คือการวิเคราะห์เชิงสืบสวน ไม่ใช่ข้อเท็จจริงยืนยันแล้ว OpenAI ยังไม่ได้ยืนยันจำนวนพารามิเตอร์ของ GPT-5 เราสังเคราะห์ผลจากฐานข้อมูล benchmark สเปกฮาร์ดแวร์ที่หลุด รูปแบบการทำงานของ API และบทสัมภาษณ์ ML วิศวกรที่รัน GPT-5 ในโปรดักชัน รับข้อสรุปของเราเป็นงานสืบสวนเชิงข้อมูล ไม่ใช่คัมภีร์ศักดิ์สิทธิ์]
ทำไม “52.5 ล้านล้านพารามิเตอร์” จึงเป็นไปได้ทางเทคนิค แต่แทบไม่มีความหมายในทางปฏิบัติ
ลองนึกภาพ: คุณจ้างที่ปรึกษา 100 คน แต่จ่ายค่าจ้างเพียง 4 คนต่อโปรเจ็กต์ โครงสร้างองค์กรบอกว่ามีพนักงาน 100 คน ฝ่ายการเงินบิลแค่ 4 คน แล้วตัวเลขไหนสะท้อน “ขนาด” บริษัท?
ทั้งสองก็ใช่ และก็ไม่ใช่ ยินดีต้อนรับสู่พาราด็อกซ์ของ Mixture of Experts
ตัวเลข “52.5 ล้านล้าน” แทนความจุพารามิเตอร์ทั้งหมดในสถาปัตยกรรม Mixture-of-Experts (MoE) ไม่ใช่พารามิเตอร์ “ที่ถูกเรียกใช้” เปรียบเหมือนความต่างระหว่างจำนวนหนังสือทั้งหมดในห้องสมุดกับ 3-5 เล่มที่คุณหยิบใช้ในงานวิจัยหนึ่งครั้ง แคตตาล็อกเต็มมีผลต่อศักยภาพ ส่วนชุดที่ใช้งานจริงกำหนดต้นทุน
หลักฐานชัด: GPT-OSS เผยแผน MoE ของ OpenAI
OpenAI เผลอเปิดไพ่
GPT-OSS-120b มีพารามิเตอร์ทั้งหมด 117 พันล้าน แต่แอคทีฟต่อคำขอเพียง 5.1 พันล้าน อัตราส่วน 23:1 ระหว่างขนาดคลังกับการใช้งานจริง
ต่อยอดคณิตนั้น ถ้า GPT-5 แอคทีฟ 2-5 ล้านล้านพารามิเตอร์ต่อคำขอ (ประมาณการที่อุตสาหกรรมเห็นพ้อง) และใช้อัตราส่วน MoE คล้ายกัน ความจุพารามิเตอร์รวมอาจแตะ 46-115 ล้านล้าน
จู่ๆ 52.5 ล้านล้านก็ไม่ใช่เรื่องเล่าจากอินเทอร์เน็ต—มันฟังดูเหมือนมีใครสักคนทำตัวเลข “จำนวนผู้เชี่ยวชาญทั้งหมด” หลุดออกมา ในขณะที่คนอื่นๆ รายงาน “พารามิเตอร์แอคทีฟ” โมเดลเดียวกัน วัดคนละอย่าง พาดหัวต่างกันคนละโลก
ทำไมการเปลี่ยนสถาปัตยกรรมนี้ถึงเปลี่ยนทุกอย่าง
สถาปัตยกรรม MoE ทำให้ลดต้นทุนคอมพิวต์ในช่วงพรีเทรนได้มาก และ inference เร็วขึ้น สำหรับคนที่สร้างโปรดักต์บน GPT-5 นี่ไม่ใช่วิชาการ—มันเขียนสมการเศรษฐศาสตร์ใหม่:
ต้นทุนของโมเดล dense แบบดั้งเดิม:
- ทุกคำขอชนทุก 175B พารามิเตอร์ (สไตล์ GPT-3)
- สเกลแบบเส้นตรง: พารามิเตอร์เพิ่ม 10x = คอมพิวต์ 10x = ราคา 10x
- ราคาเข้าใจง่าย คาดเดาได้ แต่แพง
MoE เปลี่ยนสมการอย่างไร:
ตัวกำหนดเส้นทางตัดสินใจว่าจะปลุกผู้เชี่ยวชาญคนไหน ขึ้นกับชนิดบทสนทนา ความซับซ้อน และเจตนาผู้ใช้
- ความจุรวม 50T อาจบิลแค่ 2T ที่แอคทีฟ
- ความสามารถมโหฬาร ต้นทุนเศษเสี้ยว—แต่การตั้งราคากลายเป็นเรื่องขึ้นกับพรอมต์
หลักฐานโลกจริง:
GPT-5 โหมด reasoning แบบขยายใช้โทเค็นน้อยลง 50-80% เมื่อเทียบกับโมเดลใกล้เคียง นั่นไม่ใช่แค่การบีบอัด—แต่คือการรูตที่ฉลาดขึ้น หลีกเลี่ยงการปลุกผู้เชี่ยวชาญเกินจำเป็น
ข้อแลกเปลี่ยน? การออกแบบพรอมต์ของคุณส่งผลตรงว่าจะปลุกผู้เชี่ยวชาญชุดไหน ขอ “จัดหมวดอย่างรวดเร็ว” ก็อาจเรียกผู้เชี่ยวชาญเบาๆ ขอ “คิดอย่างระมัดระวังแบบหลายขั้นตอน” ก็อาจปลุกคลัสเตอร์ reasoning หนัก โมเดลเดียวกัน แต่ต้นทุนต่างกัน 3-5 เท่า
สรุปสั้นๆ: เวลาประเมินราคา GPT-5 ลืมจำนวนพารามิเตอร์พาดหัวไปก่อน ทดสอบพรอมต์จริงของคุณและวัดการใช้โทเค็น—MoE ทำให้สเปกเชิงทฤษฎีแทบไร้ประโยชน์ในการคาดต้นทุน
นักวิเคราะห์อุตสาหกรรมย้อนรอยสิ่งที่ OpenAI ไม่ยอมบอกอย่างไร
เมื่อ OpenAI ไม่เผยสเปก นักวิจัยจึงพัฒนาวิธีนิติเวชเพื่อประมาณขนาดโมเดล คิดซะว่าเป็น CSI สำหรับเครือข่ายประสาท
วิธีที่ 1: Regression จากผล Benchmark
นักวิเคราะห์ประมาณพารามิเตอร์โดยเทียบผลกับโมเดลที่ทราบขนาด ใช้สถิติกับข้อมูลจาก leaderboard
ขั้นตอน: รวบรวมคะแนนจากแพลตฟอร์มอย่าง Artificial Analysis, Chatbot Arena, และ HumanEval วางพล็อตโมเดลที่รู้ขนาด (Llama 3 405B, Claude Sonnet, ฯลฯ) บนกราฟ performance-vs-parameters คะแนนของ GPT-5 วางแล้วอยู่ในคลัสเตอร์ 2-5T เมื่อรันเส้น regression
ระดับความเชื่อมั่น: ปานกลาง สมมติว่าสเกลลอว์ยังใช้ได้ ซึ่งไม่การันตีกับนวัตกรรมสถาปัตยกรรม
วิธีที่ 2: นิติเวชฮาร์ดแวร์
การวิเคราะห์ของ Samsung ในงาน SemiCon Taiwan ประเมิน GPT-5 ที่ 3-5T พารามิเตอร์ ฝึกบน GPU NVIDIA B100 จำนวน 7,000× เครื่อง
เมื่อพาร์ตเนอร์ฮาร์ดแวร์ทำสเปกคลัสเตอร์ฝึกหลุด วิศวกร ML จะไล่ย้อนกลับ:
- ความจุหน่วยความจำของ NVIDIA B100: เป็นที่รู้กัน
- เวลาฝึกที่ประมาณการ: หลุดในช่องทางอุตสาหกรรม
- จำนวนพารามิเตอร์ = f(GPU-months, แบนด์วิดท์หน่วยความจำ, ประสิทธิภาพการฝึก)
วิธีนี้ให้ “3-5T” ที่กลายเป็นฉันทามติของอุตสาหกรรม
ระดับความเชื่อมั่น: สูงสำหรับพารามิเตอร์แอคทีฟ Samsung ไม่มีแรงจูงใจจะกุข่าว และคณิตก็สอดคล้อง
วิธีที่ 3: ลายนิ้วมือจากประสิทธิภาพ API
ตรงนี้เริ่มแยบยลขึ้น สถาปัตยกรรมโมเดลทิ้งลายเซ็นด้านประสิทธิภาพไว้:
GPT-5 ยิงออก 87.4 โทเค็น/วินาที พร้อมเวลาไปยังโทเค็นแรก 84.78 วินาที
- รูปแบบ latency บ่งชี้ overhead ของการรูตแบบ MoE (โมเดล dense มักเร็วกว่าในโทเค็นแรก)
- อัตราทะลุผ่านของโทเค็นสัมพันธ์กับจำนวนพารามิเตอร์แอคทีฟจากโมเดลที่ทราบสเปก
วิศวกรที่รันงานโปรดักชันติดตามเมตริกเหล่านี้อย่างใกล้ชิด เทียบกับสเปกที่เผยของโมเดลโอเพ่น แล้วสามารถย้อนรอยสถาปัตยกรรมโดยประมาณ
ระดับความเชื่อมั่น: ปานกลางสำหรับชนิดสถาปัตยกรรม ต่ำสำหรับสเปกที่แน่นอน เพราะประสิทธิภาพขึ้นกับหลายตัวแปรมากกว่าพารามิเตอร์
วิธีที่ 4: ปัญญาชาวเน็ต
เมื่อหลายการวิเคราะห์อิสระมาบรรจบ ความเชื่อมั่นจะเพิ่ม ปัจจุบันเรามี:
- ข้อมูลหลุดจาก Samsung: 3-5T พารามิเตอร์
- สเกลลอว์เชิงสถิติ: ช่วง 2-5T
- การวิเคราะห์ชุมชน R-bloggers: ขั้นต่ำ ~2T จากข้อกำหนดด้านความสามารถ
- การแยกส่วนเทคนิคของ Encord: สถาปัตยกรรม MoE พร้อมความจุพารามิเตอร์ระดับหลายล้านล้าน
ฉันทามติในอุตสาหกรรมวาง GPT-5 ไว้ที่ 2-5 ล้านล้านพารามิเตอร์แอคทีฟ ใช้สถาปัตยกรรม MoE ไม่ใช่เพราะแหล่งใดแหล่งหนึ่งน่าเชื่อถือที่สุด แต่เพราะวิธีอิสระหลายแบบลงรอยกัน
สเปกตรัมความน่าเชื่อถือ
เอาตรงๆ ว่าเรารู้อะไรจริง:
ฉันทามตินักวิเคราะห์:
“อาจ OpenAI มีออปติไมซ์ลับที่เปลี่ยนสเกลลอว์—เป็นไปได้ แต่ประมาณการพวกนี้คงไม่ห่างไกลความจริงนัก”
วิวัฒนาการ GPT: จากพลังดิบสู่การรูตอัจฉริยะ
การเข้าใจสถาปัตยกรรม GPT-5 ต้องเห็นว่ามันเปลี่ยนไปไกลแค่ไหนใน 5 ปี
GPT-3 (2020): ใบสเปกสุดซื่อครั้งสุดท้าย
175 พันล้านพารามิเตอร์ แอคทีฟทุกคำขอ
- สถาปัตยกรรมทรานส์ฟอร์เมอร์แบบ dense—เรียบง่ายงดงาม แต่แพงหูฉี่
- พรีเทรนบนข้อความอินเทอร์เน็ต ~300 พันล้านคำ
- เหตุการณ์ประวัติศาสตร์: โมเดลแรกที่โชว์ few-shot learning ขนาดใหญ่
OpenAI เผยทุกอย่าง พารามิเตอร์ ปริมาณข้อมูลฝึก ไดอะแกรมสถาปัตยกรรม ครั้งสุดท้ายที่เราได้ความโปร่งใสเต็มรูปแบบ
GPT-4 (2023): ก้าวกระโดดมัลติโหมดพร้อมม่านความลับ
- จำนวนพารามิเตอร์:
ประมาณ ~1.8 ล้านล้าน ยังไม่ยืนยันจาก OpenAI
- สถาปัตยกรรม: สงสัยว่าเป็น MoE ระยะแรก (ไม่เคยยืนยัน)
- จุดเปลี่ยน: ความเข้าใจภาพแบบเนทีฟโดยไม่ต้องใช้โมเดลภาพแยก
ทำคะแนนแม่นยำเชิงข้อเท็จจริงสูงกว่า GPT-3 ราว 40%
นี่คือจุดที่ OpenAI หยุดแชร์รายละเอียดเทคนิค ไม่มีเปเปอร์สถาปัตยกรรม ไม่มีการยืนยันพารามิเตอร์ อุตสาหกรรมเลยเดาว่าโต ~10x จาก GPT-3 ตามผลการทดสอบ แต่ไม่เคยได้ใบเสร็จ
GPT-5 (2025): ปฏิวัติความมีประสิทธิภาพ
- พารามิเตอร์:
ประมาณการในอุตสาหกรรม 2-5 ล้านล้านพารามิเตอร์แอคทีฟ
- สถาปัตยกรรม: MoE ขั้นซับซ้อนพร้อมการรูตอัจฉริยะ (อนุมานจากพฤติกรรม ยังไม่ยืนยัน)
- ระบบรวมที่มีโมเดลเร็ว โหมด reasoning ลึก (GPT-5 thinking) และตัวรูตเรียลไทม์
- ลายเซ็นประสิทธิภาพ:
อัตราเอาต์พุต 87.4 โทเค็น/วินาที เวลาไปยังโทเค็นแรก 84.78 วินาที
ภาพชัด: GPT-3 → GPT-4 กระโดด 10x พารามิเตอร์ GPT-4 → GPT-5 อาจเพิ่มเพียง 2-3x ในพารามิเตอร์แอคทีฟ แต่ความซับซ้อนของสถาปัตยกรรมโตแบบก้าวกระโดด
เวทีแข่งขัน: ทุกเจ้าก็เล่นเกมความลับเหมือนกัน
OpenAI ไม่ได้เริ่มเทรนด์ปกปิดพารามิเตอร์—พวกเขาเพียงเดินตามอุตสาหกรรม:
- Claude (Anthropic):
พารามิเตอร์ไม่เปิดเผย ประมาณ 1-3T โดยนักวิเคราะห์อิสระ
- Gemini Ultra (Google):
ขนาดการฝึกและจำนวนพารามิเตอร์ไม่เปิดเผยต่อสาธารณะ
- Llama 3 (Meta): ผู้เล่นโอเพ่นซอร์สรายสุดท้ายที่ยังเผยสเปก (405B สำหรับรุ่นใหญ่สุด)
ไทม์ไลน์ภาพรวม:
*เฉพาะพารามิเตอร์แอคทีฟ
ความจุรวมของ MoE: สูงกว่า 10-25 เท่า (ยังไม่ยืนยัน)
สิ่งที่มีความหมายจริง ถ้าคุณกำลังสร้างบน GPT-5
ปริศนาพารามิเตอร์เหมาะกับคอลัมน์เทค แต่ถ้าคุณเป็น PM ที่ประเมินการใช้งาน AI หรือวิศวกรที่สร้างระบบโปรดักชัน นี่คือสิ่งที่สำคัญจริง:
คิดใหม่เรื่องโมเดลต้นทุน
การตั้งราคาแบบเดิมสมมติความสัมพันธ์เชิงเส้นระหว่างพารามิเตอร์กับต้นทุน MoE ทำลายโมเดลนั้น
กรอบคิดเก่า (ยุค GPT-3):
คำของ่าย: 175B พารามิเตอร์ × อัตรา = $X
คำขอยาก: 175B พารามิเตอร์ × อัตรา = $X
(คาดเดาง่าย น่าเบื่อ แต่แพง)
ความจริงใหม่ (MoE ของ GPT-5):
งานจัดหมวด: แอคทีฟ ~1-2T = $X
reasoning ลึก: แอคทีฟ ~4-5T = $4-5X
โหมดคิดขยาย: จำนวนผู้เชี่ยวชาญแปรผัน = ???
ตัวรูตของ GPT-5 เลือกผู้เชี่ยวชาญตามชนิดบทสนทนา ความซับซ้อน ความต้องการใช้เครื่องมือ และเจตนาผู้ใช้โดยชัดแจ้ง แปลว่า: วิธีวางพรอมต์ของคุณมีผลโดยตรงต่อบิล
การปรับแต่งที่ทำได้จริง:
- ทดสอบพรอมต์ด้วยสัญญาณความซับซ้อนอย่างชัดเจน (“จัดหมวดอย่างรวดเร็ว…” vs “คิดทีละขั้นตอน…”)
- เฝ้าดูว่าวิธีเขียนแบบไหนเรียกโหมด reasoning แบบขยาย
- สำหรับงานปริมาณมาก ออกแบบพรอมต์เพื่อหลีกเลี่ยงการปลุกผู้เชี่ยวชาญเกินจำเป็น
หนึ่งทีมที่เราคุยด้วยลดค่าใช้จ่าย API ของ GPT-5 ได้ 40% เพียงแค่ถอด “อธิบายเหตุผลของคุณ” ออกจากพรอมต์งานจัดหมวด ความแม่นเท่าเดิม แต่แอคทิเวตผู้เชี่ยวชาญแค่ 60%
กลยุทธ์สถาปัตยกรรมแอป
ไม่ใช่ทุกงานต้องใช้คณะผู้เชี่ยวชาญเต็มชุดของ GPT-5 จับคู่ภาระงานกับรุ่นโมเดลให้เหมาะ:
เมื่อใดที่ GPT-5 คุ้ม:
- reasoning ข้ามโดเมน (โค้ด → ลอจิกธุรกิจ → ออกแบบ UI)
- งานที่ต้องสลับความเชี่ยวชาญกลางบทสนทนา
- การแตกปัญหาซับซ้อนที่โมเดลเล็กพัง
- สถานการณ์ที่ความแม่นยำสำคัญกว่าค่าต่อคำขอ
เมื่อโมเดลเล็กชนะ:
- งานจัดหมวด/ดึงข้อมูลปริมาณสูง
- แชตเรียบง่ายที่รูปแบบคาดเดาได้
- แอปที่ไวต่อ latency (MoE เพิ่ม overhead 50-100 มิลลิวินาที)
- โปรดักต์จำกัดงบที่ “ดีพอ” ชนะ “ดีที่สุด”
กลยุทธ์หลายโมเดล
ทีมที่ฉลาดไม่ได้เลือก GPT-5 vs. Claude vs. Gemini—แต่ใช้ทั้งสามแบบยุทธศาสตร์ ตรงนี้เองที่แพลตฟอร์มอย่าง CometAPI สำคัญ
ลองนึกภาพต้องจัดการอินทิเกรชัน API สามเจ้า: วิธี auth ต่างกัน รูปแบบตอบกลับไม่เหมือน บิลลิงแยกกัน แล้วคูณด้วยรุ่นย่อยทุกตัว (GPT-5, Claude Opus4.7, Gemini 3.1 Pro…)
CometAPI แก้ด้วยการยกเลเยอร์อินทิเกรชันขึ้น:
การเข้าถึงแบบรวม: Endpoint เดียวนำทางไปยัง GPT-5, Claude, Gemini หรือโมเดลโอเพ่นตามลอจิกของคุณ ออปติไมซ์ต้นทุนอัตโนมัติ: ส่งงานง่ายไปโมเดลถูก งาน reasoning หนักไป GPT-5 เฟรมเวิร์ก A/B testing:
เทียบประสิทธิภาพโมเดลกับภาระงานจริงของคุณด้วยการ benchmark เชิงประจักษ์—latency, throughput, ต้นทุน และความแม่นยำบนพรอมต์ตัวแทน
API ของ GPT-5 เพิ่มพารามิเตอร์ใหม่ รวมถึงการควบคุม verbosity และค่าความพยายาม reasoning CometAPI มีแม่แบบคอนฟิกที่ทดสอบแล้ว เพื่อให้คุณไม่ต้องลองผิดลองถูก
พูดตรงๆ: เราเห็นทีมใช้เวลา 2-3 เดือนสร้างลอจิกการรูตหลายโมเดลที่ CometAPI มีให้พร้อมจากกล่อง เว้นแต่ว่าการจัดการหลายโมเดลคือแกนหลักธุรกิจของคุณ ใช้เลเยอร์คนอื่นจะดีกว่า
ปัญหาเอกสาร (และปวดหัวเรื่องคอมพลายแอนซ์)
ทีมกฎหมาย จัดซื้อ และสถาปัตยกรรมองค์กรอยากได้สเปกที่ชัดเจน “อุตสาหกรรมประมาณ 2-5T พารามิเตอร์” ไม่ผ่านแบบฟอร์มคัดเลือกซัพพลายเออร์
เมื่อบันทึกจำนวนพารามิเตอร์ ให้ระบุว่าคุณอ้างถึงความจุรวม (เกี่ยวกับ storage/ลิขสิทธิ์) หรือพารามิเตอร์แอคทีฟต่อโทเค็น (เกี่ยวกับ compute ตอนรันไทม์)
ถ้อยคำแม่แบบสำหรับเอกสารทางการ:
“OpenAI GPT-5 ประเมินว่ามี 2-5 ล้านล้านพารามิเตอร์แอคทีฟ อ้างอิงการวิเคราะห์อิสระในอุตสาหกรรม (แหล่งที่มา: พรีเซนต์ Samsung SemiCon, แบบจำลองสเกลลอว์เชิงสถิติ, การทดสอบประสิทธิภาพ) ความจุพารามิเตอร์รวมอาจสูงกว่า 10-25× หากใช้สถาปัตยกรรม Mixture-of-Experts OpenAI ยังไม่ได้ยืนยันสเปกเหล่านี้อย่างเป็นทางการ การประเมินอัปเดตล่าสุด ณ เมษายน 2026”
ใส่ที่มา ระบุวันที่ประเมิน และปักหมุดความไม่แน่นอน เมื่อ (ไม่ใช่ถ้า) มีคนขอ “ยืนยันทางการ” ให้ escalate ไปฝ่ายขายองค์กรของ OpenAI—บางครั้งพวกเขาให้รายละเอียดสถาปัตยกรรมแบบจำกัดภายใต้ NDA สำหรับสัญญาใหญ่
เรื่องจริง: ทำไมการนับพารามิเตอร์เป็นเมตริกของเมื่อวาน
ความหมกมุ่นกับ “GPT-5 มีกี่พารามิเตอร์” คล้ายดีเบตเทคในอดีตที่ตกรุ่นแล้ว:
- ยุค 2000s: สงครามเมกะพิกเซลในกล้อง (12MP vs 16MP vs 20MP!)
- ความจริง: คุณภาพเซ็นเซอร์และเลนส์สำคัญกว่า
- ยุค 2010s: แข่งกิกะเฮิรตซ์ CPU (3.2GHz vs 3.8GHz!)
- ความจริง: ประสิทธิภาพสถาปัตยกรรมและมัลติคอร์ชนะ
- ยุค 2020s: การนับพารามิเตอร์ AI (175B vs 1.8T vs 52.5T!)
- ความจริง: สถาปัตยกรรม ความฉลาดในการรูต และการออปติไมซ์เฉพาะงานสำคัญกว่า
GPT-5 พร้อมโหมด reasoning ทำผลงานแซงโมเดลที่ใหญ่กว่า ขณะสร้างเอาต์พุตน้อยลง 50-80% นั่นไม่ใช่แค่ประสิทธิภาพ—คือหลักฐานว่า “ฉลาดชนะใหญ่”
สิ่งที่เรารู้ด้วยความมั่นใจ
- GPT-5 ใช้สถาปัตยกรรม Mixture-of-Experts — พิสูจน์โดยงานคู่ขนาน GPT-OSS และลายเซ็นประสิทธิภาพ
- พารามิเตอร์แอคทีฟน่าจะอยู่ช่วง 2-5T — การประมาณหลายแหล่งอิสระบรรจบกัน
- พูลผู้เชี่ยวชาญรวมอาจแตะ 10-50T+ — อนุมานจากอัตราส่วน MoE ยังไม่ยืนยัน
- OpenAI จะไม่ยืนยันสเปก — กลยุทธ์การแข่งขันและความปลอดภัยโดยตั้งใจ
- ประสิทธิภาพเกินกว่าที่จำนวนพารามิเตอร์ทำนาย — คะแนน benchmark บ่งชี้ข้อได้เปรียบจากสถาปัตยกรรมมากกว่าขนาดดิบ
สิ่งที่สำคัญจริงสำหรับกลยุทธ์ AI ของคุณ
หยุดออปติไมซ์ตามสเปกพาดหัว เริ่มวัดสิ่งที่คุณจะจ่ายจริงและสิ่งที่ผู้ใช้จะสัมผัส:
การทดสอบเฉพาะงาน: รันพรอมต์จริงของคุณผ่าน GPT-5, Claude, และ Gemini โมเดลที่รับมือโดเมนของคุณได้ดีที่สุดอาจไม่ใช่ตัวใหญ่สุด
ต้นทุนต่อเอาต์พุตที่มีประโยชน์: โมเดลที่ตอบถูกทีเดียวจบ ชนะโมเดลถูกกว่าที่ต้องถามซ้ำสามรอบ
โปรไฟล์ latency ใต้โหลด: ทดสอบที่สเกล overhead ของ MoE อาจฆ่าประสิทธิภาพสำหรับแอปไวต่อเวลา
วิเคราะห์โหมดล้มเหลว: โมเดลหลอนหรือปฏิเสธงานตรงไหน? กรณีขอบสำคัญกว่าค่าเฉลี่ย
คำถาม 52.5 ล้านล้าน คำตอบมาแล้ว
GPT-5 มี 52.5 ล้านล้านพารามิเตอร์จริงไหม?
อาจจะ ถ้าคุณนับความจุผู้เชี่ยวชาญรวมของ MoE และมีคนทำสเปกภายในที่ถูกต้องหลุดมา น่าจะไม่ ถ้าหมายถึงพารามิเตอร์แอคทีฟต่อคำขอ ชวนเข้าใจผิดแน่ๆ ถ้าคุณเทียบกับสถาปัตยกรรม dense 175B ของ GPT-3
ตัวเลขไม่ได้ “ผิด”—แต่มันเป็น “ตัวเลขผิดเรื่อง” ที่ควรสนใจ
จำนวนรวมของ MoE มีประโยชน์ต่อการคุยเรื่อง storage และลิขสิทธิ์ ในขณะที่พารามิเตอร์แอคทีฟสำคัญต่อ compute ตอนรันไทม์
ถามว่า “GPT-5 ใหญ่แค่ไหน” โดยไม่ระบุเมตริก ก็เหมือนถามว่า “ห้องสมุดใหญ่แค่ไหน”—คุณวัดพื้นที่ชั้น หนังสือที่ยืมอยู่ หรือจำนวนหนังสือทั้งหมด?
อนาคต: เตรียมรับความลับมากขึ้น ไม่ใช่น้อยลง
การปิดบังพารามิเตอร์ของ OpenAI ไม่ใช่ชั่วคราว คาดว่า:
- การแข่งขันเข้มข้นขึ้น → ห้องทดลองทุกเจ้าจะปิดบังสถาปัตยกรรมมากขึ้น
- การตลาดเน้นความสามารถ → “แก้โจทย์ X ได้ดีขึ้น Y%” แทนการนับพารามิเตอร์
- การทดสอบแบบกล่องดำ → การประเมินโดยบุคคลที่สามจะกลายเป็นความโปร่งใสเดียว
ตระกูล Llama ของ Meta ยังเป็นผู้เล่นรายใหญ่รายสุดท้ายที่เผยสเปก รายอื่นเดินตาม OpenAI เข้าสู่ความทึบ
สำหรับนักพัฒนาและทีมโปรดักต์ นี่หมายถึง:
✅ สร้างระบบที่ไม่ยึดติดผู้ให้บริการโมเดลรายเดียว — อย่าผูกสถาปัตยกรรมกับสเปกของ GPT-5 ที่อาจเปลี่ยน
✅ ใช้เลเยอร์นามธรรม — แพลตฟอร์มอย่าง CometAPI ป้องกันความผันผวนของผู้ให้บริการ
✅ ทดสอบ benchmark ตลอดเวลา — สิ่งที่เหมาะสุดวันนี้ อาจไม่ใช่ในอีกหกเดือน
✅ โฟกัสผลลัพธ์ — ใบสเปกกำลังหายไป แต่เมตริกประสิทธิภาพไม่หาย
สรุปสำคัญ
ปริศนาพารามิเตอร์สุดท้ายจะคลายเอง—จากข่าวหลุด ข่าวกรองการแข่งขัน หรือความโปร่งใสของ OpenAI ในที่สุด แต่กว่าคุณจะได้คำตอบแน่ชัด GPT-6 ก็คงอยู่ในเบต้าแบบส่วนตัวและเส้นประตูก็จะขยับอีกครั้ง
ปล่อยให้คู่แข่งเถียงกันว่า 2T หรือ 52.5T คุณควรส่งโปรดักต์ที่ใช้งานได้จริง
สิ่งที่เรากล้ายืนยัน:
- GPT-5 ใหญ่ (หลายล้านล้านพารามิเตอร์)
- ฉลาด (MoE รูตอย่างมีประสิทธิภาพ)
- ทึบ (OpenAI ไม่ยืนยันสเปก)
- ได้ผล (ผลงานเกินกว่าที่จำนวนพารามิเตอร์ทำนาย)
คุณวัดจำนวนพารามิเตอร์ไม่ได้ แต่คุณวัดได้ว่า:
- อัตราความสำเร็จของงานระหว่าง GPT-5, Claude Opus 4.7, Gemini 3.1 Pro
- ต้นทุนต่อ 1K คำขอสำหรับภาระงานของคุณ
- latency P95 เมื่อทราฟฟิกพุ่ง
- ความแม่นของโมเดลบนกรณีขอบของคุณ
CometAPI: ตัวรวม API โมเดล AI แบบ unified — ใช้คีย์เดียวเข้าถึง 500+ โมเดลจาก OpenAI, Anthropic, Google และอีกมาก ในราคาต่ำกว่าเรตทางการ 20%
ทดสอบข้ามโมเดลได้ใน 5 นาที → เริ่มด้วยเครดิตฟรี
