ในกิจกรรมถ่ายทอดสดที่น่าตื่นเต้นในวันพฤหัสบดีที่ 27 OpenAI เปิดเผยผลการศึกษาวิจัยเบื้องต้นของ GPT-4.5 ซึ่งเป็นรุ่นล่าสุดของโมเดลภาษาขนาดใหญ่เรือธงของบริษัท ตัวแทนของบริษัทยกย่องเวอร์ชันใหม่นี้ว่าเป็นโมเดลการแชทที่มีความสามารถและอเนกประสงค์ที่สุดของบริษัทจนถึงปัจจุบัน ในช่วงแรก เวอร์ชันนี้จะเปิดให้นักพัฒนาซอฟต์แวร์และผู้สมัครสมาชิก ChatGPT Pro ใช้งานได้
การเปิดตัว GPT-4.5 ถือเป็นจุดสิ้นสุดของยุคสมัยของ OpenAI ในโพสต์บน X เมื่อต้นเดือนนี้ Sam Altman ซีอีโอของ OpenAI กล่าวว่าโมเดลนี้จะเป็นโมเดลสุดท้ายที่บริษัทเปิดตัวซึ่งไม่ใช้พลังประมวลผลเพิ่มเติมเพื่อพิจารณาคำถามก่อนตอบสนอง

GPT 4.5 คืออะไร?
GPT 4.5 เป็นโมเดลที่ใหญ่ที่สุดของ OpenAI จนถึงขณะนี้ ผู้เชี่ยวชาญประเมินว่า GPT-4 อาจมีพารามิเตอร์ได้มากถึง 1.8 ล้านล้านค่า โดยค่าเหล่านี้จะถูกปรับเปลี่ยนเมื่อฝึกโมเดล โดยการปรับขนาดการเรียนรู้โดยไม่มีการดูแล GPT 4.5 จึงปรับปรุงความสามารถในการจดจำรูปแบบ ดึงความเชื่อมโยง และสร้างข้อมูลเชิงลึกที่สร้างสรรค์โดยไม่ต้องใช้เหตุผล
GPT 4.5 เป็นตัวอย่างของการปรับขนาดการเรียนรู้แบบไม่มีผู้ดูแลโดยปรับขนาดการประมวลผลและข้อมูล รวมถึงสถาปัตยกรรมและนวัตกรรมการเพิ่มประสิทธิภาพ นอกจากนี้ GPT-4.5 ยังเป็นธรรมชาติมากกว่าในการโต้ตอบกับผู้ใช้ ครอบคลุมความรู้ในวงกว้างขึ้น และสามารถเข้าใจและตอบสนองต่อเจตนาของผู้ใช้ได้ดีขึ้น ส่งผลให้ประสาทหลอนลดลงและมีความน่าเชื่อถือมากขึ้นในหัวข้อต่างๆ มากมาย
GPT 4.5 มีการอัพเกรดอะไรบ้าง และมีคุณสมบัติอะไรบ้าง
อัพเกรด EQ:
คุณสมบัติที่สำคัญที่สุดของ GPT-4.5 คือ “สติปัญญาทางอารมณ์” (EQ) ที่ได้รับการปรับปรุง ซึ่งช่วยให้ประสบการณ์การสนทนามีความเป็นธรรมชาติ อบอุ่น และราบรื่นมากขึ้น Sam Altman ซีอีโอของ OpenAI แชร์บนโซเชียลมีเดียว่า “นี่เป็นครั้งแรกที่ผมรู้สึกว่า AI กำลังพูดคุยกับคนที่ใส่ใจ มันให้คำแนะนำที่มีค่าจริงๆ และทำให้ผมเอนหลังเก้าอี้หลายครั้งด้วยความประหลาดใจที่ AI สามารถให้คำตอบที่ยอดเยี่ยมเช่นนี้ได้”
ในการทดสอบความชอบของมนุษย์ ผู้ใช้ส่วนใหญ่เชื่อว่าคำตอบของ GPT 4.5 สอดคล้องกับนิสัยการสื่อสารของมนุษย์มากกว่า GPT-4o โดยเฉพาะอย่างยิ่ง โมเดลใหม่ได้รับคะแนนที่สูงขึ้นในด้านความฉลาดทางความคิดสร้างสรรค์ (56.8%) ปัญหาในอาชีพ (63.2%) และปัญหาในชีวิตประจำวัน (57.0%)
อาการประสาทหลอนลดลง:
ผ่านการเรียนรู้แบบไม่มีผู้ดูแลขนาดใหญ่ GPT 4.5 ได้พัฒนาความแม่นยำของความรู้และลด "ภาพหลอน" (ข้อมูลเท็จ) อย่างมีนัยสำคัญ:
- การบรรลุความแม่นยำ 62.5% ในการประเมิน SimpleQA อัตราการเกิดภาพหลอนลดลงเหลือ 37.1%
- บรรลุความแม่นยำ 0.78 บนชุดข้อมูล PersonQA ดีกว่า GPT-4o (0.28) และ o1 (0.55) มาก

การขยายฐานความรู้และการอัพเกรดการแสดงออก
ประสิทธิภาพเพิ่มขึ้นอย่างมาก:การใช้พลังงานในการประมวลผลลดลง 10 เท่า ฐานความรู้เพิ่มขึ้นเป็นสองเท่า แต่ต้นทุนยังคงสูงขึ้น (ผู้ใช้ Pro มีสิทธิ์ใช้งานก่อนในราคา 200 ดอลลาร์/เดือน) นอกจากนี้ GPT 4.5 ยังได้รับการปรับให้เหมาะสมในด้านสถาปัตยกรรมและนวัตกรรม ซึ่งช่วยปรับปรุงการควบคุม ความเข้าใจในรายละเอียด และความสามารถในการสนทนาตามธรรมชาติ และเหมาะเป็นพิเศษสำหรับการเขียน การเขียนโปรแกรม การแก้ปัญหาในทางปฏิบัติ และสถานการณ์เชิงโต้ตอบที่ต้องใช้ความเห็นอกเห็นใจในระดับสูง
จุดเด่นของสถาปัตยกรรมทางเทคนิค
อัพเกรดพลังการประมวลผล: อิงตามการฝึกอบรมซูเปอร์คอมพิวเตอร์ของ Microsoft Azure พลังในการประมวลผลนั้นสูงกว่า GPT-10 ถึง 40 เท่า ประสิทธิภาพในการประมวลผลได้รับการปรับปรุงให้ดีขึ้นมากกว่า 10 เท่า และรองรับการฝึกอบรมแบบกระจายไปยังศูนย์ข้อมูลต่างๆ
การเพิ่มประสิทธิภาพด้านความปลอดภัย: ผสานรวมการปรับแต่งอย่างละเอียดภายใต้การดูแลแบบดั้งเดิม (SFT) และ RLHF แนะนำเทคโนโลยีการดูแลใหม่ และลดความเสี่ยงของเอาต์พุตที่เป็นอันตราย
ข้อจำกัดแบบหลายโหมด: ยังไม่รองรับเสียง/วิดีโอ แต่มีการเพิ่มความเข้าใจภาพเพื่อช่วยในการออกแบบแอนิเมชั่น SVG และการสร้างเพลงที่ปราศจากลิขสิทธิ์
หัวข้อที่เกี่ยวข้อง:การเปรียบเทียบโมเดล AI ยอดนิยม 8 อันดับแรกของปี 2025
อธิบายราคา API ของ GPT 4.5: คุ้มค่าจริงหรือ?
GPT‑4.5 ถูกสร้างขึ้นบนสถาปัตยกรรมขนาดมหึมาที่มีพารามิเตอร์ 12.8 ล้านล้านตัวและหน้าต่างบริบทโทเค็น 128 รายการ การออกแบบที่ต้องใช้การคำนวณอย่างเข้มข้นและมีขนาดใหญ่โตนี้มาพร้อมกับราคาที่สูงกว่าปกติ ตัวอย่างเช่น เวิร์กโหลดที่มีโทเค็นอินพุต 750 รายการและโทเค็นเอาต์พุต 250 รายการอาจมีราคาประมาณ 147 ดอลลาร์ ซึ่งแพงกว่ารุ่นก่อนหน้าอย่าง GPT‑30o ประมาณ 34–4 เท่า
เปรียบเทียบราคาซีรีย์ GPT

ขณะนี้โมเดลใหม่พร้อมให้ผู้ใช้ ChatGPT Pro ดูตัวอย่างการวิจัยได้แล้ว และจะเปิดตัวให้กับผู้ใช้ Plus, Team, Enterprise และ Education ในอีกสองสัปดาห์ข้างหน้านี้
GPT 4.5 เทียบกับโมเดลภาษาอื่น
แนวคิดด้านสุนทรียศาสตร์ของงานเขียนเชิงออกแบบได้รับการอัปเกรด ทำให้เหมาะกับงานสร้างสรรค์และการโต้ตอบทางอารมณ์มากกว่าโมเดลอื่นๆ การใช้เหตุผลได้รับการปรับลดระดับลง และเห็นได้ชัดว่าละทิ้งตำแหน่งของ "โมเดลที่แข็งแกร่งที่สุด" ความสามารถในการใช้เหตุผลของ GPT-4.5 ล้าหลังคู่แข่ง GPT-XNUMX ได้ยกระดับมาตรฐานสำหรับ AI เชิงสนทนา แต่ราคาที่สูงทำให้เป็นเครื่องมือระดับมืออาชีพมากกว่าโซลูชันสำหรับตลาดมวลชน
การเปรียบเทียบราคา API ที่ครอบคลุมระหว่างโมเดล AI ชั้นนำ
| รุ่น | ต้นทุนอินพุต (ต่อ 1 ล้านโทเค็น) | ต้นทุนผลผลิต (ต่อ 1 ล้านโทเค็น) | หน้าต่างบริบท | ความคิดเห็น |
| จีพีที‑4.5 | 75 | 150 | 128k โทเค็น | ราคาพรีเมี่ยมสำหรับความสามารถทางอารมณ์และการสนทนาขั้นสูง |
| จีพีที‑4โอ | 2.5 | 10 | 128k โทเค็น | ฐานข้อมูลที่คุ้มต้นทุนพร้อมการสนับสนุนแบบหลายโหมดที่รวดเร็ว |
| โคลด 3.7 โคลง | 3 | 15 | 200k โทเค็น | ประหยัดเป็นพิเศษ รองรับทั้งข้อความและรูปภาพ |
| Deep Seek R1 | ~ $ 0.55 | ~ $ 2.19 | 64k โทเค็น | ราคาที่ก้าวร้าว การแคชสามารถลดต้นทุนสำหรับกรณีการใช้งานปริมาณสูงได้ |
| Google Gemini 2.0 แฟลช | ~ $ 0.15 | ~ $ 0.60 | สูงสุด 1 ล้านโทเค็น | ต้นทุนต่ำเป็นพิเศษพร้อมความจุบริบทขนาดใหญ่ เหมาะสำหรับงานที่มีปริมาณมาก |
ความสามารถทางเทคนิคและการแลกเปลี่ยนต้นทุน
บริบทและความหลากหลายทางรูปแบบ:
**GPT‑4.5:**รองรับบริบทโทเค็น 128k แต่เป็นแบบข้อความเท่านั้น
คล็อด 3.7 โซเน็ต: นำเสนอหน้าต่างโทเค็น 200 ที่ใหญ่ขึ้นและการประมวลผลรูปภาพเพื่อประสิทธิภาพการทำงานตามบริบทระยะยาวที่ดียิ่งขึ้น
**Google Gemini 2.0 แฟลช:**มีหน้าต่างโทเค็นขนาด 1 ล้านหน่วยที่น่าประทับใจ เหมาะสำหรับการประมวลผลเนื้อหาจำนวนมาก (แม้ว่าคุณภาพของข้อความอาจแตกต่างกันไป)
งานพิเศษ:
**เกณฑ์มาตรฐานการเข้ารหัส:**GPT‑4.5 มีความแม่นยำประมาณ 38% ในงานการเข้ารหัส (เช่น SWE‑Bench) ในขณะที่ Claude 3.7 Sonnet มอบประสิทธิภาพด้านต้นทุนและประสิทธิภาพที่ดีกว่าอย่างเห็นได้ชัดในงานด้านเทคนิค
**ความฉลาดทางอารมณ์:**GPT‑4.5 โดดเด่นในด้านการนำเสนอบทสนทนาที่มีมิติลึกซึ้งและเต็มไปด้วยอารมณ์ ทำให้เหมาะอย่างยิ่งสำหรับการสนับสนุนลูกค้าและแอปพลิเคชันการฝึกสอน
สรุป
GPT-4.5 คือ “โมเดลการไม่อนุมานรุ่นสุดท้าย” ความสามารถในการเรียนรู้แบบไม่มีผู้ดูแลจะถูกรวมเข้ากับเทคโนโลยีการให้เหตุผลแบบ o-series ซึ่งจะปูทางไปสู่ GPT-5 ที่จะเปิดตัวในช่วงปลายเดือนพฤษภาคม การเปิดตัว GPT-4.5 ไม่เพียงแต่เป็นการอัปเกรดทางเทคโนโลยีเท่านั้น แต่ยังเป็นการสร้างโมเดลการทำงานร่วมกันระหว่างมนุษย์กับเครื่องจักรขึ้นใหม่ด้วย แม้ว่าราคาที่สูงและคอขวดของพลังการประมวลผลจะก่อให้เกิดข้อถกเถียง แต่ความก้าวหน้าในด้านการตอบสนองทางอารมณ์และการใช้งานจริงได้ให้แนวคิดใหม่สำหรับการผสานรวม AI เข้ากับการศึกษา การดูแลทางการแพทย์ และสาขาอื่นๆ AI มีศักยภาพในการพัฒนาที่ไร้ขีดจำกัด!
คำถามที่พบบ่อยเกี่ยวกับ GPT 4.5
มีข้อจำกัดอะไรบ้าง?
ขาดการคิดแบบเป็นลำดับ และอาจจะช้ากว่าเนื่องจากขนาดของมัน นอกจากนี้ยังไม่ผลิตเอาต์พุตแบบมัลติโมดัล เช่น เสียงหรือวิดีโอ
มันสามารถให้คำตอบที่แม่นยำได้ 100% ตลอดเวลาหรือไม่?
ไม่ แม้ว่า GPT-4.5 จะมีอาการประสาทหลอนน้อยกว่ารุ่นก่อนๆ โดยทั่วไป แต่ผู้ใช้ยังคงต้องตรวจสอบเอาท์พุตที่สำคัญหรือละเอียดอ่อน
GPT-4.5 รองรับรูปภาพหรือไม่?
ใช่ GPT-4.5 ยอมรับอินพุตภาพ สร้างภาพ SVG แบบอินไลน์ และสร้างภาพผ่าน DALL·E ได้
GPT-4.5 รองรับการค้นหาบนเว็บหรือไม่?
ใช่ GPT-4.5 สามารถเข้าถึงข้อมูลที่ทันสมัยล่าสุดโดยการค้นหา
ทำงานกับไฟล์และประเภทไฟล์ใดได้บ้าง?
GPT-4.5 รองรับไฟล์และประเภทไฟล์ทั้งหมด
