GPT-5.3 Codex: คุณสมบัติ, เบนช์มาร์ก, และวิธีเข้าถึง

CometAPI
AnnaFeb 6, 2026
GPT-5.3 Codex: คุณสมบัติ, เบนช์มาร์ก, และวิธีเข้าถึง

เมื่อวันที่ 5 กุมภาพันธ์ 2026 OpenAI ได้ประกาศเปิดตัว GPT-5.3-Codex การอัปเกรดแบบโฟกัสของตระกูล Codex ที่ผสานความสามารถการเขียนโค้ดขั้นสูงเข้ากับการให้เหตุผลเชิงวิชาชีพที่กว้างขึ้น การอินเฟอเรนซ์ที่เร็วขึ้น และเวิร์กโฟลว์แบบ “agentic” ที่ลึกยิ่งขึ้น การเปิดตัวครั้งนี้มาพร้อมแอป Codex สำหรับเดสก์ท็อปใหม่ และขยายการเข้าถึงทั่วทั้งอีโคซิสเต็มของ Codex (CLI ส่วนขยาย IDE และเว็บ) โดยการเข้าถึงผ่าน API (สัญญาว่า “เร็วๆ นี้”)

GPT-5.3-Codex คืออะไร ?

GPT-5.3-Codex คือโมเดล agentic coding ล่าสุดในสายผลิตภัณฑ์ Codex ของ OpenAI: โมเดลที่ฝึกและปรับแต่งมาโดยเฉพาะเพื่อทำงานภายในเวิร์กโฟลว์ของนักพัฒนา โต้ตอบกับเครื่องมือ (เทอร์มินัล ตัวแก้ไข ปลายทางเว็บ) และดำเนินงานวิศวกรรมระยะยาวที่ต้องการการวางแผน การใช้เครื่องมือ และการดีบักแบบวนรอบ OpenAI วางตำแหน่ง GPT-5.3-Codex ให้เป็นทายาทที่ผสานจุดแข็งด้านโค้ดของ GPT-5.2-Codex เข้ากับการให้เหตุผลและความรู้เชิงวิชาชีพที่ปรับปรุงจาก GPT-5.2 กลายเป็นโมเดลเดียวที่ออกแบบมาให้ทำงานเสมือนเพื่อนร่วมทีมวิศวกรที่ร่วมมือกันได้

ที่มาและเป้าหมายการออกแบบ

  • เวิร์กโฟลว์แบบ agentic: โมเดลถูกปรับแต่งให้สามารถจัดลำดับและประสานชุดการกระทำตลอดเวลา (เช่น รันทดสอบ แก้แพตช์โค้ด รันใหม่) ไม่ใช่เพียงสร้างคำตอบครั้งเดียว
  • การผสานเครื่องมือ: Codex มีวัตถุประสงค์ให้ใช้เครื่องมือของนักพัฒนา—CLI ดีบักเกอร์ ตัวจัดการแพ็กเกจ—ได้อย่างปลอดภัยและเชื่อถือได้ พร้อมรักษาสถานะข้ามเซสชัน
  • ความช่วยเหลือเชิงปฏิบัติสำหรับนักพัฒนา: เป้าหมายคือความเป็นภาคปฏิบัติ: ลดการสลับบริบท เร่งการแก้ปัญหาอุปสรรค ทำงานรูทีนให้เป็นอัตโนมัติ (ทดสอบ รีแฟกเตอร์ ดึงโค้ด) และสนับสนุนการกำกับร่วมกันโดยผู้ใช้มนุษย์

มีอะไรใหม่ใน GPT-5.3-Codex?

GPT-5.3-Codex นำเสนอการเปลี่ยนแปลงเชิงรูปธรรมและการปรับปรุงระดับผลิตภัณฑ์หลายประการเมื่อเทียบกับรุ่นก่อนหน้าโดยตรง:

1. การอินเฟอเรนซ์ที่เร็วขึ้นสำหรับผู้ใช้ Codex

OpenAI ระบุว่า GPT-5.3-Codex ทำงานได้เร็วขึ้นประมาณ 25% สำหรับผู้ใช้ Codex เนื่องจากการปรับปรุงสแตกอินเฟอเรนซ์และการเพิ่มประสิทธิภาพโครงสร้างพื้นฐาน ความเร็วที่เพิ่มขึ้นถูกมองทั้งในมุมของเวลาแฝงที่ลดลงระหว่างการดีบักแบบโต้ตอบ และในมุมของการทำให้การรันแบบ agentic ยาวขึ้นและราบรื่นขึ้น

2. การรวมจุดแข็งด้านการให้เหตุผล + การเขียนโค้ด

แทนที่จะเป็น “เน้นโค้ดอย่างเดียว” GPT-5.3-Codex ผสานประสิทธิภาพการเขียนโค้ดระดับแนวหน้าของ GPT-5.2-Codex เข้ากับการให้เหตุผลเชิงวิชาชีพที่พัฒนาแล้ว (จาก GPT-5.2) ทำให้เก่งขึ้นในงานที่ต้องค้นคว้ามาก: อ่านเอกสาร วางแผนการไมเกรชันหลายขั้นตอน และสร้างเหตุผลประกอบและหลักฐานการทดสอบควบคู่ไปกับโค้ด

3. ความร่วมมือและการชี้นำระหว่างการรันที่ดียิ่งขึ้น

การเปลี่ยนแปลงสำคัญที่ผู้ใช้เห็นได้คือรูปแบบการทำงานร่วมกันในขณะโมเดลกำลัง “ทำงาน”: Codex จะรายงานความคืบถี่ขึ้น ยอมรับคำสั่งชี้นำระหว่างการรัน และคงบริบทและสถานะตลอดงานหลายขั้นตอน—ทำให้ผู้ใช้สามารถแทรกแซง แก้ไข หรือกำหนดทิศทางเอเจนต์ในขณะปฏิบัติงานได้ บันทึกผลิตภัณฑ์ระบุว่าพฤติกรรมการ “steer” นี้กำลังถูกทำให้เสถียรทั่วชุดเครื่องมือ Codex

4. แอป Codex สำหรับเดสก์ท็อป (พร้อมการซิงก์ข้ามไคลเอนต์ที่แน่นขึ้น)

OpenAI เปิดตัว แอป Codex ที่ซิงก์ประวัติเซสชันและการตั้งค่ากับ Codex CLI และส่วนขยาย IDE—ทำให้นักพัฒนาสามารถเริ่มในตัวแก้ไขหรือเทอร์มินัล แล้วไปรับช่วงงานต่อในแอปเดสก์ท็อปโดยไม่สูญเสียสถานะ แอปถูกวางตำแหน่งให้เป็นศูนย์กลางประสานเวิร์กโฟลว์แบบ agentic

5. พฤติกรรมการทำงานระยะยาวแบบ agentic

GPT-5.3-Codex ถูกเพิ่มประสิทธิภาพโดยเฉพาะสำหรับงานที่สามารถทำงานต่อเนื่องยาวนาน สอดแทรกการเรียกใช้เครื่องมือ และต้องการการชี้นำระหว่างงาน (หยุด/ทำต่อ เปลี่ยนวัตถุประสงค์) สิ่งนี้ช่วยเพิ่มความสามารถบนงานที่ซับซ้อน เช่น รีแฟกเตอร์ครั้งใหญ่ งานฟีเจอร์หลายโมดูล และงานข้ามหลายรีโพซิทอรี

GPT-5.3-Codex บนชุดทดสอบมาตรฐาน

GPT-5.3-Codex (xhigh)GPT-5.2-Codex (xhigh)GPT-5.2 (xhigh)
SWE-Bench Pro (Public)56.8%56.4%55.6%
Terminal-Bench 2.077.3%64.0%62.2%
OSWorld-Verified64.7%38.2%37.9%
GDPval (wins or ties)70.9%-70.9% (high)
Cybersecurity Capture The Flag Challenges77.6%67.4%67.7%
SWE-Lancer IC Diamond81.4%76.0%74.6%

ผลลัพธ์ตัวอย่างจากชุดทดสอบ

  • Terminal-Bench 2.0: รายงานว่า GPT-5.3-Codex ได้คะแนน ≈77.3% ซึ่งเป็นการกระโดดครั้งใหญ่ บ่งชี้ถึงความเชี่ยวชาญที่มากขึ้นในเวิร์กโฟลว์แบบบรรทัดคำสั่งและเทอร์มินัลเมื่อเทียบกับรุ่นก่อน
  • SWE-Bench Pro: OpenAI รายงาน ≈56.8% บนชุดทดสอบวิศวกรรมซอฟต์แวร์ที่เข้มงวดครอบคลุมหลายภาษาและโจทย์ระดับอุตสาหกรรม เป็นการปรับปรุงที่พองามแต่มีประโยชน์เมื่อเทียบกับโมเดลก่อนหน้า
  • OSWorld-Verified และตัวชี้วัด CTF ด้านความมั่นคงปลอดภัยไซเบอร์: เอกสารระบบ (system card) และรายงานของ OpenAI ระบุการปรับปรุงบนชุดทดสอบ “การใช้งานคอมพิวเตอร์ทั่วไป” (OSWorld) และงานลักษณะ capture-the-flag ด้านความมั่นคงปลอดภัยไซเบอร์ (เห็นการเพิ่มขึ้นเด่นชัดเมื่อเทียบกับ GPT-5.2-Codex)

นักพัฒนาและองค์กรจะเข้าถึง GPT-5.3-Codex ได้อย่างไร?

ปัจจุบันมีให้ใช้งานในผลิตภัณฑ์และอินเทอร์เฟซใดบ้าง?

  • Codex app (เดสก์ท็อปและเว็บ): OpenAI เปิดตัวแอป Codex โดยเฉพาะที่รักษาเซสชันและซิงก์การตั้งค่ากับ CLI และส่วนขยาย IDE สำหรับผู้ใช้จำนวนมาก แอปเป็นวิธีหลักในการรันเวิร์กโฟลว์แบบเอเจนต์พร้อม GUI และสถานะแบบ persistent
  • Codex CLI: ผู้ใช้ที่เน้นเทอร์มินัลสามารถโต้ตอบกับ Codex ผ่านอินเทอร์เฟซบรรทัดคำสั่งที่ผสานกับรีโพท้องถิ่นและเวิร์กโฟลว์ของตน
  • ส่วนขยาย IDE: ปลั๊กอินสำหรับ IDE ที่พบบ่อย (Visual Studio Code, ตระกูล JetBrains) ทำให้ Codex อยู่ในตัวแก้ไข เสนอโค้ด รันทดสอบในเครื่อง และดำเนินการเปลี่ยนแปลงในที่เดิม
  • เว็บอินเทอร์เฟซ: การเข้าถึงผ่านเว็บมาตรฐานผ่านหน้า ChatGPT/Codex มอบทางเลือกแบบไม่ต้องติดตั้งสำหรับผู้ใช้จำนวนมาก

หมายเหตุความพร้อมให้บริการที่สำคัญ: OpenAI ระบุว่า GPT-5.3-Codex มีให้กับผู้ใช้แผน ChatGPT แบบชำระเงินบนทุกผิวสัมผัสของ Codex และว่า การเข้าถึงผ่าน API อยู่ในแผนแต่ยังไม่เปิดใช้งาน ระหว่างดำเนินงานด้านความปลอดภัย

ระหว่างรอ GPT-5.3 Codex API นักพัฒนาสามารถใช้ GPT-5.2 Codex ที่อัดแน่นด้วยฟีเจอร์บน CometAPI เพื่อเตรียมย้ายไปยัง GPT-5.3 Codex เมื่อ GPT-5.3 Codex API เปิดให้ใช้ คุณสามารถอัปเกรดได้ในไม่กี่นาทีแทนที่จะเริ่มจากศูนย์

1. Codex app (เดสก์ท็อป)

  • ใคร: นักพัฒนาเดี่ยวและทีมที่ต้องการพื้นผิวประสานงานแบบ GUI
  • ทำอะไร: ซิงก์ประวัติเซสชันและการตั้งค่าจาก CLI และ IDE แสดงงานเอเจนต์ที่กำลังรันและล็อก และทำหน้าที่เป็นศูนย์กลางสำหรับงานระยะยาว
  • วิธีเริ่มต้น: ลงชื่อเข้าใช้ด้วยบัญชี ChatGPT ของคุณบนแอป Codex; เซสชันที่เริ่มใน IDE/CLI จะปรากฏในแอป

2. Codex CLI (เทอร์มินัล)

  • ใคร: นักพัฒนาที่เน้นเทอร์มินัล วิศวกร DevOps และ SRE
  • ทำอะไร: รันแอ็กชันของ Codex ดำเนินคำสั่ง รันทดสอบ และรับข้อเสนอแนะเชิงโครงสร้างภายในโปรเจ็กต์ของคุณ CLI เหมาะสำหรับงานอัตโนมัติและการสคริปต์โดยใช้โมเดลเป็นเครื่องมือ
  • วิธีเริ่มต้น: ติดตั้ง Codex CLI (แพ็กเกจและคำแนะนำมีในเอกสารนักพัฒนา OpenAI) ลงชื่อเข้าใช้ด้วยบัญชี ChatGPT ของคุณหรือข้อมูลประจำตัวทีม และชี้ไปที่รีโพซิทอรีของคุณ

3. ส่วนขยาย IDE (VS Code และอื่นๆ)

  • ใคร: นักพัฒนาที่เน้นตัวแก้ไขโค้ด
  • ทำอะไร: ผู้ช่วยในตัวแก้ไข ระบบอัตโนมัติสำหรับรีวิว pull request (เช่น แท็ก @codex บน PR เพื่อขอรีวิวอัตโนมัติ) และความสามารถในการรันโฟลว์แบบ agentic โดยไม่ต้องออกจากตัวแก้ไข ส่วนขยายรองรับการลงชื่อเข้าใช้ตามบัญชี—จึงไม่ต้องวุ่นวายกับคีย์ API สำหรับเวิร์กโฟลว์หลายแบบ

4. เว็บ/ChatGPT

  • ใคร: ผู้ใช้ที่ต้องการความเบาและการสำรวจ ผู้จัดการผลิตภัณฑ์ และทีมที่ต้องการเข้าถึงผ่านเว็บ
  • ทำอะไร: GPT-5.3-Codex มีให้ใช้ผ่านอินเทอร์เฟซ ChatGPT สำหรับสมาชิกแบบชำระเงิน เว็บอินเทอร์เฟซมอบการเข้าถึงฟีเจอร์ของ Codex ได้ทันทีจากเบราว์เซอร์

5. API (เร็วๆ นี้)

  • ใคร: บริษัทที่ต้องการฝัง Codex เข้ากับสายงาน CI/CD เครื่องมืออัตโนมัติ หรือแพลตฟอร์มภายใน
  • คาดหวังอะไรได้บ้าง: OpenAI ระบุว่ากำลังเตรียมการเข้าถึง API สำหรับ GPT-5.3-Codex

GPT-5.3-Codex มีความหมายต่อระบบนิเวศนักพัฒนาอย่างไร?

ผลกระทบระยะสั้น

  • ยกระดับผลิตภาพสำหรับงานรูทีน: หลายทีมจะเห็นการวนรอบที่เร็วขึ้นในการทดสอบ รีแฟกเตอร์ และดีบัก การผสานกับ IDE และ CLI ลดแรงเสียดทานในการนำเวิร์กโฟลว์แบบ agentic มาใช้
  • รูปแบบความร่วมมือใหม่: วิศวกรจะโต้ตอบกับ AI เสมือน “เพื่อนร่วมทีม” มากขึ้น—ออกคำสั่งชี้นำ ทบทวนเอาต์พุตของเอเจนต์ และไว้วางใจโมเดลสำหรับงานซ้ำๆ แต่สำคัญ เช่น การจัดรูปแบบโค้ด การสร้างโครง และการแก้ไขเล็กๆ น้อยๆ

ผลกระทบต่ออุตสาหกรรมระยะยาว

  • การรวมศูนย์เครื่องมือ: เครื่องมือแบบ agentic ที่บูรณาการ (แอป + CLI + IDE) อาจลดความกระจัดกระจายของเครื่องมือ หากทีมยอมรับเวิร์กโฟลว์ที่ศูนย์กลางคือ Codex เพียงชุดเดียว
  • การแข่งขันและความเชี่ยวชาญเฉพาะ: การเปิดตัวในสัปดาห์เดียวกันจาก Anthropic และรายอื่นๆ ตอกย้ำว่าผู้ให้บริการกำลังกำหนดช่องทางแตกต่างกัน (เช่น หน้าต่างบริบทขนาดใหญ่เทียบกับความเร็วการเขียนโค้ดแบบ agentic) ซึ่งจะผลักดันให้องค์กรเลือกโมเดลตามกรณีใช้งานแทนที่จะดูจากแบรนด์

บทบาทและแรงงาน

  • เสริม ไม่แทนที่ (ในตอนนี้): แม้ Codex จะทำงานของนักพัฒนาหลายอย่างเป็นอัตโนมัติ แต่วิศวกรมนุษย์ยังคงสำคัญสำหรับสถาปัตยกรรม ความปลอดภัย การให้เหตุผลเชิงวิพากษ์ และธรรมาภิบาล—โดยเฉพาะเมื่อความปลอดภัยในการผลิตมีความสำคัญ Codex เปลี่ยนการกระจายของงานมากกว่าที่จะตัดบทบาททิ้งไปโดยสิ้นเชิง

นักพัฒนาสามารถเข้าถึง GPT-5.2 Codex ผ่านทาง CometAPI ได้แล้วตอนนี้ เริ่มต้นด้วยการสำรวจความสามารถของโมเดลใน Playground และดูรายละเอียดใน API guide ก่อนใช้งาน โปรดลงชื่อเข้าใช้ CometAPI และขอรับคีย์ API ให้เรียบร้อย CometAPI มีราคาไม่แพงกว่าราคาทางการอย่างมากเพื่อช่วยให้คุณผสานรวมได้สะดวก

พร้อมเริ่มหรือยัง?→ สมัครเพื่อเริ่มใช้งานโค้ดวันนี้

หากต้องการเคล็ดลับ คู่มือ และข่าวสารด้าน AI เพิ่มเติม ติดตามเราได้บน VK, X และ Discord!

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%