Home/Models/OpenAI/GPT 5.1 Codex Max
O

GPT 5.1 Codex Max

อินพุต:$1/M
เอาต์พุต:$8/M
บริบท:400K
เอาต์พุตสูงสุด:128K
GPT-5.1-Codex-Max เป็นโมเดลการเขียนโค้ดแบบเอเจนต์ (agentic) เฉพาะทางของ OpenAI ในตระกูล GPT-5.1 ที่ได้รับการปรับแต่งให้เหมาะสมสำหรับการดำเนินเวิร์กโฟลว์วิศวกรรมซอฟต์แวร์ที่ทำงานต่อเนื่องยาวนาน (การรีแฟกเตอร์, ลูปของเอเจนต์ที่กินเวลาหลายชั่วโมง, การทำงานอัตโนมัติผ่านเทอร์มินัล, การรันทดสอบ และการรีวิวโค้ด) โดยมีความน่าเชื่อถือและประสิทธิภาพการใช้โทเค็นสูงกว่ารุ่นก่อนหน้า
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API

GPT-5.1-Codex-Max คืออะไร ?

GPT-5.1-Codex-Max เป็นโมเดลตระกูล Codex ที่ปรับแต่งและสร้างขึ้นเพื่อเวิร์กโฟลว์การเขียนโค้ดแบบเอเจนต์ — กล่าวคือ งานวิศวกรรมหลายขั้นตอนแบบอัตโนมัติ เช่น การรีแฟกเตอริงระดับรีโพ เซสชันดีบักยาว ลูปเอเจนต์หลายชั่วโมง โค้ดรีวิว และการใช้เครื่องมือเชิงโปรแกรม โมเดลนี้ออกแบบมาสำหรับเวิร์กโฟลว์ของนักพัฒนาที่ต้อง:

  • รักษาสถานะข้ามการแก้ไขและการโต้ตอบจำนวนมาก;
  • ใช้งานเครื่องมือและเทอร์มินัล (รันเทสต์ คอมไพล์ ติดตั้ง ออกคำสั่ง git) เป็นส่วนหนึ่งของกระบวนการอัตโนมัติ;
  • สร้างแพตช์ รันเทสต์ และให้บันทึกการทำงานที่ติดตามได้พร้อมการอ้างอิงสำหรับผลลัพธ์

คุณสมบัติหลัก

  • การอัดย่อและบริบทหลายหน้าต่าง: ได้รับการฝึกให้ อัดย่อ ประวัติและทำงานอย่างสอดคล้องข้ามหลายบริบท ช่วยให้เกิดความต่อเนื่องในระดับโปรเจกต์ .
  • การใช้เครื่องมือแบบเอเจนต์ (เทอร์มินัล + เครื่องมือการพัฒนา): ความสามารถที่ดีขึ้นในการรันลำดับคำสั่งในเทอร์มินัล ติดตั้ง/บิลด์/ทดสอบ และตอบสนองต่อผลลัพธ์ของโปรแกรม
  • ประสิทธิภาพการใช้โทเคนสูงขึ้น: ออกแบบให้จัดสรรโทเคนได้มีประสิทธิภาพมากขึ้นสำหรับงานขนาดเล็ก พร้อมใช้การให้เหตุผลที่ยาวนานขึ้นสำหรับงานซับซ้อน
  • การรีแฟกเตอริงและการแก้ไขขนาดใหญ่: ทำได้ดีกับการรีแฟกเตอริงข้ามไฟล์ การย้ายระบบ และแพตช์ระดับรีโพ (ตามการประเมินภายในของ OpenAI)
  • โหมดความพยายามในการให้เหตุผล: ระดับขั้นของความพยายามในการให้เหตุผลใหม่สำหรับงานที่ต้องใช้การคำนวณหนักและยาวนาน (เช่น Extra High / xhigh สำหรับงานที่ไม่อ่อนไหวต่อความหน่วงเวลา)

ความสามารถทางเทคนิค (จุดเด่น)

  • การรีแฟกเตอริงระยะยาวและลูปแบบวนซ้ำ: สามารถทำงานต่อเนื่องหลายชั่วโมง (OpenAI รายงาน >24 ชั่วโมงในเดโมภายใน) สำหรับการรีแฟกเตอริงระดับโปรเจกต์และเซสชันดีบัก โดยวนซ้ำ รันเทสต์ สรุปข้อผิดพลาด และอัปเดตโค้ด
  • การแก้บั๊กในสถานการณ์จริง: มีประสิทธิภาพสูงบนชุดทดสอบการแพตช์รีโพจริง (SWE-Bench Verified: OpenAI รายงาน 77.9% สำหรับ Codex-Max ในการตั้งค่า xhigh/extra-effort)
  • ความชำนาญด้านเทอร์มินัล/เครื่องมือ: อ่านล็อก เรียกคอมไพเลอร์/เทสต์ แก้ไขไฟล์ สร้าง PR — กล่าวคือทำงานเป็นเอเจนต์ที่ทำงานบนเทอร์มินัลโดยกำเนิด พร้อมการเรียกใช้เครื่องมือที่ชัดเจนและตรวจสอบได้
  • อินพุตที่รองรับ: พรอมป์ต์ข้อความมาตรฐานพร้อมโค้ดสไนเป็ต สแน็ปช็อตรีโพ (ผ่านการผสานรวมกับเครื่องมือ/IDE) ภาพหน้าจอ/หน้าต่างในพื้นผิว Codex ที่เปิดใช้งานวิชัน และคำขอเรียกใช้เครื่องมือ (เช่น run npm test, เปิดไฟล์, สร้าง PR)
  • เอาต์พุตที่ผลิตได้: แพตช์โค้ด (diff หรือ PR) รายงานการทดสอบ ล็อกการรันแบบทีละขั้นตอน คำอธิบายภาษาธรรมชาติ และคอมเมนต์รีวิวโค้ดแบบมีคำอธิบายกำกับ เมื่อใช้เป็นเอเจนต์ สามารถส่งออกคำเรียกใช้เครื่องมือแบบมีโครงสร้างและการดำเนินการต่อเนื่อง

ผลการทดสอบมาตรฐาน (ผลลัพธ์ที่เลือกและบริบท)

  • SWE-bench Verified (n=500) — GPT-5.1-Codex (high): 73.7%; GPT-5.1-Codex-Max (xhigh): 77.9%. เมตริกนี้ประเมินงานวิศวกรรมในโลกจริงที่นำมาจาก GitHub/โอเพนซอร์ส
  • SWE-Lancer IC SWE: GPT-5.1-Codex: 66.3% → GPT-5.1-Codex-Max: 79.9% (OpenAI รายงานการปรับปรุงบนลีดเดอร์บอร์ดบางรายการ)
  • Terminal-Bench 2.0: GPT-5.1-Codex: 52.8% → GPT-5.1-Codex-Max: 58.1% (มีการปรับปรุงในการประเมินการใช้เทอร์มินัล/เครื่องมือแบบโต้ตอบ)

ข้อจำกัดและรูปแบบความล้มเหลว

  1. การใช้งานสองด้าน/ความเสี่ยงด้านความมั่นคงไซเบอร์: ความสามารถที่เพิ่มขึ้นในการใช้งานเทอร์มินัลและเรียกใช้เครื่องมือก่อให้เกิดข้อกังวลการใช้งานสองด้าน (โมเดลสามารถช่วยได้ทั้งงานป้องกันและเชิงรุกด้านความปลอดภัย); OpenAI เน้นการควบคุมการเข้าถึงแบบเป็นขั้นและการติดตามตรวจสอบ
  2. ไม่เป็นแบบกำหนดแน่นอนหรือถูกต้องอย่างสมบูรณ์: แม้ประสิทธิภาพด้านวิศวกรรมจะสูงขึ้น โมเดลยังอาจเสนอแพตช์ที่ไม่ถูกต้องหรือพลาดความหมายเชิงจุลภาคของโค้ด (ผลบวก/ลบเทียมในการตรวจจับบั๊ก) ดังนั้นการรีวิวโดยมนุษย์และการทดสอบ CI ยังคงเป็นสิ่งจำเป็น
  3. สมดุลต้นทุนและความหน่วงเวลา: โหมดที่ใช้ความพยายามสูง (xhigh) ใช้ทรัพยากรคอมพิวต์/เวลาเพิ่มขึ้น; ลูปเอเจนต์แบบหลายชั่วโมงใช้เครดิตหรือบัดเจ็ต วางแผนสำหรับต้นทุนและขีดจำกัดอัตรา ([นักพัฒนา OpenAI][2])
  4. การรับประกันบริบทเทียบกับความต่อเนื่องที่มีประสิทธิผล: การอัดย่อช่วยให้โปรเจกต์ต่อเนื่องได้ แต่การรับประกันอย่างแม่นยำว่าโทเคนใดถูกเก็บไว้และการอัดย่อส่งผลต่อกรณีมุมที่พบได้น้อยอย่างไร ไม่สามารถทดแทนสแน็ปช็อตรีโพแบบมีเวอร์ชันและไปป์ไลน์ที่ทำซ้ำได้ ใช้การอัดย่อเป็นผู้ช่วย ไม่ใช่แหล่งความจริงเพียงอย่างเดียว

การเปรียบเทียบกับ Claude Opus 4.5 และ Gemini 3 Pro (ภาพรวม)

  • Anthropic — Claude Opus 4.5: บททดสอบจากชุมชนและสื่อมักจัดให้ Opus 4.5 นำหน้า Codex-Max เล็กน้อยในความถูกต้องของการแก้บั๊กล้วน (SWE-Bench) โดยเด่นในด้านการจัดการเชิงวิทยาศาสตร์และเอาต์พุตที่กระชับ ใช้โทเคนอย่างมีประสิทธิภาพ Opus มักมีราคาต่อโทเคนสูงกว่า แต่ในทางปฏิบัติอาจใช้โทเคนได้มีประสิทธิภาพกว่า ข้อได้เปรียบของ Codex-Max คือการอัดย่อระยะยาว การผสานรวมเครื่องมือเทอร์มินัล และความคุ้มค่าด้านต้นทุนสำหรับการรันเอเจนต์ยาว
  • Google Gemini family (3 Pro เป็นต้น): รุ่นต่าง ๆ ของ Gemini ยังคงแข็งแกร่งบนบันไดวัดแบบมัลติโหมดและการให้เหตุผลทั่วไป; ในโดเมนการเขียนโค้ดผลลัพธ์ต่างกันไปตามเฟรมเวิร์กทดสอบ Codex-Max ถูกสร้างมาเฉพาะสำหรับการเขียนโค้ดแบบเอเจนต์และผสานกับเวิร์กโฟลว์ DevTool ในแบบที่โมเดลสายกว้างไม่ได้มีโดยปริยาย

วิธีเข้าถึงและใช้ GPT-5.1 Codex Max API

ขั้นตอนที่ 1: ลงทะเบียนเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com. หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console. รับ API key สิทธิ์เข้าถึงสำหรับอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเคน: sk-xxxxx และส่ง

ขั้นตอนที่ 2: ส่งคำขอไปยัง GPT-5.1-Codex-Max API

เลือกปลายทาง “ gpt-5.1-codex-max” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการร้องขอและ request body อ้างอิงจากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ นักพัฒนาจะเรียกใช้งานผ่าน Responses API / Chat endpoints.

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ . ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

คุณสมบัติสำหรับ GPT 5.1 Codex Max

สำรวจคุณสมบัติหลักของ GPT 5.1 Codex Max ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ GPT 5.1 Codex Max

สำรวจราคาที่แข่งขันได้สำหรับ GPT 5.1 Codex Max ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า GPT 5.1 Codex Max สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$1/M
เอาต์พุต:$8/M
อินพุต:$1.25/M
เอาต์พุต:$10/M
-20%

โค้ดตัวอย่างและ API สำหรับ GPT 5.1 Codex Max

GPT-5.1-Codex-Max เป็นโมเดลการเขียนโค้ดเชิงเอเจนต์ที่ออกแบบมาโดยเฉพาะของ OpenAI ในตระกูล GPT-5.1 ซึ่งได้รับการปรับแต่งให้สามารถดำเนินเวิร์กโฟลว์ด้านวิศวกรรมซอฟต์แวร์ที่ใช้เวลานาน (การรีแฟกเตอร์, ลูปของเอเจนต์ที่กินเวลาหลายชั่วโมง, การทำงานอัตโนมัติบนเทอร์มินัล, การรันเทสต์และการรีวิวโค้ด) ด้วยความน่าเชื่อถือและประสิทธิภาพการใช้โทเค็นที่สูงกว่ารุ่นก่อนหน้า.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1-codex-max", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

โมเดลเพิ่มเติม