ข้อมูลพื้นฐานและคุณสมบัติสำคัญ

GPT-5 mini เป็นสมาชิกของตระกูล GPT-5 ที่ปรับให้เหมาะสมด้านต้นทุนและเวลาแฝง โดยมุ่งมอบจุดแข็งด้านมัลติโหมดและการปฏิบัติตามคำสั่งแบบเดียวกับ GPT-5 ในขณะที่มีต้นทุนที่ต่ำลงอย่างมากสำหรับการใช้งานระดับผลิตในสเกลใหญ่ เป้าหมายคือสภาพแวดล้อมที่ throughput, การคิดราคาแบบต่อโทเคนที่คาดการณ์ได้, และ การตอบสนองที่รวดเร็ว เป็นข้อจำกัดหลัก พร้อมยังคงความสามารถการใช้งานทั่วไปที่แข็งแกร่ง

Model Name: gpt-5-mini
Context Window: 400 000 โทเคน
Max Output Tokens: 128 000
Key features: ความเร็ว, throughput, ความคุ้มค่าต้นทุน, ผลลัพธ์แบบกำหนดแน่ชัดสำหรับพรอมป์ที่กระชับ

`gpt-5-mini` ทำงานอย่างไร?

เส้นทางการอนุมานและการปรับใช้ที่ปรับให้เหมาะสม. การเร่งความเร็วในทางปฏิบัติมาจาก การรวมเคอร์เนล (kernel fusion), การทำงานขนานของเทนเซอร์ที่ปรับจูนสำหรับกราฟที่เล็กกว่า, และรันไทม์อนุมานที่เลือกใช้วงรอบภายในแบบ “การคิด” ที่สั้นกว่า เว้นแต่นักพัฒนาจะร้องขอการให้เหตุผลที่ลึกขึ้น นั่นเป็นเหตุผลที่รุ่น mini ใช้คอมพิวต์ต่อการเรียกต่ำลงอย่างเห็นได้ชัดและมีเวลาแฝงที่คาดการณ์ได้สำหรับทราฟฟิกปริมาณสูง การแลกเปลี่ยนนี้เป็นไปโดยตั้งใจ: คอมพิวต์ต่อหนึ่ง forward pass ที่ต่ำลง → ต้นทุนต่ำลงและเวลาแฝงเฉลี่ยต่ำลง

การควบคุมสำหรับนักพัฒนา. GPT-5 mini เปิดเผยพารามิเตอร์อย่างเช่น verbosity (ควบคุมระดับรายละเอียด/ความยาว) และ reasoning_effort (แลกเปลี่ยนระหว่างความเร็วกับความลึก) พร้อมการรองรับ การเรียกใช้เครื่องมือ (tool-calling) ที่แข็งแรง (การเรียกใช้ฟังก์ชัน, สายงานเครื่องมือแบบขนาน, และการจัดการข้อผิดพลาดเชิงโครงสร้าง) ช่วยให้ระบบระดับผลิตสามารถปรับจูนความแม่นยำเทียบกับต้นทุนได้อย่างแม่นยำ

สมรรถนะการทดสอบ — ตัวเลขสำคัญและการตีความ

โดยทั่วไป GPT-5 mini อยู่ที่ประมาณ 85–95% ของ GPT-5 high บนเกณฑ์มาตรฐานทั่วไป ขณะเดียวกันปรับปรุงเวลาแฝง/ราคาอย่างมีนัยสำคัญ เอกสารเปิดตัวแพลตฟอร์มระบุว่ามี คะแนนสัมบูรณ์ที่สูงมาก สำหรับ GPT-5 high (AIME ≈ 94.6% รายงานสำหรับตัวแปรสูงสุด) โดยรุ่น mini ต่ำกว่าบ้างแต่ยังคงเป็นผู้นำอุตสาหกรรมเมื่อเทียบกับช่วงราคา

ครอบคลุมเกณฑ์มาตรฐานที่เป็นมาตรฐานและภายในหลายรายการ GPT-5 mini ทำได้ดังนี้:

Intelligence (AIME ’25): 91.1% (เทียบกับ 94.6% สำหรับ GPT-5 high)
Multimodal (MMMU): 81.6% (เทียบกับ 84.2% สำหรับ GPT-5 high)
Coding (SWE-bench Verified): 71.0% (เทียบกับ 74.9% สำหรับ GPT-5 high)
Instruction Following (Scale MultiChallenge): 62.3% (เทียบกับ 69.6%)
Function Calling (τ²-bench telecom): 74.1% (เทียบกับ 96.7%)
Hallucination Rates (LongFact-Concepts): 0.7% (ยิ่งต่ำยิ่งดี)([OpenAI][4])

ผลลัพธ์เหล่านี้แสดงให้เห็นถึงการแลกสมดุลที่แข็งแกร่งของ GPT-5 mini ระหว่างประสิทธิภาพ ต้นทุน และความเร็ว

ข้อจำกัด

ข้อจำกัดที่ทราบ: GPT-5 mini มีความสามารถในการให้เหตุผลเชิงลึกน้อยกว่ารุ่น GPT-5 แบบเต็ม มีความไวต่อพรอมป์กำกวมมากขึ้น และยังคงมีความเสี่ยงของการมโนข้อมูล

การให้เหตุผลเชิงลึกลดลง: สำหรับงานที่ต้องให้เหตุผลหลายขั้นตอนหรือระยะยาว รุ่นให้เหตุผลแบบเต็มหรือรุ่น “คิด” ให้ผลลัพธ์ดีกว่า mini
การมโนข้อมูลและความมั่นใจเกินจริง: mini ลดการมโนข้อมูลเมื่อเทียบกับรุ่นเล็กมาก แต่ไม่ได้กำจัดทั้งหมด; ควรตรวจสอบความถูกต้องในงานที่มีความเสี่ยงสูง (กฎหมาย การแพทย์ กำกับดูแล)
ความไวต่อบริบท: สายโซ่บริบทที่ยาวมากและพึ่งพากันสูงเหมาะกับรุ่น GPT-5 แบบเต็มที่มีหน้าต่างบริบทใหญ่กว่าหรือรุ่น “คิด”
ข้อจำกัดด้านความปลอดภัยและนโยบาย: ใช้การ์ดเรลด้านความปลอดภัยและข้อจำกัดอัตรา/การใช้งานเดียวกันกับรุ่น GPT-5 อื่นๆ งานอ่อนไหวต้องมีการกำกับดูแลโดยมนุษย์

`gpt-5-mini` ทำอะไรได้บ้าง?

เอเจนต์สนทนาปริมาณมาก: เวลาแฝงต่ำ ต้นทุนคาดการณ์ได้
สรุปเอกสารและมัลติโหมด: สรุปบริบทยาว รายงานภาพ+ข้อความ
เครื่องมือนักพัฒนาที่ระดับสเกล: ตรวจโค้ด CI อัตโนมัติ รีวิวอัตโนมัติ สร้างโค้ดแบบน้ำหนักเบา
การจัดประสานงานเอเจนต์: การเรียกใช้เครื่องมือด้วยสายงานแบบขนานเมื่องานไม่ต้องการการให้เหตุผลเชิงลึก

ฉันจะเริ่มใช้ `gpt-5-mini` API ได้อย่างไร?

ขั้นตอนที่จำเป็น

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน
รับคีย์รับรองความถูกต้อง (API key) ของอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง
รับ url ของไซต์นี้: https://api.cometapi.com/

วิธีการใช้งาน

เลือกเอ็นด์พอยต์ “gpt-5-mini“ / "gpt-5-mini-2025-08-07" เพื่อส่งคำขอ API และตั้งค่าบอดีของคำขอ วิธีการและบอดีของคำขอสามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ
แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—ซึ่งเป็นสิ่งที่โมเดลจะตอบกลับ
. ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

CometAPI มี REST API ที่เข้ากันได้อย่างสมบูรณ์—เพื่อการย้ายระบบอย่างไร้รอยต่อ รายละเอียดสำคัญดูที่ API doc:

Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
Endpoint: https://api.cometapi.com/v1/chat/completions
Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
Authentication: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

คำแนะนำการเรียก API: ควรเรียก gpt-5-chat-latest โดยใช้มาตรฐาน /v1/chat/completions format สำหรับรุ่นอื่นๆ (gpt-5, gpt-5-mini, gpt-5-nano และรุ่นที่ระบุวันที่) การใช้ the /v1/responses format is recommended ขณะนี้มีสองโหมดให้ใช้งาน

GPT-5 mini

ข้อมูลพื้นฐานและคุณสมบัติสำคัญ

`gpt-5-mini` ทำงานอย่างไร?

สมรรถนะการทดสอบ — ตัวเลขสำคัญและการตีความ

ข้อจำกัด

`gpt-5-mini` ทำอะไรได้บ้าง?

ฉันจะเริ่มใช้ `gpt-5-mini` API ได้อย่างไร?

ขั้นตอนที่จำเป็น

วิธีการใช้งาน

คุณสมบัติสำหรับ GPT-5 mini

ราคาสำหรับ GPT-5 mini

โค้ดตัวอย่างและ API สำหรับ GPT-5 mini

โมเดลเพิ่มเติม