ข้อมูลพื้นฐานและคุณสมบัติสำคัญ
GPT-5 mini เป็นสมาชิกของตระกูล GPT-5 ที่ปรับให้เหมาะสมด้านต้นทุนและเวลาแฝง โดยมุ่งมอบจุดแข็งด้านมัลติโหมดและการปฏิบัติตามคำสั่งแบบเดียวกับ GPT-5 ในขณะที่มีต้นทุนที่ต่ำลงอย่างมากสำหรับการใช้งานระดับผลิตในสเกลใหญ่ เป้าหมายคือสภาพแวดล้อมที่ throughput, การคิดราคาแบบต่อโทเคนที่คาดการณ์ได้, และ การตอบสนองที่รวดเร็ว เป็นข้อจำกัดหลัก พร้อมยังคงความสามารถการใช้งานทั่วไปที่แข็งแกร่ง
- Model Name:
gpt-5-mini - Context Window: 400 000 โทเคน
- Max Output Tokens: 128 000
- Key features: ความเร็ว, throughput, ความคุ้มค่าต้นทุน, ผลลัพธ์แบบกำหนดแน่ชัดสำหรับพรอมป์ที่กระชับ
gpt-5-mini ทำงานอย่างไร?
เส้นทางการอนุมานและการปรับใช้ที่ปรับให้เหมาะสม. การเร่งความเร็วในทางปฏิบัติมาจาก การรวมเคอร์เนล (kernel fusion), การทำงานขนานของเทนเซอร์ที่ปรับจูนสำหรับกราฟที่เล็กกว่า, และรันไทม์อนุมานที่เลือกใช้วงรอบภายในแบบ “การคิด” ที่สั้นกว่า เว้นแต่นักพัฒนาจะร้องขอการให้เหตุผลที่ลึกขึ้น นั่นเป็นเหตุผลที่รุ่น mini ใช้คอมพิวต์ต่อการเรียกต่ำลงอย่างเห็นได้ชัดและมีเวลาแฝงที่คาดการณ์ได้สำหรับทราฟฟิกปริมาณสูง การแลกเปลี่ยนนี้เป็นไปโดยตั้งใจ: คอมพิวต์ต่อหนึ่ง forward pass ที่ต่ำลง → ต้นทุนต่ำลงและเวลาแฝงเฉลี่ยต่ำลง
การควบคุมสำหรับนักพัฒนา. GPT-5 mini เปิดเผยพารามิเตอร์อย่างเช่น verbosity (ควบคุมระดับรายละเอียด/ความยาว) และ reasoning_effort (แลกเปลี่ยนระหว่างความเร็วกับความลึก) พร้อมการรองรับ การเรียกใช้เครื่องมือ (tool-calling) ที่แข็งแรง (การเรียกใช้ฟังก์ชัน, สายงานเครื่องมือแบบขนาน, และการจัดการข้อผิดพลาดเชิงโครงสร้าง) ช่วยให้ระบบระดับผลิตสามารถปรับจูนความแม่นยำเทียบกับต้นทุนได้อย่างแม่นยำ
สมรรถนะการทดสอบ — ตัวเลขสำคัญและการตีความ
โดยทั่วไป GPT-5 mini อยู่ที่ประมาณ 85–95% ของ GPT-5 high บนเกณฑ์มาตรฐานทั่วไป ขณะเดียวกันปรับปรุงเวลาแฝง/ราคาอย่างมีนัยสำคัญ เอกสารเปิดตัวแพลตฟอร์มระบุว่ามี คะแนนสัมบูรณ์ที่สูงมาก สำหรับ GPT-5 high (AIME ≈ 94.6% รายงานสำหรับตัวแปรสูงสุด) โดยรุ่น mini ต่ำกว่าบ้างแต่ยังคงเป็นผู้นำอุตสาหกรรมเมื่อเทียบกับช่วงราคา
ครอบคลุมเกณฑ์มาตรฐานที่เป็นมาตรฐานและภายในหลายรายการ GPT-5 mini ทำได้ดังนี้:
- Intelligence (AIME ’25): 91.1% (เทียบกับ 94.6% สำหรับ GPT-5 high)
- Multimodal (MMMU): 81.6% (เทียบกับ 84.2% สำหรับ GPT-5 high)
- Coding (SWE-bench Verified): 71.0% (เทียบกับ 74.9% สำหรับ GPT-5 high)
- Instruction Following (Scale MultiChallenge): 62.3% (เทียบกับ 69.6%)
- Function Calling (τ²-bench telecom): 74.1% (เทียบกับ 96.7%)
- Hallucination Rates (LongFact-Concepts): 0.7% (ยิ่งต่ำยิ่งดี)([OpenAI][4])
ผลลัพธ์เหล่านี้แสดงให้เห็นถึงการแลกสมดุลที่แข็งแกร่งของ GPT-5 mini ระหว่างประสิทธิภาพ ต้นทุน และความเร็ว
ข้อจำกัด
ข้อจำกัดที่ทราบ: GPT-5 mini มีความสามารถในการให้เหตุผลเชิงลึกน้อยกว่ารุ่น GPT-5 แบบเต็ม มีความไวต่อพรอมป์กำกวมมากขึ้น และยังคงมีความเสี่ยงของการมโนข้อมูล
- การให้เหตุผลเชิงลึกลดลง: สำหรับงานที่ต้องให้เหตุผลหลายขั้นตอนหรือระยะยาว รุ่นให้เหตุผลแบบเต็มหรือรุ่น “คิด” ให้ผลลัพธ์ดีกว่า mini
- การมโนข้อมูลและความมั่นใจเกินจริง: mini ลดการมโนข้อมูลเมื่อเทียบกับรุ่นเล็กมาก แต่ไม่ได้กำจัดทั้งหมด; ควรตรวจสอบความถูกต้องในงานที่มีความเสี่ยงสูง (กฎหมาย การแพทย์ กำกับดูแล)
- ความไวต่อบริบท: สายโซ่บริบทที่ยาวมากและพึ่งพากันสูงเหมาะกับรุ่น GPT-5 แบบเต็มที่มีหน้าต่างบริบทใหญ่กว่าหรือรุ่น “คิด”
- ข้อจำกัดด้านความปลอดภัยและนโยบาย: ใช้การ์ดเรลด้านความปลอดภัยและข้อจำกัดอัตรา/การใช้งานเดียวกันกับรุ่น GPT-5 อื่นๆ งานอ่อนไหวต้องมีการกำกับดูแลโดยมนุษย์
gpt-5-mini ทำอะไรได้บ้าง?
- เอเจนต์สนทนาปริมาณมาก: เวลาแฝงต่ำ ต้นทุนคาดการณ์ได้
- สรุปเอกสารและมัลติโหมด: สรุปบริบทยาว รายงานภาพ+ข้อความ
- เครื่องมือนักพัฒนาที่ระดับสเกล: ตรวจโค้ด CI อัตโนมัติ รีวิวอัตโนมัติ สร้างโค้ดแบบน้ำหนักเบา
- การจัดประสานงานเอเจนต์: การเรียกใช้เครื่องมือด้วยสายงานแบบขนานเมื่องานไม่ต้องการการให้เหตุผลเชิงลึก
ฉันจะเริ่มใช้ gpt-5-mini API ได้อย่างไร?
ขั้นตอนที่จำเป็น
- เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน
- รับคีย์รับรองความถูกต้อง (API key) ของอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง
- รับ url ของไซต์นี้: https://api.cometapi.com/
วิธีการใช้งาน
- เลือกเอ็นด์พอยต์ “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" เพื่อส่งคำขอ API และตั้งค่าบอดีของคำขอ วิธีการและบอดีของคำขอสามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ - แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
- ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—ซึ่งเป็นสิ่งที่โมเดลจะตอบกลับ
- . ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มี REST API ที่เข้ากันได้อย่างสมบูรณ์—เพื่อการย้ายระบบอย่างไร้รอยต่อ รายละเอียดสำคัญดูที่ API doc:
- Core Parameters:
prompt,max_tokens_to_sample,temperature,stop_sequences - Endpoint: https://api.cometapi.com/v1/chat/completions
- Model Parameter: “
gpt-5-mini“ / "gpt-5-mini-2025-08-07" - Authentication:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
คำแนะนำการเรียก API: ควรเรียก gpt-5-chat-latest โดยใช้มาตรฐาน /v1/chat/completions format สำหรับรุ่นอื่นๆ (gpt-5, gpt-5-mini, gpt-5-nano และรุ่นที่ระบุวันที่) การใช้ the /v1/responses format is recommended ขณะนี้มีสองโหมดให้ใช้งาน