GPT-5 Nano คือรุ่นที่มีน้ำหนักเบามากและมีความหน่วงต่ำของตระกูล GPT-5 ของ OpenAI ออกแบบมาสำหรับงานที่ ไวต่อค่าใช้จ่าย, เรียลไทม์, และปริมาณงานสูง ซึ่งความเร็วและราคาสำคัญกว่าความสามารถในการให้เหตุผลเชิงลึกหลายขั้นตอน โดยยังคงการทำตามคำสั่งและการปรับปรุงด้านความปลอดภัยของ GPT-5 เอาไว้ แต่แลกกับความลึกของการให้เหตุผลและความสามารถบางส่วนในการจัดการบริบทยาว เพื่อมอบ ความหน่วงต่ำมาก และ ต้นทุนต่อโทเคนต่ำมาก
ข้อมูลพื้นฐานและคุณสมบัติ
- ชื่อโมเดล:
gpt-5-nano - รองรับมัลติโหมด: ข้อความและภาพ (สูงสุด 400K โทเคนบริบท)
- หน้าต่างบริบท: โทเคนอินพุต 400,000 โทเคน; โทเคนเอาต์พุต 128,000 โทเคน
- ราคา
:- อินพุต: $0.05 ต่อ 1M โทเคน
- เอาต์พุต: $0.40 ต่อ 1M โทเคน
เมื่อเทียบกับ GPT-5 รุ่นหลัก GPT-5 nano แลก พลังการประมวลผลดิบ เพื่อให้ได้ ความหน่วงต่ำเป็นพิเศษ และ ต้นทุนที่ลดลง ทำให้เหมาะอย่างยิ่งสำหรับ แอปพลิเคชันแบบโต้ตอบ ที่ความเร็วและงบประมาณมีความสำคัญอย่างยิ่ง .
รายละเอียดทางเทคนิค
GPT-5 nano ใช้ สถาปัตยกรรมทรานส์ฟอร์เมอร์ เดียวกันกับรุ่นพี่ที่มีขนาดใหญ่กว่า แต่ผสานเทคนิค quantization และ parameter pruning ขั้นสูงเพื่อลดขนาดโมเดล คุณสมบัติประกอบด้วย:
- การให้เหตุผลขั้นต่ำ: เส้นทางการให้เหตุผลที่ถูกทำให้คล่องตัวและปรับให้เหมาะสำหรับการอนุมานแบบเทิร์นเดียว โดยจำลอง “การคิดในตัว” ของ GPT-5 ด้วยการใช้ทรัพยากรประมวลผลที่น้อยลง
- การควบคุมความยาวคำตอบ: พารามิเตอร์ verbosity ที่ปรับได้เพื่อจูนความยาวและรายละเอียดของคำตอบ
- Attention ที่มีประสิทธิภาพ: attention kernels แบบกำหนดเองสำหรับการปรับใช้ที่ใช้หน่วยความจำต่ำ โดยไม่ลดทอนความสามารถของโมเดลในการจัดการลำดับข้อมูลที่ยาว
เมื่อเปรียบเทียบกับ GPT-4 o mini, GPT-5 nano แสดงให้เห็น throughput ที่เร็วขึ้นได้สูงสุด 2× บนฮาร์ดแวร์เดียวกัน ด้วยการออกแบบที่ น้ำหนักเบา .
ประสิทธิภาพตามเบนช์มาร์ก
แม้ GPT-5 รุ่นหลักจะนำในด้านประสิทธิภาพโดยรวม แต่ GPT-5 nano ก็ให้ ความแม่นยำที่แข่งขันได้ ในเบนช์มาร์กสำคัญ:
- SWE-Bench (วิศวกรรมซอฟต์แวร์): ทำได้ประมาณ ~75% ของความแม่นยำในการสร้างโค้ดของ GPT-5 รุ่นหลัก ขณะลดเวลาอนุมานลงประมาณ ~50%
- HealthBench: รักษาประสิทธิภาพการให้เหตุผลทางคลินิกได้ประมาณ ~80% ของ GPT-5 รุ่นหลัก เหมาะสำหรับงานคัดกรองเบื้องต้นและงานสรุปพื้นฐาน .
- การทดสอบหลายภาษา: ยังคงรองรับได้ดีใน 12 ภาษา โดยคุณภาพการแปลลดลงน้อยกว่า 10% เมื่อเทียบกับ GPT-5 รุ่นหลัก .
ผลลัพธ์เหล่านี้ตอกย้ำความเหมาะสมของ GPT-5 nano สำหรับสภาพแวดล้อมที่ ไวต่อค่าใช้จ่าย และ ต้องการความหน่วงต่ำอย่างยิ่ง ซึ่งยอมรับการแลกเปลี่ยนด้านความแม่นยำได้เล็กน้อย
เวอร์ชันโมเดลและลำดับสายพันธุ์
- ชื่อในการ์ดโมเดล:
gpt-5-nano - จุดตัดความรู้: 30 พฤษภาคม 2024 สำหรับรุ่น nano
- ตำแหน่งในตระกูล
:- มาแทน GPT-4.1 nano ในฐานะตัวเลือกระดับเริ่มต้น
- อยู่ต่ำกว่า GPT-5 mini และ GPT-5 รุ่นหลักในลำดับชั้นด้านประสิทธิภาพ
รุ่น nano สืบทอดการปรับปรุงจากการฝึกของ GPT-5 รุ่นหลัก รวมถึง การหลอนข้อมูลที่ลดลง และ การให้เหตุผลเชิงโครงสร้าง แม้จะอยู่ในขนาดที่เล็กกว่า
ข้อจำกัด
แม้ GPT-5 nano จะโดดเด่นในด้าน ความเร็ว และ ต้นทุน แต่ก็มีข้อด้อยโดยธรรมชาติ:
- ความลึกที่ลดลง: มีความสามารถจำกัดสำหรับ การให้เหตุผลหลายขั้นตอน เมื่อเทียบกับ GPT-5 รุ่นหลัก ทำให้เหมาะน้อยกว่าสำหรับงานวางแผนที่ซับซ้อน
- อัตราการหลอนข้อมูลสูงกว่า: มีความเสี่ยงเพิ่มขึ้นเล็กน้อยในการสร้างรายละเอียดที่ไม่ถูกต้องภายใต้ พรอมป์ที่กำกวม
- การเรียกคืนบริบทต่ำกว่า: แม้หน้าต่างโทเคนดิบจะมีขนาดใหญ่ แต่กลไกภายในให้ความสำคัญกับบริบท ล่าสุด จึงอาจมองข้ามรายละเอียดก่อนหน้าในบทสนทนาที่ยาวมาก .
นักพัฒนาควรชั่งน้ำหนักข้อจำกัดเหล่านี้เมื่อเลือกใช้ GPT-5 nano สำหรับแอปพลิเคชันที่ต้องการ ความถูกต้องเชิงข้อเท็จจริงสูง
กรณีการใช้งาน
GPT-5 nano โดดเด่นในสถานการณ์ที่ การตอบสนองแบบเรียลไทม์ และ การควบคุมต้นทุน เป็นสิ่งสำคัญสูงสุด:
- ผู้ช่วยบนมือถือ: แชตบอตบนอุปกรณ์สำหรับแอปส่งข้อความ ที่ให้ การตอบกลับทันที โดยไม่มีภาระจากคลาวด์
- อินเทอร์เฟซ IoT: ระบบควบคุมด้วยเสียงในอุปกรณ์สมาร์ตโฮม ที่ใช้ประโยชน์จาก การอนุมานที่มีความหน่วงต่ำ
- การวิเคราะห์ที่เอดจ์: สรุปข้อมูลเซนเซอร์ภายในเครื่องก่อนอัปโหลดแบบแบตช์ เพื่อลดการใช้แบนด์วิดท์
- เครื่องมือการศึกษา: บอตติวเตอร์น้ำหนักเบาที่ทำงานในเบราว์เซอร์หรือบนฮาร์ดแวร์ระดับล่าง โดยให้ การเรียนรู้แบบโต้ตอบ
เมื่อเทียบกับการรัน GPT-5 รุ่นหลักในสภาพแวดล้อมคลาวด์ขนาดใหญ่ nano ช่วยให้ การปรับใช้แบบกระจาย ทำได้ในวงกว้าง พร้อม ต้นทุนต่อโทเคนที่คาดการณ์ได้
ฉันจะเริ่มใช้ API ของ gpt-5-nano ได้อย่างไร?
ขั้นตอนที่จำเป็น
- เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน
- รับข้อมูลรับรองการเข้าถึง API key ของอินเทอร์เฟซ คลิก “Add Token” ในส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่งคำขอ
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
วิธีใช้งาน
- เลือกปลายทาง “
**gpt-5-nano**” / "gpt-5-nano-2025-08-07" เพื่อส่งคำขอ API และตั้งค่า request body โดยวิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ - แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะใช้ตอบกลับ
- . ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มี REST API ที่เข้ากันได้อย่างสมบูรณ์—เพื่อการย้ายระบบที่ราบรื่น รายละเอียดสำคัญใน API doc:
- พารามิเตอร์หลัก:
prompt,max_tokens_to_sample,temperature,stop_sequences - ปลายทาง: https://api.cometapi.com/v1/chat/completions
- พารามิเตอร์โมเดล: “
gpt-5-nano” / "gpt-5-nano-2025-08-07" - การยืนยันตัวตน:
Bearer YOUR_CometAPI_API_KEY - Content-Type:
application/json.
คำแนะนำการเรียก API: gpt-5-chat-latest ควรถูกเรียกใช้ด้วยรูปแบบมาตรฐาน /v1/chat/completions format. สำหรับโมเดลอื่น ๆ (gpt-5, gpt-5-mini, gpt-5-nano และเวอร์ชันแบบระบุวันที่ของพวกมัน) แนะนำให้ใช้ the /v1/responses format ตามลิงก์นี้.Currently two modes are available.