API GLM‑4.5 ของ Zhipu เป็นบริการ RESTful แบบรวมศูนย์บนแพลตฟอร์ม Z.ai (ทั่วโลก) และ Zhipu AI Open (จีนแผ่นดินใหญ่) ที่เปิดเผยโมเดล GLM‑355 ผู้เชี่ยวชาญไฮบริดที่มีพารามิเตอร์ 4.5 พันล้านพารามิเตอร์ ซึ่งสามารถใช้งานการใช้เหตุผลที่ซับซ้อน การเข้ารหัส และงานตัวแทน พร้อมตัวเลือกที่กำหนดค่าได้ (เช่น อุณหภูมิ โทเค็นสูงสุด การสตรีม)
คุณสมบัติพื้นฐาน
GLM‑4.5 ได้รับการออกแบบให้เป็น แบบจำลองตัวแทนแบบรวมการบูรณาการ เหตุผล, การเข้ารหัสและ การตัดสินใจโดยอิสระ ความสามารถภายในสถาปัตยกรรมเดียว รองรับโหมดการทำงานสองโหมดโดยธรรมชาติคิด สำหรับการใช้เหตุผลที่ซับซ้อนและการใช้เครื่องมือและ ไม่คิด เพื่อการตอบสนองที่รวดเร็วตามต้องการ จึงเหมาะอย่างยิ่งสำหรับการใช้งานที่หลากหลาย ตัวแทน เวิร์กโฟลว์
รายละเอียดทางเทคนิค
- สเกลพารามิเตอร์:เรือธง GLM‑4.5 ประกอบด้วย 355 พันล้าน พารามิเตอร์รวมกับ 32 พันล้านใช้งานอยู่ พารามิเตอร์
- การใช้เหตุผลแบบไฮบริด:GLM‑4.5 ใช้ การหาปริมาณ FP8 แบบไฮบริด กลยุทธ์ในการเพิ่มประสิทธิภาพ ประสิทธิภาพการอนุมาน โดยไม่ต้องเสียสละความแม่นยำมากนัก
- ประสิทธิภาพของพารามิเตอร์: การใช้งาน พารามิเตอร์ที่ใช้งาน 32 B จาก 355 B เพื่อลดภาระของฮาร์ดแวร์ในระหว่างการอนุมาน
- การเพิ่มประสิทธิภาพเลเยอร์:ส่วนประกอบที่ถูกตัดและกระจายใหม่เป็นชั้นที่ลึกขึ้น เพิ่มประสิทธิภาพ เหตุผลเชิงตรรกะ ขนาดโมเดลแบบไม่มีบอลลูน
เวิร์กโฟลว์การฝึกอบรม
การฝึกอบรมหลายขั้นตอน:
- การฝึกอบรมเบื้องต้นพื้นฐาน บนโทเค็นประมาณ ~15 ล้านล้าน
- การใช้เหตุผล การปรับแต่งอย่างละเอียด บนโทเค็นที่คัดสรรมาแล้วกว่า 7 ล้านล้านรายการเพื่อปรับปรุงการตัดสินใจและการสังเคราะห์โค้ด
ประสิทธิภาพมาตรฐาน
บนชุดของ เกณฑ์มาตรฐานอุตสาหกรรม 12 รายการ ครอบคลุม ตัวแทน, เหตุผลและ การเข้ารหัส งาน GLM‑4.5 ได้คะแนนรวมเท่ากับ 63.2การจัดอันดับ ที่สาม อยู่เบื้องหลังยักษ์ใหญ่ระดับโลก เช่น จีพีที‑4 และ กร็อก 4. ไฮไลท์รวมถึง:
| มาตรฐาน | คะแนน GLM‑4.5 | การเปรียบเทียบกรรมสิทธิ์ชั้นนำ |
|---|---|---|
| BrowseComp (เว็บ) | 26.4% | ผลงานของคล็อด 4: 18.8% |
| คณิตศาสตร์ 500 | 98.2% | GPT‑4 เทอร์โบ |
| เอไอเอ็มอี24 | 91.0% | โคลด 4 โซเน็ต |
| GPQA | 79.1% | เจมินี่ 2.5 โปร |
ในชุดการทดสอบแข่งขัน 12 ชุด ครอบคลุม การเข้ารหัส, เหตุผลและ ตัวแทน เกณฑ์มาตรฐาน—ระดับ GLM‑4.5 รวมที่สาม, การจับคู่หรือเหนือกว่ารุ่นที่เป็นกรรมสิทธิ์ชั้นนำ เช่น Claude 4 Sonnet และ Gemini 2.5 Pro ในงานเช่น ม้านั่ง SWE และ เอไอเอ็มอี24 .

รุ่นรุ่น
การขอ ตระกูล GLM‑4.5 รวมถึงตัวแปรเฉพาะทางหลายตัวที่สามารถเข้าถึงได้ผ่าน API:
- จีแอลเอ็ม‑4.5 (พารามิเตอร์รวม 355 B; 32 B ใช้งานอยู่)
- GLM‑4.5‑แอร์ (รวม 106 B; น้ำหนักเบา อนุมานได้เร็วขึ้น)
- GLM‑4.5‑X, GLM‑4.5‑AirX (การอนุมานแบบความเร็วสูงพิเศษ)
- GLM‑4.5‑แฟลช (ฟรี ปรับให้เหมาะสมสำหรับการเขียนโค้ดและการใช้เหตุผล)
วิธีการโทร จีแอลเอ็ม‑4.5 API จาก CometAPI
GLM‑4.5 ราคาซีรีส์ API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:
| รุ่น | แนะนำ | ราคา |
glm-4.5 | แบบจำลองการใช้เหตุผลอันทรงพลังที่สุดของเรา มีพารามิเตอร์ 355 พันล้านรายการ | โทเค็นอินพุต $0.48 โทเค็นเอาต์พุต $1.92 |
glm-4.5-air | คุ้มค่า น้ำหนักเบา ประสิทธิภาพแข็งแกร่ง | โทเค็นอินพุต $0.16 โทเค็นเอาต์พุต $1.07 |
glm-4.5-x | ประสิทธิภาพสูง การตอบสนองที่รวดเร็วเป็นพิเศษ | โทเค็นอินพุต $1.60 โทเค็นเอาต์พุต $6.40 |
glm-4.5-airx | น้ำหนักเบา ประสิทธิภาพแข็งแกร่ง ตอบสนองรวดเร็วเป็นพิเศษ | โทเค็นอินพุต $0.02 โทเค็นเอาต์พุต $0.06 |
glm-4.5-flash | ประสิทธิภาพที่ยอดเยี่ยมสำหรับการเข้ารหัสเหตุผลและตัวแทน | โทเค็นอินพุต $3.20 โทเค็นเอาต์พุต $12.80 |
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
ใช้วิธีการ
- เลือก“
glm-4.5” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:
- URL ฐาน: https://api.cometapi.com/v1/chat/completions
- ชื่อรุ่น: "
glm-4.5" - รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEYส่วนหัว - ชนิดของเนื้อหา:
application/json.
การรวม API และตัวอย่าง
ด้านล่างคือ หลาม ตัวอย่างที่สาธิตวิธีเรียกใช้ GLM‑4.5 ผ่าน API ของ CometAPI แทนที่ <API_KEY> และ <PROMPT> ตามนั้น:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
พารามิเตอร์สำคัญ:
- แบบ: ระบุรุ่น GLM‑4.5
- max_tokens: ควบคุมความยาวเอาต์พุต
- อุณหภูมิ:ปรับความคิดสร้างสรรค์กับการกำหนดล่วงหน้า
ดูเพิ่มเติม GLM-4.5 แอร์ API
