กร็อก 4.1 เป็นการอัปเกรดเพิ่มเติมของ xAI สำหรับตระกูล Grok-4 ที่ xAI เริ่มเปิดตัวในช่วงกลางถึงปลายปี 2025 xAI นำเสนอ Grok 4.1 เป็นรุ่นที่เน้นการปรับปรุงคุณภาพการสนทนา โดยเฉพาะอย่างยิ่งด้านสติปัญญาทางอารมณ์ การเขียนเชิงสร้างสรรค์ และการตอบสนอง
คุณสมบัติหลัก
- โหมดการโต้ตอบสองโหมด:Grok 4.1 มีให้เลือกใช้ทั้งโหมดการใช้เหตุผล (“การคิด”) และโหมดไม่ใช้เหตุผล (การตอบสนองทันทีที่รวดเร็วและไม่ต้องใช้ความคิด) ช่วยให้สามารถแลกเปลี่ยนระหว่างผลลัพธ์ในรูปแบบห่วงโซ่ความคิดที่ไตร่ตรองอย่างรอบคอบและการตอบสนองที่มีเวลาแฝงต่ำกว่า
- การตอบสนองระหว่างบุคคล/อารมณ์ที่ดีขึ้น:xAI รายงานคะแนนสูงสุดใน EQ-Bench (เกณฑ์มาตรฐานสติปัญญาทางอารมณ์) โดยอ้างว่ามี Elo สูงกว่าอย่างเห็นได้ชัดในการประเมิน EQ-Bench เมื่อเทียบกับเวอร์ชันก่อนหน้า
- คุณภาพการสนทนาที่รับรู้ได้สูงขึ้นและสติปัญญาทางอารมณ์:การปรับปรุง Grok 4.1 บนเกณฑ์มาตรฐานความสัมพันธ์ระหว่างบุคคล / EQ ใหม่ (EQ-Bench3) และอ้างถึงความสอดคล้องและความเห็นอกเห็นใจแบบหลายรอบที่ดีขึ้น
- เครื่องมือและการรวมเว็บ/X:Grok ยังคงสนับสนุนการใช้เครื่องมือดั้งเดิม (การค้นหาเว็บ การดำเนินการโค้ด การเรียกใช้เครื่องมือแบบตัวแทน) โดยที่กลุ่มผลิตภัณฑ์ 4.x ได้รับการออกแบบมาโดยเฉพาะสำหรับการรวมการค้นหาแบบเรียลไทม์และเวิร์กโฟลว์แบบตัวแทน
- Grok 4.1 ลดอัตราความผิดพลาดของข้อมูลลงประมาณ 65% และลดการเกิดอาการประสาทหลอนลง 3 เท่า โดยเฉพาะอย่างยิ่งใน “โหมดไม่ใช้เหตุผล” ด้วยเครื่องมือค้นหาภายนอก ความสอดคล้องของข้อเท็จจริงมีเสถียรภาพมากขึ้น
รายละเอียดทางเทคนิค
- ครอบครัวโมเดลและการกำหนดค่า:Grok 4.1 เป็นการอัปเดตตระกูล Grok 4 และพร้อมใช้งานในโหมด Thinking (T) และ Non-Thinking (NT)
- สูตรฝึกฝน (ระดับสูง):การฝึกอบรมเบื้องต้นใช้ข้อมูลเว็บไซต์สาธารณะ แหล่งข้อมูลจากบุคคลที่สาม ข้อมูลผู้ใช้/ผู้รับเหมา และเนื้อหาที่สร้างขึ้นภายในองค์กร มีการปรับจูนแบบมีผู้ดูแลในช่วงกลางการฝึกอบรมและหลังการฝึกอบรม ร่วมกับ RLHF (การเรียนรู้แบบเสริมแรงจากฟีดแบ็กของมนุษย์และตัวให้คะแนนตามแบบจำลอง) เพื่อปรับความสามารถและความปลอดภัย
- ใช้แบบสร้างสรรค์ แบบจำลองการใช้เหตุผลของหน่วยงานที่ล้ำสมัย เป็นโมเดลรางวัลสำหรับประเมินและปรับปรุงคุณภาพการตอบกลับโดยอัตโนมัติ ตรวจสอบคำตอบของ Grok โดยอัตโนมัติ จึงปรับปรุงรูปแบบ ตรรกะ และความสอดคล้องกันผ่านการวนซ้ำในระดับใหญ่
ประสิทธิภาพเกณฑ์มาตรฐานและข้อมูลสนับสนุน
- LMArena / Text Arena:Grok 4.1 (และ Grok 4.1 Thinking) ขึ้นสู่ตำแหน่งสูงสุดบนกระดานผู้นำ Text Arena สาธารณะของ LMArena โดยมีรายงานคะแนน Elo ในช่วงกลางศตวรรษที่ 1400 (Grok 4.1 Thinking ~1483 Elo; non-thinking ~1465 ในบางสแนปช็อต) คะแนนเหล่านี้ทำให้ Grok 4.1 ขึ้นนำหน้าผู้เล่นรุ่นเดียวกันหลายๆ คนบนกระดานผู้นำในช่วงเวลาสแนปช็อตนั้น
- EQ-Bench (ความฉลาดทางอารมณ์):Grok 4.1 มีคะแนนอยู่ในช่วง Elo ประมาณ 1580 ใน EQ-Bench3 (แบบทดสอบการเล่นตามบทบาทที่ตัดสินโดย LLM ซึ่งวัดความเห็นอกเห็นใจ/ความเข้าใจ) xAI ยังอ้างว่ามีการปรับปรุงอย่างมีนัยสำคัญใน Elo ของการเขียนเชิงสร้างสรรค์ (เช่น มีการอ้างถึงการกระโดดประมาณ 600 Elo ในเกณฑ์มาตรฐานการเขียนเชิงสร้างสรรค์บางรายการเมื่อเทียบกับ Grok เวอร์ชันก่อนหน้า)
- การเลือกแบบปิดตา / การทดสอบ A/B:xAI รายงานว่า อัตราการชนะ ~64.8% สำหรับ Grok 4.1 ในการทดสอบการตั้งค่าแบบปิดตาเทียบกับ Grok 4 รุ่นก่อนหน้าในการเปรียบเทียบภายใน/แบบควบคุม
- ภาพหลอนและความเป็นจริง:การอ้างสิทธิ์ xAI/ความครอบคลุมช่วยลดอัตราการเกิดภาพหลอน (เช่น "น้อยลงสามเท่า" ในการค้นหาข้อมูลบางประเภทเมื่อเปรียบเทียบกับรุ่นก่อนหน้า) ซึ่งทำได้โดยใช้กลยุทธ์การฝึกอบรมหลังการฝึกอบรมแบบกำหนดเป้าหมายและการยึดโยงเว็บ
ข้อจำกัด ความเสี่ยง และมาตรการความปลอดภัย
- การปฏิเสธและความแข็งแกร่งในการโต้แย้ง: Grok 4.1 ปฏิเสธคำขอที่เป็นอันตรายอย่างชัดเจน แต่การฉีดทันทีและการเจลเบรกยังคงมีอัตราความสำเร็จที่ไม่เป็นศูนย์ในการทดสอบเชิงต่อต้าน xAI ยังคงปรับปรุงตัวกรองอินพุตต่อไป
- การใช้คู่และชีววิทยา: Grok 4.1 ทำงานได้ดีในงานความรู้บางอย่าง แต่แสดงจุดอ่อนในเหตุผลเชิงทดลองหลายขั้นตอน (FigQA, CloningScenarios) และ xAI ระบุข้อกังวลการใช้งานสองทางและใช้ตัวกรองที่กำหนดเป้าหมายสำหรับความรู้ทางเคมีและชีวภาพที่จำกัด
- ภาพหลอน / ความเป็นจริง: xAI รายงานการปรับปรุง (อัตราการประสาทหลอนลดลง) แต่การ์ดโมเดลและผู้ตรวจสอบอิสระสังเกตเห็นข้อผิดพลาดด้านข้อเท็จจริงที่เหลืออยู่ ผู้ใช้ควรตรวจสอบเอาต์พุตที่มีความสำคัญสูง
- การประจบสอพลอและการหลอกลวง: มีการวัดค่าความประจบสอพลอและความไม่ซื่อสัตย์ และมีการประเมินอย่างเฉพาะเจาะจง แม้ว่าจะปรับปรุงดีขึ้นเมื่อเทียบกับตัวแปรก่อนหน้า แต่ค่าเหล่านี้ไม่ใช่ศูนย์ และควรนำมาพิจารณาในการออกแบบ UX
คำแนะนำ: ปฏิบัติต่อ Grok 4.1 เสมือนเป็นผู้ช่วยการสนทนาและการใช้เหตุผลอันทรงพลัง แต่ใช้การบรรเทามาตรฐานสำหรับการใช้งานที่มีความสำคัญสูง (การตรวจสอบโดยมนุษย์ การตรวจสอบผลลัพธ์ การกรองข้อมูลอินพุต และการตรวจสอบ)
กรณีการใช้งานทั่วไป/ที่แนะนำ
- ตัวแทนสนทนาที่เผชิญหน้ากับลูกค้า ที่ซึ่งโทนอารมณ์ ความเห็นอกเห็นใจ และความชอบในการสนทนาเป็นสิ่งสำคัญ (การสนับสนุน การฝึกสอน บอทโซเชียลที่มีการควบคุม) ()
- การสร้างเนื้อหาเชิงสร้างสรรค์ (การเล่าเรื่อง สำเนาการตลาด การเล่าเรื่อง) — Grok 4.1 อ้างว่ามีการปรับปรุงครั้งใหญ่ในส่วนนี้
- เฟรมเวิร์กตัวแทนและแชท็อป ที่ใช้การเรียกใช้เครื่องมือและการค้นหาเว็บ — ตระกูล Grok รองรับการค้นหาบนเว็บ/สดแบบเนทีฟและเวิร์กโฟลว์การใช้งานเครื่องมือ
วิธีการเรียกใช้ Grok-4.1 API จาก CometAPI (ตัวอย่าง Grok-4.1 ยังไม่ออนไลน์)
ราคา API Grok-4.1 ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- ลงชื่อเข้าใช้ของคุณ คอนโซล CometAPI.
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง

ใช้วิธีการ
- เลือก“
Grok 4.1” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ พูดคุย :
- URL ฐาน: https://api.cometapi.com/v1/chat/completions
- ชื่อรุ่น:
Grok 4.1 - รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEYส่วนหัว - ชนิดของเนื้อหา:
application/json.
ดูสิ่งนี้ด้วย จีพีที-5.1
