คุณสมบัติหลัก (รายการสั้น)
- โมเดล 2 รุ่น:
grok-4-fast-reasoningและgrok-4-fast-non-reasoning(ปรับได้ตามความลึกเทียบกับความเร็ว) - หน้าต่างบริบทขนาดใหญ่มาก: สูงสุด 2,000,000 โทเค็น รองรับเอกสารที่ยาวมาก / ทรานสคริปต์หลายชั่วโมง / เวิร์กโฟลว์หลายเอกสาร
- เน้นประสิทธิภาพของโทเค็น / ต้นทุน: xAI รายงานว่าใช้ thinking tokens น้อยลงประมาณ ~40% โดยเฉลี่ยเมื่อเทียบกับ Grok-4 และอ้างว่า ลดต้นทุนได้ประมาณ ~98% เพื่อให้ได้ประสิทธิภาพตามเบนช์มาร์กเท่าเดิม (ตามเมตริกที่ xAI รายงาน)
- การผสานรวมเครื่องมือ / การท่องเว็บแบบเนทีฟ: ฝึกแบบ end-to-end ด้วย tool-use RL สำหรับการท่องเว็บ/X, การรันโค้ด และพฤติกรรมการค้นหาแบบเอเจนต์
- มัลติโหมดและการเรียกใช้ฟังก์ชัน: รองรับรูปภาพและผลลัพธ์แบบมีโครงสร้าง; รองรับ function calling และรูปแบบการตอบกลับแบบมีโครงสร้างใน API
รายละเอียดทางเทคนิค
สถาปัตยกรรมการให้เหตุผลแบบรวมศูนย์: Grok-4-Fast ใช้ ฐานน้ำหนักโมเดลเดียว ที่สามารถกำหนดให้แสดงพฤติกรรมแบบ reasoning (chain-of-thought แบบยาว) หรือ non-reasoning (ตอบกลับรวดเร็ว) ผ่าน system prompts หรือการเลือกรุ่น แทนที่จะใช้โมเดลแกนหลักแยกกันสองตัวโดยสิ้นเชิง วิธีนี้ช่วยลดเวลาแฝงในการสลับและต้นทุนโทเค็นสำหรับเวิร์กโหลดแบบผสม
การเรียนรู้แบบเสริมกำลังเพื่อความหนาแน่นของความฉลาด: xAI รายงานว่าใช้ reinforcement learning ขนาดใหญ่ ที่มุ่งเน้น intelligence density (เพิ่มประสิทธิภาพสูงสุดต่อโทเค็น) ซึ่งเป็นพื้นฐานของการเพิ่มประสิทธิภาพการใช้โทเค็นตามที่ระบุ
การปรับสภาพด้วยเครื่องมือและการค้นหาแบบเอเจนต์: Grok-4-Fast ได้รับการฝึกและประเมินบนงานที่ต้องเรียกใช้เครื่องมือ (การท่องเว็บ, การค้นหาใน X, การรันโค้ด) โมเดลนี้ถูกนำเสนอว่ามีความสามารถในการ เลือก ได้ว่าเมื่อใดควรเรียกใช้เครื่องมือ และควรเชื่อมโยงหลักฐานจากการท่องเว็บเข้ากับคำตอบอย่างไร
ประสิทธิภาพตามเบนช์มาร์ก
มีการปรับปรุงใน BrowseComp (44.9% pass\@1 เทียบกับ 43.0% สำหรับ Grok-4), SimpleQA (95.0% เทียบกับ 94.0%), และมีการเพิ่มขึ้นอย่างมากในบางด้านของการท่องเว็บ/การค้นหาภาษาจีน xAI ยังรายงานด้วยว่า grok-4-fast-search variant ได้อันดับสูงสุดใน Search Arena ของ LMArena
กรณีการใช้งานทั่วไปและที่แนะนำ
- การค้นหาและดึงข้อมูลปริมาณสูง — เอเจนต์ค้นหาที่ต้องการการให้เหตุผลผ่านเว็บหลายขั้นตอนอย่างรวดเร็ว
- ผู้ช่วยและบอตแบบเอเจนต์ — เอเจนต์ที่ผสานการท่องเว็บ การรันโค้ด และการเรียกใช้เครื่องมือแบบอะซิงโครนัส (ในกรณีที่อนุญาต)
- การใช้งานจริงที่คำนึงถึงต้นทุน — บริการที่ต้องมีการเรียกใช้งานจำนวนมากและต้องการเศรษฐศาสตร์โทเค็นต่อประโยชน์ที่ดีขึ้นเมื่อเทียบกับโมเดลฐานที่หนักกว่า
- การทดลองของนักพัฒนา — การสร้างต้นแบบโฟลว์แบบมัลติโหมดหรือเสริมด้วยเว็บที่อาศัยการคิวรีอย่างรวดเร็วและซ้ำ ๆ
- วิธีเข้าถึง Grok 4 fast API
ขั้นตอนที่ 1: สมัคร API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดสมัครก่อน ลงชื่อเข้าใช้ CometAPI console ของคุณ รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล เพื่อรับ token key: sk-xxxxx แล้วส่งข้อมูล
ขั้นตอนที่ 2: ส่งคำขอไปยัง Grok 4 fast API
เลือก endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบด้วย Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ Chat รูปแบบ(https://api.cometapi.com/v1/chat/completions)
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content — นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลผลลัพธ์

