คุณสมบัติหลัก (รายการสั้น)

โมเดล 2 รุ่น: grok-4-fast-reasoning และ grok-4-fast-non-reasoning (ปรับได้ตามความลึกเทียบกับความเร็ว)
หน้าต่างบริบทขนาดใหญ่มาก: สูงสุด 2,000,000 โทเค็น รองรับเอกสารที่ยาวมาก / ทรานสคริปต์หลายชั่วโมง / เวิร์กโฟลว์หลายเอกสาร
เน้นประสิทธิภาพของโทเค็น / ต้นทุน: xAI รายงานว่าใช้ thinking tokens น้อยลงประมาณ ~40% โดยเฉลี่ยเมื่อเทียบกับ Grok-4 และอ้างว่า ลดต้นทุนได้ประมาณ ~98% เพื่อให้ได้ประสิทธิภาพตามเบนช์มาร์กเท่าเดิม (ตามเมตริกที่ xAI รายงาน)
การผสานรวมเครื่องมือ / การท่องเว็บแบบเนทีฟ: ฝึกแบบ end-to-end ด้วย tool-use RL สำหรับการท่องเว็บ/X, การรันโค้ด และพฤติกรรมการค้นหาแบบเอเจนต์
มัลติโหมดและการเรียกใช้ฟังก์ชัน: รองรับรูปภาพและผลลัพธ์แบบมีโครงสร้าง; รองรับ function calling และรูปแบบการตอบกลับแบบมีโครงสร้างใน API

รายละเอียดทางเทคนิค

สถาปัตยกรรมการให้เหตุผลแบบรวมศูนย์: Grok-4-Fast ใช้ ฐานน้ำหนักโมเดลเดียว ที่สามารถกำหนดให้แสดงพฤติกรรมแบบ reasoning (chain-of-thought แบบยาว) หรือ non-reasoning (ตอบกลับรวดเร็ว) ผ่าน system prompts หรือการเลือกรุ่น แทนที่จะใช้โมเดลแกนหลักแยกกันสองตัวโดยสิ้นเชิง วิธีนี้ช่วยลดเวลาแฝงในการสลับและต้นทุนโทเค็นสำหรับเวิร์กโหลดแบบผสม

การเรียนรู้แบบเสริมกำลังเพื่อความหนาแน่นของความฉลาด: xAI รายงานว่าใช้ reinforcement learning ขนาดใหญ่ ที่มุ่งเน้น intelligence density (เพิ่มประสิทธิภาพสูงสุดต่อโทเค็น) ซึ่งเป็นพื้นฐานของการเพิ่มประสิทธิภาพการใช้โทเค็นตามที่ระบุ

การปรับสภาพด้วยเครื่องมือและการค้นหาแบบเอเจนต์: Grok-4-Fast ได้รับการฝึกและประเมินบนงานที่ต้องเรียกใช้เครื่องมือ (การท่องเว็บ, การค้นหาใน X, การรันโค้ด) โมเดลนี้ถูกนำเสนอว่ามีความสามารถในการ เลือก ได้ว่าเมื่อใดควรเรียกใช้เครื่องมือ และควรเชื่อมโยงหลักฐานจากการท่องเว็บเข้ากับคำตอบอย่างไร

ประสิทธิภาพตามเบนช์มาร์ก

มีการปรับปรุงใน BrowseComp (44.9% pass\@1 เทียบกับ 43.0% สำหรับ Grok-4), SimpleQA (95.0% เทียบกับ 94.0%), และมีการเพิ่มขึ้นอย่างมากในบางด้านของการท่องเว็บ/การค้นหาภาษาจีน xAI ยังรายงานด้วยว่า grok-4-fast-search variant ได้อันดับสูงสุดใน Search Arena ของ LMArena

กรณีการใช้งานทั่วไปและที่แนะนำ

การค้นหาและดึงข้อมูลปริมาณสูง — เอเจนต์ค้นหาที่ต้องการการให้เหตุผลผ่านเว็บหลายขั้นตอนอย่างรวดเร็ว
ผู้ช่วยและบอตแบบเอเจนต์ — เอเจนต์ที่ผสานการท่องเว็บ การรันโค้ด และการเรียกใช้เครื่องมือแบบอะซิงโครนัส (ในกรณีที่อนุญาต)
การใช้งานจริงที่คำนึงถึงต้นทุน — บริการที่ต้องมีการเรียกใช้งานจำนวนมากและต้องการเศรษฐศาสตร์โทเค็นต่อประโยชน์ที่ดีขึ้นเมื่อเทียบกับโมเดลฐานที่หนักกว่า
การทดลองของนักพัฒนา — การสร้างต้นแบบโฟลว์แบบมัลติโหมดหรือเสริมด้วยเว็บที่อาศัยการคิวรีอย่างรวดเร็วและซ้ำ ๆ
วิธีเข้าถึง Grok 4 fast API

ขั้นตอนที่ 1: สมัคร API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดสมัครก่อน ลงชื่อเข้าใช้ CometAPI console ของคุณ รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล เพื่อรับ token key: sk-xxxxx แล้วส่งข้อมูล

ขั้นตอนที่ 2: ส่งคำขอไปยัง Grok 4 fast API

เลือก endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบด้วย Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ Chat รูปแบบ(https://api.cometapi.com/v1/chat/completions)

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content — นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลผลลัพธ์

คุณสมบัติสำหรับ Grok 4 Fast

สำรวจคุณสมบัติหลักของ Grok 4 Fast ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Grok 4 Fast

สำรวจราคาที่แข่งขันได้สำหรับ Grok 4 Fast ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Grok 4 Fast สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้

ราคา Comet (USD / M Tokens)	ราคาทางการ (USD / M Tokens)	ส่วนลด
อินพุต:$0.16/M เอาต์พุต:$0.4/M	อินพุต:$0.2/M เอาต์พุต:$0.5/M	-20%

โค้ดตัวอย่างและ API สำหรับ Grok 4 Fast

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Grok 4 Fast เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Grok 4 Fast ในโครงการของคุณ

รุ่นของ Grok 4 Fast

เหตุผลที่ Grok 4 Fast มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ

xAI ได้ประกาศชื่อสาธารณะว่า grok-4-fast-reasoning และ grok-4-fast-non-reasoning โดยแต่ละรุ่นรายงานขีดจำกัดบริบทที่ 2M token เท่ากัน แพลตฟอร์มยังคงโฮสต์รุ่นเรือธง Grok-4 รุ่นก่อนหน้าอย่างต่อเนื่องด้วย (เช่น รุ่นย่อย grok-4-0709 ที่เคยใช้งานก่อนหน้านี้)

คุณสมบัติหลัก (รายการสั้น)

โมเดล 2 รุ่น: grok-4-fast-reasoning และ grok-4-fast-non-reasoning (ปรับได้ตามความลึกเทียบกับความเร็ว)
หน้าต่างบริบทขนาดใหญ่มาก: สูงสุด 2,000,000 โทเค็น รองรับเอกสารที่ยาวมาก / ทรานสคริปต์หลายชั่วโมง / เวิร์กโฟลว์หลายเอกสาร
เน้นประสิทธิภาพของโทเค็น / ต้นทุน: xAI รายงานว่าใช้ thinking tokens น้อยลงประมาณ ~40% โดยเฉลี่ยเมื่อเทียบกับ Grok-4 และอ้างว่า ลดต้นทุนได้ประมาณ ~98% เพื่อให้ได้ประสิทธิภาพตามเบนช์มาร์กเท่าเดิม (ตามเมตริกที่ xAI รายงาน)
การผสานรวมเครื่องมือ / การท่องเว็บแบบเนทีฟ: ฝึกแบบ end-to-end ด้วย tool-use RL สำหรับการท่องเว็บ/X, การรันโค้ด และพฤติกรรมการค้นหาแบบเอเจนต์
มัลติโหมดและการเรียกใช้ฟังก์ชัน: รองรับรูปภาพและผลลัพธ์แบบมีโครงสร้าง; รองรับ function calling และรูปแบบการตอบกลับแบบมีโครงสร้างใน API

รายละเอียดทางเทคนิค

ประสิทธิภาพตามเบนช์มาร์ก

กรณีการใช้งานทั่วไปและที่แนะนำ

การค้นหาและดึงข้อมูลปริมาณสูง — เอเจนต์ค้นหาที่ต้องการการให้เหตุผลผ่านเว็บหลายขั้นตอนอย่างรวดเร็ว
ผู้ช่วยและบอตแบบเอเจนต์ — เอเจนต์ที่ผสานการท่องเว็บ การรันโค้ด และการเรียกใช้เครื่องมือแบบอะซิงโครนัส (ในกรณีที่อนุญาต)
การใช้งานจริงที่คำนึงถึงต้นทุน — บริการที่ต้องมีการเรียกใช้งานจำนวนมากและต้องการเศรษฐศาสตร์โทเค็นต่อประโยชน์ที่ดีขึ้นเมื่อเทียบกับโมเดลฐานที่หนักกว่า
การทดลองของนักพัฒนา — การสร้างต้นแบบโฟลว์แบบมัลติโหมดหรือเสริมด้วยเว็บที่อาศัยการคิวรีอย่างรวดเร็วและซ้ำ ๆ
วิธีเข้าถึง Grok 4 fast API

Grok 4 Fast

โมเดลเพิ่มเติม

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

บล็อกที่เกี่ยวข้อง

วิธีใช้ z-image เพื่อสร้างเนื้อหา NSFW? คู่มือที่ดีที่สุดที่คุณต้องการ

Grok 4.1 API ที่รวดเร็ว