โมเดลราคาองค์กร
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
บริษัท
เกี่ยวกับเราองค์กร
ทรัพยากร
โมเดล AIบล็อกบันทึกการเปลี่ยนแปลงสนับสนุน
ข้อกำหนดการให้บริการนโยบายความเป็นส่วนตัว
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

อินพุต:$0.16/M
เอาต์พุต:$0.4/M
บริบท:2M
เอาต์พุตสูงสุด:30K
Grok 4 Fast เป็นโมเดลปัญญาประดิษฐ์ตัวใหม่ที่เปิดตัวโดย xAI ซึ่งผสานความสามารถแบบ Inference และ non-Inference เข้าสู่สถาปัตยกรรมเดียว โมเดลนี้มีหน้าต่างบริบทขนาด 2 ล้านโทเค็น และถูกออกแบบมาสำหรับแอปพลิเคชันที่ต้องการปริมาณงานสูง เช่น การค้นหาและการเขียนโค้ด โมเดลนี้มี 2 เวอร์ชัน: Grok-4-Fast-Reasoning และ Grok-4-Fast-Non-Reasoning ซึ่งได้รับการปรับแต่งให้เหมาะกับงานที่แตกต่างกัน
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

คุณสมบัติหลัก (รายการสั้น)

  • โมเดล 2 รุ่น: grok-4-fast-reasoning และ grok-4-fast-non-reasoning (ปรับได้ตามความลึกเทียบกับความเร็ว)
  • หน้าต่างบริบทขนาดใหญ่มาก: สูงสุด 2,000,000 โทเค็น รองรับเอกสารที่ยาวมาก / ทรานสคริปต์หลายชั่วโมง / เวิร์กโฟลว์หลายเอกสาร
  • เน้นประสิทธิภาพของโทเค็น / ต้นทุน: xAI รายงานว่าใช้ thinking tokens น้อยลงประมาณ ~40% โดยเฉลี่ยเมื่อเทียบกับ Grok-4 และอ้างว่า ลดต้นทุนได้ประมาณ ~98% เพื่อให้ได้ประสิทธิภาพตามเบนช์มาร์กเท่าเดิม (ตามเมตริกที่ xAI รายงาน)
  • การผสานรวมเครื่องมือ / การท่องเว็บแบบเนทีฟ: ฝึกแบบ end-to-end ด้วย tool-use RL สำหรับการท่องเว็บ/X, การรันโค้ด และพฤติกรรมการค้นหาแบบเอเจนต์
  • มัลติโหมดและการเรียกใช้ฟังก์ชัน: รองรับรูปภาพและผลลัพธ์แบบมีโครงสร้าง; รองรับ function calling และรูปแบบการตอบกลับแบบมีโครงสร้างใน API

รายละเอียดทางเทคนิค

สถาปัตยกรรมการให้เหตุผลแบบรวมศูนย์: Grok-4-Fast ใช้ ฐานน้ำหนักโมเดลเดียว ที่สามารถกำหนดให้แสดงพฤติกรรมแบบ reasoning (chain-of-thought แบบยาว) หรือ non-reasoning (ตอบกลับรวดเร็ว) ผ่าน system prompts หรือการเลือกรุ่น แทนที่จะใช้โมเดลแกนหลักแยกกันสองตัวโดยสิ้นเชิง วิธีนี้ช่วยลดเวลาแฝงในการสลับและต้นทุนโทเค็นสำหรับเวิร์กโหลดแบบผสม

การเรียนรู้แบบเสริมกำลังเพื่อความหนาแน่นของความฉลาด: xAI รายงานว่าใช้ reinforcement learning ขนาดใหญ่ ที่มุ่งเน้น intelligence density (เพิ่มประสิทธิภาพสูงสุดต่อโทเค็น) ซึ่งเป็นพื้นฐานของการเพิ่มประสิทธิภาพการใช้โทเค็นตามที่ระบุ

การปรับสภาพด้วยเครื่องมือและการค้นหาแบบเอเจนต์: Grok-4-Fast ได้รับการฝึกและประเมินบนงานที่ต้องเรียกใช้เครื่องมือ (การท่องเว็บ, การค้นหาใน X, การรันโค้ด) โมเดลนี้ถูกนำเสนอว่ามีความสามารถในการ เลือก ได้ว่าเมื่อใดควรเรียกใช้เครื่องมือ และควรเชื่อมโยงหลักฐานจากการท่องเว็บเข้ากับคำตอบอย่างไร

ประสิทธิภาพตามเบนช์มาร์ก

มีการปรับปรุงใน BrowseComp (44.9% pass\@1 เทียบกับ 43.0% สำหรับ Grok-4), SimpleQA (95.0% เทียบกับ 94.0%), และมีการเพิ่มขึ้นอย่างมากในบางด้านของการท่องเว็บ/การค้นหาภาษาจีน xAI ยังรายงานด้วยว่า grok-4-fast-search variant ได้อันดับสูงสุดใน Search Arena ของ LMArena

กรณีการใช้งานทั่วไปและที่แนะนำ

  • การค้นหาและดึงข้อมูลปริมาณสูง — เอเจนต์ค้นหาที่ต้องการการให้เหตุผลผ่านเว็บหลายขั้นตอนอย่างรวดเร็ว
  • ผู้ช่วยและบอตแบบเอเจนต์ — เอเจนต์ที่ผสานการท่องเว็บ การรันโค้ด และการเรียกใช้เครื่องมือแบบอะซิงโครนัส (ในกรณีที่อนุญาต)
  • การใช้งานจริงที่คำนึงถึงต้นทุน — บริการที่ต้องมีการเรียกใช้งานจำนวนมากและต้องการเศรษฐศาสตร์โทเค็นต่อประโยชน์ที่ดีขึ้นเมื่อเทียบกับโมเดลฐานที่หนักกว่า
  • การทดลองของนักพัฒนา — การสร้างต้นแบบโฟลว์แบบมัลติโหมดหรือเสริมด้วยเว็บที่อาศัยการคิวรีอย่างรวดเร็วและซ้ำ ๆ
  • วิธีเข้าถึง Grok 4 fast API

ขั้นตอนที่ 1: สมัคร API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดสมัครก่อน ลงชื่อเข้าใช้ CometAPI console ของคุณ รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล เพื่อรับ token key: sk-xxxxx แล้วส่งข้อมูล

ขั้นตอนที่ 2: ส่งคำขอไปยัง Grok 4 fast API

เลือก endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบด้วย Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ Chat รูปแบบ(https://api.cometapi.com/v1/chat/completions)

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content — นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลผลลัพธ์

คุณสมบัติสำหรับ Grok 4 Fast

สำรวจคุณสมบัติหลักของ Grok 4 Fast ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Grok 4 Fast

สำรวจราคาที่แข่งขันได้สำหรับ Grok 4 Fast ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Grok 4 Fast สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$0.16/M
เอาต์พุต:$0.4/M
อินพุต:$0.2/M
เอาต์พุต:$0.5/M
-20%

โค้ดตัวอย่างและ API สำหรับ Grok 4 Fast

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Grok 4 Fast เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Grok 4 Fast ในโครงการของคุณ
POST
/v1/chat/completions

รุ่นของ Grok 4 Fast

เหตุผลที่ Grok 4 Fast มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ

xAI ได้ประกาศชื่อสาธารณะว่า grok-4-fast-reasoning และ grok-4-fast-non-reasoning โดยแต่ละรุ่นรายงานขีดจำกัดบริบทที่ 2M token เท่ากัน แพลตฟอร์มยังคงโฮสต์รุ่นเรือธง Grok-4 รุ่นก่อนหน้าอย่างต่อเนื่องด้วย (เช่น รุ่นย่อย grok-4-0709 ที่เคยใช้งานก่อนหน้านี้)

โมเดลเพิ่มเติม

C

Claude Opus 4.7

อินพุต:$3/M
เอาต์พุต:$15/M
โมเดลที่ฉลาดที่สุดสำหรับเอเจนต์และการเขียนโค้ด
A

Claude Sonnet 4.6

อินพุต:$2.4/M
เอาต์พุต:$12/M
Claude Sonnet 4.6 เป็นโมเดล Sonnet ที่มีความสามารถมากที่สุดเท่าที่เคยมีมา เป็นการอัปเกรดเต็มรูปแบบของทักษะของโมเดล ครอบคลุมการเขียนโค้ด การใช้งานคอมพิวเตอร์ การให้เหตุผลในบริบทยาว การวางแผนของเอเจนต์ งานด้านความรู้ และการออกแบบ Sonnet 4.6 ยังมาพร้อมกับหน้าต่างบริบทขนาด 1M โทเค็นในเวอร์ชันเบต้า
O

GPT-5.4 nano

อินพุต:$0.16/M
เอาต์พุต:$1/M
GPT-5.4 nano ถูกออกแบบมาสำหรับงานที่ความเร็วและต้นทุนมีความสำคัญสูงสุด เช่น การจำแนกประเภท การสกัดข้อมูล การจัดอันดับ และเอเจนต์ย่อย.
O

GPT-5.4 mini

อินพุต:$0.6/M
เอาต์พุต:$3.6/M
GPT-5.4 mini นำจุดแข็งของ GPT-5.4 มาสู่โมเดลที่เร็วกว่าและมีประสิทธิภาพมากขึ้น ซึ่งออกแบบมาสำหรับภาระงานปริมาณมาก
X

Grok 4.20

อินพุต:$1.6/M
เอาต์พุต:$4.8/M
Grok 4.20 เปิดตัวสถาปัตยกรรมแบบหลายเอเจนต์ (เอเจนต์เฉพาะทางหลายตัวที่ประสานงานกันแบบเรียลไทม์), โหมดบริบทที่ขยายขึ้น, และการปรับปรุงแบบมุ่งเน้นในด้านความสามารถในการทำตามคำสั่ง, การลดอาการหลงสร้าง, และเอาต์พุตแบบมีโครงสร้าง/รองรับเครื่องมือ
Q

Qwen3.6-Plus

อินพุต:$0.32/M
เอาต์พุต:$1.92/M
Qwen 3.6-Plus พร้อมใช้งานแล้ว โดยมาพร้อมความสามารถในการพัฒนาโค้ดที่ได้รับการปรับปรุง และประสิทธิภาพที่ดีขึ้นในการจดจำและอนุมานแบบมัลติโหมด ทำให้ประสบการณ์ Vibe Coding ดียิ่งกว่าเดิม

บล็อกที่เกี่ยวข้อง

วิธีใช้ z-image เพื่อสร้างเนื้อหา NSFW? คู่มือที่ดีที่สุดที่คุณต้องการ
Jan 7, 2026

วิธีใช้ z-image เพื่อสร้างเนื้อหา NSFW? คู่มือที่ดีที่สุดที่คุณต้องการ

Alibaba’s Tongyi Lab ได้เปิดตัว Z-Image อย่างเป็นทางการ ซึ่งเป็นโมเดลสร้างภาพแบบโอเพ่นซอร์สที่มีพารามิเตอร์ 6 พันล้านตัว และกำลังเป็นที่ฮือฮาในชุมชน AI ในขณะนี้ เปิดตัวในช่วงปลายปี 2025 Z-Image ได้แซงหน้าตัวเลือกยอดนิยมก่อนหน้าอย่าง Flux และ SDXL ในสายตาของผู้ใช้ท้องถิ่นจำนวนมาก
Grok 4.1 API ที่รวดเร็ว
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 API ที่รวดเร็ว

Grok 4.1 Fast คือโมเดลขนาดใหญ่ที่เน้นการใช้งานจริงของ xAI ซึ่งได้รับการปรับให้เหมาะสมสำหรับการเรียกใช้เครื่องมือแบบเอเจนต์ เวิร์กโฟลว์แบบบริบทยาว และการอนุมานแบบหน่วงเวลาต่ำ Grok 4.1 Fast เป็นตระกูลมัลติโมดัลสองตัวแปรที่ออกแบบมาเพื่อรันเอเจนต์อิสระที่ค้นหา รันโค้ด เรียกใช้บริการ และให้เหตุผลในบริบทขนาดใหญ่มาก (สูงสุด 2 ล้านโทเค็น)