API Grok-4-fast

CometAPI
AnnaSep 22, 2025
API Grok-4-fast

Grok-4-Fast คือ xAI รูปแบบการใช้เหตุผลแบบประหยัดต้นทุนใหม่ ออกแบบมาเพื่อให้การใช้เหตุผลคุณภาพสูงและความสามารถในการค้นหาเว็บมีราคาถูกและรวดเร็วยิ่งขึ้นสำหรับทั้งผู้บริโภคและนักพัฒนา xAI จัดให้เป็น ชายแดน เสนอบริการที่รักษาประสิทธิภาพเกณฑ์มาตรฐานของ Grok-4 ขณะเดียวกันก็ปรับปรุงประสิทธิภาพโทเค็น และจัดส่งสองตัวแปรที่ปรับแต่งสำหรับ เหตุผล or การไม่ใช้เหตุผล ปริมาณงาน

คุณสมบัติหลัก (รายการด่วน)

  • มีสองรุ่นย่อย: grok-4-fast-reasoning และ grok-4-fast-non-reasoning (ปรับแต่งได้ทั้งความลึกและความเร็ว)
  • หน้าต่างบริบทขนาดใหญ่มาก: รูปภาพ โทเค็น 2,000,000ช่วยให้สามารถสร้างเอกสารที่มีความยาวมาก / สำเนาเอกสารหลายชั่วโมง / เวิร์กโฟลว์เอกสารหลายฉบับได้
  • ประสิทธิภาพโทเค็น / เน้นต้นทุน: รายงาน xAI ~โทเค็นการคิดลดลง 40% โดยเฉลี่ยเมื่อเทียบกับ Grok-4 และอ้างว่า ลดต้นทุนลง ~98% เพื่อให้ได้ประสิทธิภาพตามเกณฑ์มาตรฐานเดียวกัน (ตามรายงานเมตริก xAI)
  • เครื่องมือดั้งเดิม / การรวมการเรียกดู: ได้รับการฝึกอบรมแบบครบวงจรด้วย RL ที่ใช้เครื่องมือสำหรับการเรียกดูเว็บ/X การดำเนินการโค้ด และพฤติกรรมการค้นหาแบบตัวแทน
  • การโทรแบบหลายโหมดและฟังก์ชัน: รองรับรูปภาพและเอาท์พุตที่มีโครงสร้าง รองรับการเรียกใช้ฟังก์ชันและรูปแบบการตอบกลับที่มีโครงสร้างใน API

รายละเอียดทางเทคนิค

สถาปัตยกรรมการใช้เหตุผลแบบรวม: Grok-4-Fast ใช้ ฐานน้ำหนักแบบเดี่ยว ที่สามารถบังคับเลี้ยวได้ เหตุผล (สายความคิดยาว) หรือ การไม่ใช้เหตุผล (การตอบกลับอย่างรวดเร็ว) ผ่านการแจ้งเตือนของระบบหรือการเลือกตัวแปร แทนที่จะส่งโมเดลหลักสองแบบที่แยกจากกันโดยสิ้นเชิง ซึ่งจะช่วยลดความหน่วงในการสลับและต้นทุนโทเค็นสำหรับเวิร์กโหลดแบบผสม

การเรียนรู้เสริมแรงเพื่อความหนาแน่นของสติปัญญา: รายงาน xAI โดยใช้ การเรียนรู้การเสริมแรงขนาดใหญ่ มุ่งเน้นไปที่ ความหนาแน่นของสติปัญญา (การเพิ่มประสิทธิภาพสูงสุดต่อโทเค็น) ซึ่งเป็นพื้นฐานสำหรับการเพิ่มประสิทธิภาพโทเค็นที่ระบุไว้

การปรับสภาพเครื่องมือและการค้นหาตัวแทน: Grok-4-Fast ได้รับการฝึกอบรมและประเมินผลในงานที่ต้องอาศัยเครื่องมือต่างๆ (การท่องเว็บ การค้นหา X การรันโค้ด) โมเดลนี้ถูกนำเสนอว่ามีความเชี่ยวชาญ เลือก เมื่อใดจึงควรเรียกเครื่องมือและจะรวบรวมหลักฐานการค้นหาลงในคำตอบอย่างไร

ประสิทธิภาพมาตรฐาน

Iการปรับปรุงใน BrowseComp (44.9% ผ่าน@1 เทียบกับ 43.0% สำหรับ Grok-4), **SimpleQA (95.0% เทียบกับ 94.0%)**และเพิ่มขึ้นอย่างมากในด้านการสืบค้นข้อมูล/ภาษาจีนบางประเภท นอกจากนี้ xAI ยังรายงานอันดับสูงสุดในการค้นหาของ LMArena อีกด้วย grok-4-fast-search ตัวแปร

API Grok-4-fast

รุ่นโมเดลและการตั้งชื่อ

ชื่อสาธารณะที่ประกาศโดย xAI: grok-4-fast-reasoning และ grok-4-fast-non-reasoning. แต่ละรูปแบบรายงานเหมือนกัน โทเค็น 2 ล้าน ข้อจำกัดบริบท แพลตฟอร์มยังคงโฮสต์เวอร์ชันก่อนหน้าต่อไป กร็อก-4 เรือธง (เช่น grok-4-0709 แบบที่ใช้ก่อนหน้านี้)

ข้อจำกัดและข้อควรพิจารณาด้านความปลอดภัย

  • ข้อกังวลด้านความปลอดภัยของเนื้อหา: รายงานจากหน่วยงานสืบสวนระบุว่าตระกูล Grok ของ xAI (และฟีเจอร์ Grok บางส่วน) ได้รับการพัฒนาโดยมีตัวเลือกเนื้อหาที่อนุญาต และเวิร์กโฟลว์ภายในบางส่วนทำให้ผู้ให้คำอธิบายประกอบได้รับเนื้อหาที่สร้างความรบกวนอย่างมาก มีข้อกังวลอย่างชัดเจนเกี่ยวกับความทนทานของการกลั่นกรองและการรายงานเนื้อหาที่ผิดกฎหมายต่อหน่วยงานที่เกี่ยวข้อง ปัญหาด้านความปลอดภัยและการปฏิบัติตามข้อกำหนดเหล่านี้มีความสำคัญอย่างยิ่งเมื่อนำ Grok เวอร์ชันใดๆ ไปใช้ในระบบจริง
  • การตรวจสอบอิสระ: ข้อกล่าวอ้างด้านประสิทธิภาพ/ความประหยัดของ xAI หลายข้อเป็นการรายงานด้วยตนเอง เกณฑ์มาตรฐานอิสระและการทบทวนโดยผู้เชี่ยวชาญยังคงได้รับการเผยแพร่อยู่ โปรดถือว่าข้อกล่าวอ้างด้านประสิทธิภาพต้นทุนเป็นข้อกล่าวอ้างจากผู้จำหน่ายจนกว่าจะมีการจำลองข้อมูลโดยบุคคลที่สาม
  • ความเสี่ยงในการดำเนินงาน: เนื่องจาก Grok-4-Fast มีกรอบสำหรับการเรียกดูแบบตัวแทน ผู้ใช้ควรทราบ ภาพหลอน, ขีดจำกัดความสดใหม่ของข้อมูล (แม้จะมีความสามารถในการเรียกดู) และ ความเป็นส่วนตัว สิ่งที่ต้องพิจารณาเมื่อใช้โมเดลร่วมกับเครื่องมือภายนอกหรือแบบสอบถามเว็บแบบสด

กรณีการใช้งานทั่วไปและที่แนะนำ

  • การค้นหาและดึงข้อมูลปริมาณงานสูง — ตัวแทนการค้นหาที่ต้องการการค้นหาแบบเว็บแบบหลายฮ็อปอย่างรวดเร็ว
  • ผู้ช่วยตัวแทนและบอท — ตัวแทนที่รวมการสืบค้น การดำเนินการโค้ด และการเรียกใช้เครื่องมือแบบอะซิงโครนัส (หากได้รับอนุญาต)
  • การใช้งานการผลิตที่คำนึงถึงต้นทุน — บริการที่ต้องใช้การโทรจำนวนมากและต้องการเศรษฐศาสตร์ของโทเค็นเป็นยูทิลิตี้ที่ดีขึ้นเมื่อเทียบกับโมเดลพื้นฐานที่หนักกว่า
  • การทดลองของนักพัฒนา — การสร้างต้นแบบการไหลแบบหลายโหมดหรือแบบเว็บเสริมที่ต้องอาศัยการค้นหาซ้ำอย่างรวดเร็ว

วิธีการโทร grok-4-fast API จาก CometAPI

grok-code-fast-1 ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:

grok-4-fast-non-reasoningอินพุตโทเค็น: $0.16/M โทเค็น โทเค็นเอาต์พุต: $0.40/ M โทเค็น
grok-4-fast-reasoningอินพุตโทเค็น: $0.16/M โทเค็น โทเค็นเอาต์พุต: $0.40/ M โทเค็น

ขั้นตอนที่ต้องดำเนินการ

  • เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
  • รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง

ใช้วิธีการ

  1. เลือก“grok-4-fast-reasoning” /“grok-4-fast-reasoning ” จุดสิ้นสุดสำหรับส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการและเนื้อหาคำขอสามารถดูได้จากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีบริการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
  2. แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
  3. แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
  4. ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น

CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:

  • URL ฐาน: https://api.cometapi.com/v1/chat/completions
  • ชื่อรุ่น:"grok-4-fast-reasoning” /“grok-4-fast-reasoning "
  • รับรองความถูกต้อง: โทเค็นผู้ถือผ่าน Authorization: Bearer YOUR_CometAPI_API_KEY ส่วนหัว
  • ชนิดของเนื้อหา: application/json .

การรวม API และตัวอย่าง

ตัวอย่าง Python สำหรับ เสร็จสิ้นการแชท โทรผ่าน CometAPI:

pythonimport openai

openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"

messages = [
    {"role": "system",  "content": "You are a helpful assistant."},
    {"role": "user",    "content": "Summarize grok-4-fast's main features."}
]

response = openai.ChatCompletion.create(
    model="grok-4-fast-reasoning",
    messages=messages,
    temperature=0.7,
    max_tokens=500
)

print(response.choices.message)

ดูเพิ่มเติม กร็อก 4

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%