模型定价企业
500+ AI 模型 API,一次搞定,就在 CometAPI
模型 API
开发者
快速入门文档API 仪表板
公司
关于我们企业
资源
AI 模型博客更新日志支持
服务条款隐私政策
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

输入:$0.16/M
输出:$0.4/M
上下文:2M
最大输出:30K
Grok 4 Fast 是由 xAI 推出的全新人工智能模型,将推理与非推理能力整合到单一架构中。该模型拥有 200 万 token 的上下文窗口,面向搜索与编程等高吞吐量应用而设计。该模型提供两个版本:Grok-4-Fast-Reasoning 和 Grok-4-Fast-Non-Reasoning,分别针对不同任务进行优化。
新
商用
Playground
概览
功能亮点
定价
API
版本

关键特性(快速列表)

  • 两种模型变体: grok-4-fast-reasoning 和 grok-4-fast-non-reasoning(可在深度与速度间调优)。
  • 超大上下文窗口: 高达 2,000,000 tokens,支持超长文档/多小时转录/多文档工作流。
  • Token 效率/成本侧重: xAI 报告较 Grok-4 平均少约 40% 的 thinking tokens,并宣称在达到相同基准表现的成本上约减少 98%(基于 xAI 报告的指标)。
  • 原生工具/浏览集成: 通过端到端工具使用强化学习训练,覆盖 Web/X 浏览、代码执行与代理式搜索行为。
  • 多模态与函数调用: 支持图像与结构化输出;API 支持函数调用与结构化响应格式。

技术细节

统一推理架构: Grok-4-Fast 使用单一模型权重底座,可通过系统提示或变体选择将其引导至 reasoning(长链式思维)或 non-reasoning(快速回复)行为,而非发布两套完全独立的骨干模型。这降低了混合工作负载的切换延迟与 token 成本。

面向智能密度的强化学习: xAI 报告采用大规模强化学习,聚焦智能密度(最大化每个 token 的性能),这是其所述 token 效率提升的基础。

工具条件化与代理式搜索: Grok-4-Fast 在需要调用工具(网页浏览、X 搜索、代码执行)的任务上进行训练与评估。该模型被呈现为擅长选择何时调用工具以及如何将浏览证据串联进答案。

基准表现

I在 BrowseComp 上的改进(44.9% pass@1 对比 Grok-4 的 43.0%)、SimpleQA(95.0% 对比 94.0%),以及在部分中文浏览/搜索场景中的显著提升。xAI 还报告其 grok-4-fast-search 变体在 LMArena 的 Search Arena 中位列前茅。

典型与推荐用例

  • 高吞吐搜索与检索——需要快速多跳网页推理的搜索代理。
  • 代理式助手与机器人——在允许的情况下,结合浏览、代码执行与异步工具调用的代理。
  • 成本敏感的生产部署——需要大量调用、期望相较更重基座模型具有更优 token-效用经济性的服务。
  • 开发者试验——原型设计依赖快速、重复查询的多模态或网页增强流程。
  • 如何访问 Grok 4 fast API

Step 1: Sign Up for API Key

登录 cometapi.com。若您尚未成为我们的用户,请先注册。登录您的CometAPI 控制台。获取接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取 token key:sk-xxxxx 并提交。

Step 2: Send Requests to Grok 4 fast API

选择“\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\”端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获得。我们的网站也提供 Apifox 测试以便您使用。将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。base url is Chat format(https://api.cometapi.com/v1/chat/completions)。

将您的问题或请求插入 content 字段——模型将响应该内容。处理 API 响应以获取生成的答案。

Step 3: Retrieve and Verify Results

处理 API 响应以获取生成的答案。处理完成后,API 会返回任务状态与输出数据。

Grok 4 Fast 的功能

了解 Grok 4 Fast 的核心能力,帮助提升性能与可用性,并改善整体体验。

Grok 4 Fast 的定价

查看 Grok 4 Fast 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
Comet 价格 (USD / M Tokens)官方定价 (USD / M Tokens)折扣
输入:$0.16/M
输出:$0.4/M
输入:$0.2/M
输出:$0.5/M
-20%

Grok 4 Fast 的示例代码与 API

获取完整示例代码与 API 资源,简化 Grok 4 Fast 的集成流程,我们提供逐步指导,助你发挥模型潜能。
POST
/v1/chat/completions

Grok 4 Fast 的版本

Grok 4 Fast 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。

xAI 公布的公开名称为:grok-4-fast-reasoning 和 grok-4-fast-non-reasoning。两个变体均报告相同的 200 万 token 上下文限制。该平台还继续提供此前的 Grok-4 旗舰模型(例如,先前使用的 grok-4-0709 变体)。

更多模型

C

Claude Opus 4.7

输入:$3/M
输出:$15/M
用于智能体和编程的最智能模型
A

Claude Sonnet 4.6

输入:$2.4/M
输出:$12/M
Claude Sonnet 4.6 是迄今为止我们最强大的 Sonnet 模型。它对模型在编码、计算机使用、长上下文推理、智能体规划、知识工作和设计等方面的能力进行了全面升级。Sonnet 4.6 还在 beta 阶段提供 1M token 上下文窗口。
O

GPT-5.4 nano

输入:$0.16/M
输出:$1/M
GPT-5.4 nano 专为速度和成本最为关键的任务而设计,例如分类、数据提取、排序以及子智能体。
O

GPT-5.4 mini

输入:$0.6/M
输出:$3.6/M
GPT-5.4 mini 将 GPT-5.4 的优势融入到一款更快速、更高效、专为大规模工作负载设计的模型中。
X

Grok 4.20

输入:$1.6/M
输出:$4.8/M
Grok 4.20 版本引入了多智能体架构(多个专业化智能体的实时协同)、扩展的上下文模式,以及在指令遵循、幻觉减少和结构化/工具化输出方面的针对性改进。
Q

Qwen3.6-Plus

输入:$0.32/M
输出:$1.92/M
Qwen 3.6-Plus 现已发布,具备更强的代码开发能力,并在多模态识别与推理方面效率更高,使 Vibe Coding 体验更佳。

相关博客

如何使用 z-image 创建 NSFW 内容?你需要的最佳指南
Jan 7, 2026

如何使用 z-image 创建 NSFW 内容?你需要的最佳指南

阿里巴巴通义实验室已正式发布 Z-Image,这是一款拥有 60 亿参数的开源图像生成模型,当前正席卷 AI 社区。于 2025 年末发布的 Z-Image 已在许多本地用户眼中迅速取代了此前的热门之选,如 Flux 和 SDXL。
Grok 4.1 快速 API
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 快速 API

Grok 4.1 Fast 是 xAI 面向生产环境的大模型,针对智能体式工具调用、长上下文工作流和低延迟推理进行了优化。它是一个多模态的双变体系列,旨在运行能够搜索、执行代码、调用服务,并在超大上下文(最多 200 万 tokens)中进行推理的自主智能体。