Grok 3 是 xAI 最新的旗舰模型,通过结合海量算力、先进的推理能力、多模态输入以及实时数据访问,在大语言模型(LLM)能力上实现了跃升。Grok 3 于 2025 年 2 月中旬推出,在前代基础上面向开发者、企业与终端用户,覆盖 X Premium+、SuperGrok,并即将通过企业 API 提供。本文将全面探索它的能力,并审视其发布所带来的实践、伦理与竞争层面的影响。
Grok 3 是什么,它与前代有何不同?
扩展的计算能力
Grok 3 在 xAI 的 Colossus 超级集群上训练,配备约 200,000 块 NVIDIA H100 GPU——算力是 Grok 2 的十倍。大规模的硬件投入使其能够处理比早期版本更复杂的推理任务和更大的上下文窗口。
增强的数据集与训练
除标准的网页级文本语料外,Grok 3 的训练数据还包含法律文件和科学论文等专业来源。xAI 称,这一扩展数据集支撑了其在诸如 American Invitational Mathematics Examination (AIME) 和 GPQA 等博士级科学问题基准上的更优表现。
面向低时延需求的 Mini 版本
为满足对时延敏感的应用,xAI 发布了 Grok 3 Mini——一种轻量化变体,以牺牲部分准确性换取更快的响应速度。此分级让开发者可以在峰值性能与最小推理延迟之间进行选择。
Grok 3 提供了哪些新的推理能力?
“Think” 模式用于透明化推理
Grok 3 引入了一个 “Think” 按钮,可展示其推理过程的逐步分解。用户可以观察模型如何串联逻辑步骤,使决策更易解释,并在高风险领域增强信任。
“Big Brain” 模式用于复杂问题求解
对于需要密集算力的任务——如多步数学证明或复杂代码生成——可切换至 “Big Brain” 模式。该模式会动态分配额外 GPU 资源,确保对候选解进行更深入的探索,但推理时间更长。
内置代码解释器
不同于许多需外部工具接入的 LLM,它内置代码解释器。用户可提交 Python、JavaScript 等语言的代码片段,并在聊天界面直接获得执行结果、调试脚本或代码块翻译。
Grok 3 如何整合互联网与搜索功能?
DeepSearch 提供网页规模的上下文
DeepSearch 是一个 AI 代理,可实时遍历互联网与 X(原 Twitter),组装全面且最新的摘要。当查询需求超出其训练截止点时,Grok 3 会调用 DeepSearch 获取并提炼相关来源,有效模糊了搜索引擎与 LLM 之间的界限。
DeeperSearch:增强的召回与推理
2025 年 3 月,xAI 将 DeepSearch 升级为 DeeperSearch,扩展其搜索范围并嵌入更多推理层。该增强使 Grok 3 能够调和互相矛盾的数据点、衡量来源可信度,并在复杂议题上呈现更为细致的观点。
趋势分析与实时情绪
Grok 3 可以分析社交媒体的实时情绪,检测新兴行业趋势,并为营销人员、记者和分析师生成可操作的洞察。通过接入 X 的公共信息流,它能够在事件发生过程中生成关于消费者态度、股市讨论或全球事件报道的报告。
支持哪些多模态功能?
图像理解与编辑
Grok 3 可处理图像输入以回答问题、描述视觉场景,甚至执行基础图像编辑。用户可以上传照片、请求诸如背景移除或风格转换等修改,并获得编辑后的输出,使 Grok 3 成为专用图像编辑工具的轻量替代方案。
即将推出的语音模式用于自然交互
Elon Musk 宣布 Grok 3 很快将支持多模态语音界面。在初次发布后的数周内,用户将能够与 Grok 3 进行语音对话,利用语音转文本与文本转语音管线,在音频与文本渠道间创建无缝的会话代理。
用户与开发者如何使用 Grok 3?
哪些订阅层级支持 Grok 3?
Grok 3 于 2025 年 2 月 17 日首先向 X Premium+ 与 xAI 的 SuperGrok 订阅用户推出,并在短时间窗口内向免费用户开放。Premium+ 现价每月 40 美元(从 22 美元上调),而 SuperGrok 提供对推理模式的优先访问与更高吞吐。
提供哪些 API 选项与定价?
2025 年 4 月,xAI 发布了面向 Grok 3 的公共 API,提供标准版与 Mini 版两种风味,并支持推理能力。定价为每百万输入 tokens 3 美元、每百万生成 tokens 15 美元,相比 OpenAI 的 GPT-4 定价档位具有竞争力。
围绕 Grok 3 的争议与局限有哪些?
对虚假信息与内容审核有哪些担忧?
此前的 Grok 版本因偶发的冒犯性输出与事实错误受到批评。尽管 Grok 3 的推理模式旨在进行自我事实核查,内容审核仍是挑战,尤其当用户启用“未过滤”的成人模式时。
面向成人的模式会带来哪些伦理考量?
2025 年 2 月下旬,xAI 推出多种成人“模式”——“sexual”“uncontrolled”“argumentative”——允许使用露骨语言与主题。尽管官方宣称这些模式具有隐私保护(会话为短暂性),批评者警告若监管不严,它们可能助长有害或剥削性内容。
结论
Grok 3 代表着 xAI 的一个分水岭时刻,将前所未有的算力规模与强大的推理能力、多模态理解和实时数据访问相结合。其双重推理模式与 DeepSearch 代理展现了在透明性与信息新鲜度方面的新方法,而与 X 的集成则为深度嵌入社交媒体语境的会话代理奠定基础。尽管如此,基准争议、价格变动与伦理难题——尤其是未过滤的成人模式——凸显了部署前沿 AI 的复杂性。随着 xAI 准备开源更早期的模型并扩展其多模态版图,更广泛的 AI 社群将密切关注其能否不仅在指标上竞争,更能塑造 AI 驱动交互的未来。
在 CometAPI 中使用 Grok 3
CometAPI 以远低于官方价格的方案帮助你集成 Grok 3 API(模型名称:grok-3;grok-3-latest;`),注册并登录后你的账户将获得 $1!欢迎注册体验 CometAPI。
要开始使用,可在 Playground 中探索该模型的能力,并查阅 API 指南 获取详细说明。请注意,部分开发者在使用该模型前可能需要完成组织验证。
