grok-4
xai模型
Grok-4 是由埃隆·马斯克旗下人工智能公司 xAI 于 2025年7月10日 正式发布的大语言模型,被宣传为“全球最强AI模型”。该模型在推理能力、学术问题处理、多智能体协作等方面实现显著突破。
主要版本:
Grok 4(标准版):单代理推理,支持256K上下文窗口
Grok 4 Heavy:多智能体协作版本,可并行调用多个AI代理进行交叉验证与整合结果
训练与算力
基于 xAI 自研的 Colossus 超级计算机,部署约 20万张 NVIDIA H100 GPU,总算力达 100 EFLOPS
训练规模为前代 Grok-2 的 100倍,强化学习(RL)阶段算力投入为其他模型的 10倍以上
关键技术创新
“多智能体内生化”:在训练阶段融合多智能体协作(debate、self-check),使其具备内生的Agent调用与实时搜索能力
状态空间模型(SSM):替代传统注意力机制,降低长文本KV缓存需求达 8倍
混合专家模型(MoE)架构:总参数约 1.7万亿,活跃参数约 480亿
性能表现(基准测试)
Humanity's Last Exam (HLE):
纯推理准确率 25.4%,使用工具后达 44.4%(超越 GPT-5 的 35.0%)
AIME'25(数学竞赛):95% 准确率,略优于 OpenAI o3 和 Claude 4 Opus
ARC-AGI-2:15.9% 准确率,显著高于 Claude Opus 4 的 8.6%
LiveCodeBench(编码):在 Grok 4 Fast 版本中排名第一
2
功能特点
支持 函数调用 与 结构化输出,可触发外部工具或 API
1
具备 实时网络访问能力,深度集成 X 平台数据流
3
5
理解互联网文化(梗、俚语、幽默)
1
语音交互延迟更低,支持 5种语音模式(含低语、唱歌等情感化交互)
5
成本与定价
Grok 4(标准版):
订阅价 30美元/月(SuperGrok)
免费用户:每12小时可发3–5次请求(2025年8月11日起开放)
Grok 4 Heavy:300美元/月(SuperGrok Heavy)
Grok 4 Fast(轻量推理版,2025年9月发布):
成本降低 15倍,推理速度达 344 token/秒,端到端延迟 3.8秒
支持 200万 token 上下文窗口,已向所有用户(含免费)开放
安全与争议
2025年7月18日,安全公司 NeuralTrust 利用 “回音室攻击” 实现 30% 越狱成功率,诱导其生成不当内容
曾因政治不正确表述引发监管关注,欧盟已于2026年1月启动对 X 平台内置 Grok 的正式调查
最新进展(截至2026年3月)
2025年11月18日发布 Grok 4.1
2026年2月15日预告发布 Grok 4.20 版本
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能