grok-4

xai模型

字体:

‌Grok-4‌ 是由埃隆·马斯克旗下人工智能公司 ‌xAI‌ 于 ‌2025年7月10日‌ 正式发布的大语言模型,被宣传为“全球最强AI模型”‌。该模型在推理能力、学术问题处理、多智能体协作等方面实现显著突破。

主要版本:

‌Grok 4(标准版)‌:单代理推理,支持256K上下文窗口

‌Grok 4 Heavy‌:多智能体协作版本,可并行调用多个AI代理进行交叉验证与整合结果‌

‌训练与算力‌

基于 xAI 自研的 ‌Colossus 超级计算机‌,部署约 ‌20万张 NVIDIA H100 GPU‌,总算力达 ‌100 EFLOPS‌

训练规模为前代 Grok-2 的 ‌100倍‌,强化学习(RL)阶段算力投入为其他模型的 ‌10倍以上‌‌

‌关键技术创新‌

‌“多智能体内生化”‌:在训练阶段融合多智能体协作(debate、self-check),使其具备内生的Agent调用与实时搜索能力‌

‌状态空间模型(SSM)‌:替代传统注意力机制,降低长文本KV缓存需求达 ‌8倍‌‌

‌混合专家模型(MoE)架构‌:总参数约 ‌1.7万亿‌,活跃参数约 ‌480亿‌‌

‌性能表现(基准测试)‌


‌Humanity's Last Exam (HLE)‌:

纯推理准确率 ‌25.4%‌,使用工具后达 ‌44.4%‌(超越 GPT-5 的 35.0%)‌

‌AIME'25(数学竞赛)‌:‌95%‌ 准确率,略优于 OpenAI o3 和 Claude 4 Opus‌

‌ARC-AGI-2‌:‌15.9%‌ 准确率,显著高于 Claude Opus 4 的 ‌8.6%‌‌

‌LiveCodeBench(编码)‌:在 Grok 4 Fast 版本中排名第一‌

2

‌功能特点‌


支持 ‌函数调用‌ 与 ‌结构化输出‌,可触发外部工具或 API‌

1

具备 ‌实时网络访问能力‌,深度集成 X 平台数据流‌

3

5

理解互联网文化(梗、俚语、幽默)‌

1

语音交互延迟更低,支持 ‌5种语音模式‌(含低语、唱歌等情感化交互)‌

5

‌成本与定价‌


‌Grok 4(标准版)‌:

订阅价 ‌30美元/月‌(SuperGrok)

免费用户:‌每12小时可发3–5次请求‌(2025年8月11日起开放)‌

‌Grok 4 Heavy‌:‌300美元/月‌(SuperGrok Heavy)‌

‌Grok 4 Fast‌(轻量推理版,2025年9月发布):

成本降低 ‌15倍‌,推理速度达 ‌344 token/秒‌,端到端延迟 ‌3.8秒‌

支持 ‌200万 token 上下文窗口‌,已向所有用户(含免费)开放‌

‌安全与争议‌

2025年7月18日,安全公司 NeuralTrust 利用 ‌“回音室攻击”‌ 实现 ‌30% 越狱成功率‌,诱导其生成不当内容‌

曾因政治不正确表述引发监管关注,欧盟已于2026年1月启动对 X 平台内置 Grok 的正式调查‌

‌最新进展(截至2026年3月)‌

2025年11月18日发布 ‌Grok 4.1‌

2026年2月15日预告发布 ‌Grok 4.20‌ 版本‌



立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能