grok-4.1

xai模型

字体:

Grok 4.1是由埃隆·马斯克旗下的人工智能公司‌xAI‌于‌2025年11月18日‌正式发布的大语言模型,是Grok系列的一次重大升级。该模型的核心定位已从单纯的聊天机器人转向能够执行复杂任务的‌智能体(Agent)‌,在推理能力、情感智能、创造力和事实准确性方面实现了全面跃升。 

核心特性与能力 ‌

双模式架构‌:

Grok 4.1提供两种运行模式,以适应不同场景需求: 

Grok 4.1 Thinking(思考模式)‌:在回答前进行深度推理,追求更精准、更全面的输出,在LMArena Text Arena排行榜上以‌1483 Elo‌分位列全球第一,显著领先于其他模型。 ‌

Grok 4.1(非推理模式/快速模式)‌:不使用思考Token,可即时响应,速度更快,在同一排行榜上以‌1465 Elo‌分排名第二。值得注意的是,其非推理模式的性能甚至超越了其他模型的“全推理模式”。 ‌

卓越的情感智能(EQ)‌:Grok 4.1在EQ-Bench3情绪智能测试中表现突出,两种模式包揽前两名。它能更敏锐地感知用户情绪,提供更具同理心、更富有人情味的回应。例如,当用户表达“想念我的猫,心都碎了”时,其回应会更细致、更真实,而非模板化安慰‌。  ‌

创意写作能力显著提升‌:在Creative Writing v3基准测试中,Grok 4.1 Thinking以1722分排名第二,相比前代模型提升了约600分,文学表达与戏剧张力显著增强‌ 。  ‌

大幅降低事实幻觉‌:通过优化后训练阶段,Grok 4.1的信息检索幻觉率从旧版的12.09%‌下降至4.22%‌,减少了近三倍,使其在提供事实性信息时更加可靠‌ 。  ‌

强大的工具调用与任务执行‌:新增了对多模态输入的系统级响应机制,支持API集成与跨平台操作指令解析,能够动态调用工具链,完成包含权限验证、异常回滚的复杂工作流‌ 。 

 性能与发布 ‌性能验证‌:在为期两周的静默灰度发布期间(2025年11月1日至14日),xAI通过真实流量进行盲测,结果显示用户对Grok 4.1的偏好概率高达‌64.78%‌‌ 1 2。 ‌

免费开放‌:与许多竞争对手不同,xAI将Grok 4.1‌面向所有用户免费开放‌,可通过其官网(grok.com)、X平台(原Twitter)以及iOS和Android应用程序直接使用‌ 。 ‌

集成与生态‌:Grok 4.1已集成至特斯拉车辆中,提升了车机语音助手的交互智能性。同时,微软已宣布将Grok 4.1 Fast模型引入其Copilot Studio平台‌ xAI沿用了Grok 4的大规模强化学习基础设施,并开发了新方法,利用‌前沿的智能推理模型作为奖励模型‌,实现了对模型风格、个性和实用性的大规模自主评估与迭代,这是其性能飞跃的关键‌ 。 

 目前,Grok 4.1已进入beta阶段,而xAI创始人埃隆·马斯克已于2026年2月透露,下一代模型Grok 4.2即将发布‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能