grok-4-fast-non-reasoning

xai模型

字体:

‌Grok-4-Fast-Non-Reasoning‌ 是 xAI 公司于 2025 年 9 月推出的 Grok-4 Fast 系列中的一个轻量级、高吞吐量模型变体,专为‌低延迟、快速响应‌的场景优化,适用于信息检索、简单问答、系统路由等无需深度推理的任务。 核心特性 ‌统一架构‌:与 Grok-4-Fast-Reasoning 共享同一套模型权重,通过系统提示词(system prompt)动态切换“推理”与“非推理”模式。 ‌

超长上下文‌:支持高达 ‌200 万 token‌ 的上下文窗口,可处理超长文档或复杂对话历史 ‌。 ‌

极致速度‌: 输出速度达 ‌每秒 344 个 token‌,约为 GPT-5 API 的 2.5 倍 ‌ 2 11。 端到端延迟仅 ‌3.8 秒‌,是当前前沿模型中响应最快的之一 ‌ 。 ‌

原生工具调用‌:通过端到端强化学习训练,能自主判断何时调用网页浏览、代码执行等工具 ‌。 ‌

高性价比‌: 相比 Grok-4,‌推理 token 消耗平均减少 40%‌,成本降低约 ‌98%‌ ‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能