MiniMax-M2.7-highspeed
智谱模型
MiniMax-M2.7-highspeed是M2.7的高速推理版本,核心定位是同质量、更快速度、更高吞吐,面向实时交互、高并发、低延迟场景。
一、基础定位与核心定位
发布时间:2026-03-18(与M2.7标准版同步)
定位:M2.7标准版的速度优化版,能力与质量完全一致,仅推理速度与吞吐大幅提升
架构:同M2.7标准版(MoE,总参230B,激活约100B,200K上下文)
开源状态:闭源,仅通过API开放
二、速度与性能(对比标准版)
生成速度:标准版约85–93 tok/s;Highspeed >120 tok/s,提升约40%+
首Token延迟:标准版0.5–1s;Highspeed <0.3s,延迟降低约50%
吞吐TPS:标准版40–60;Highspeed 80–100,吞吐翻倍
能力一致性:SWE-bench Pro、VIBE-Pro、GDPval-AA、Agent能力等所有评测指标与M2.7标准版完全相同
三、核心能力(同M2.7标准版)
自我进化:自主参与训练迭代、Agent Harness、100+轮零人工优化
软件工程:SWE-bench Pro 56.22%、VIBE-Pro 55.6%、Terminal Bench 2 57.0%
多Agent协作:Toolathon 46.3%、复杂指令遵循率97%
办公生产力:GDPval-AA ELO 1495、Office高保真编辑
四、适用场景
实时交互:对话机器人、智能客服、实时代码补全/调试
高并发:API服务、批量内容生成、企业级多用户接入
低延迟:线上故障快速排查、实时决策、即时办公辅助
不适合:极限数学/竞赛推理(M2.7系列本身在该场景略弱于M2.5)
五、与M2.5-highspeed对比
优势:自我进化、工程/办公/Agent能力全面领先、上下文200K(M2.5为128K)
速度:M2.7-highspeed略快于M2.5-highspeed(>120 vs >100 tok/s)
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
智谱模型推荐
MiniMax-M2.7-highspeed
MiniMax-M2.7-highspeed是M2.7的高速推理版本,核心定位是同质量、更快速度、更高吞吐,面向实
MiniMax-M2.7
MiniMax-M2.7是MiniMax于2026年3月18日发布的旗舰大语言模型,主打模型自我进化与工程/办公生
glm-5-turbo
GLM-5-Turbo是智谱(ZhipuAI)于2026年3月16日正式发布的面向OpenClaw“龙虾”场景
glm-5
GLM-5是由智谱AI于2026年2月11日正式发布的新一代开源基础大模型,聚焦于推动编程范式从“
glm-4.7
GLM-4.7是由智谱AI于2025年12月23日发布并开源的大语言模型,是GLM-4系列的重要升级,定
glm-4.6
GLM-4.6是由智谱AI于2025年9月30日发布并开源的新一代通用型大模型,定位为高性能、
glm-4.5-flash
GLM-4.5-Flash是智谱AI于2025年7月发布的GLM-4.5系列中的免费轻量级模型,专为高效率
glm-4.5-air
GLM-4.5是由智谱AI于2025年7月28日发布的面向智能体(Agent)应用的基础大模型,旨在统一推理