MiniMax-M2.7-highspeed

智谱模型

字体：大中小

对话

MiniMax-M2.7-highspeed是M2.7的高速推理版本，核心定位是同质量、更快速度、更高吞吐，面向实时交互、高并发、低延迟场景。

一、基础定位与核心定位

发布时间：2026-03-18（与M2.7标准版同步）
定位：M2.7标准版的速度优化版，能力与质量完全一致，仅推理速度与吞吐大幅提升
架构：同M2.7标准版（MoE，总参230B，激活约100B，200K上下文）
开源状态：闭源，仅通过API开放

二、速度与性能（对比标准版）

生成速度：标准版约85–93 tok/s；Highspeed >120 tok/s，提升约40%+
首Token延迟：标准版0.5–1s；Highspeed <0.3s，延迟降低约50%
吞吐TPS：标准版40–60；Highspeed 80–100，吞吐翻倍
能力一致性：SWE-bench Pro、VIBE-Pro、GDPval-AA、Agent能力等所有评测指标与M2.7标准版完全相同

三、核心能力（同M2.7标准版）

自我进化：自主参与训练迭代、Agent Harness、100+轮零人工优化
软件工程：SWE-bench Pro 56.22%、VIBE-Pro 55.6%、Terminal Bench 2 57.0%
多Agent协作：Toolathon 46.3%、复杂指令遵循率97%
办公生产力：GDPval-AA ELO 1495、Office高保真编辑

四、适用场景

实时交互：对话机器人、智能客服、实时代码补全/调试
高并发：API服务、批量内容生成、企业级多用户接入
低延迟：线上故障快速排查、实时决策、即时办公辅助
不适合：极限数学/竞赛推理（M2.7系列本身在该场景略弱于M2.5）

五、与M2.5-highspeed对比

优势：自我进化、工程/办公/Agent能力全面领先、上下文200K（M2.5为128K）
速度：M2.7-highspeed略快于M2.5-highspeed（>120 vs >100 tok/s）

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

智谱模型推荐

MiniMax-M2.7-highspeed

MiniMax-M2.7-highspeed是M2.7的高速推理版本，核心定位是同质量、更快速度、更高吞吐，面向实

MiniMax-M2.7

MiniMax-M2.7是MiniMax于2026年3月18日发布的旗舰大语言模型，主打模型自我进化与工程/办公生

glm-5-turbo

‌GLM-5-Turbo‌是智谱（ZhipuAI）于‌2026年3月16日‌正式发布的面向‌OpenClaw“龙虾”场景

glm-5

GLM-5‌是由智谱AI于2026年2月11日正式发布的新一代开源基础大模型，聚焦于推动编程范式从“

glm-4.7

GLM-4.7‌是由智谱AI于‌2025年12月23日‌发布并开源的大语言模型，是GLM-4系列的重要升级，定

glm-4.6

‌GLM-4.6‌是由智谱AI于‌2025年9月30日‌发布并开源的新一代通用型大模型，定位为高性能、

glm-4.5-flash

‌GLM-4.5-Flash‌是智谱AI于2025年7月发布的‌GLM-4.5系列中的免费轻量级模型‌，专为高效率

glm-4.5-air

GLM-4.5‌是由智谱AI于2025年7月28日发布的面向智能体（Agent）应用的基础大模型，旨在统一推理