MiniMax-M2.7-highspeed

智谱模型

字体:

MiniMax-M2.7-highspeed是M2.7的高速推理版本,核心定位是同质量、更快速度、更高吞吐,面向实时交互、高并发、低延迟场景。

一、基础定位与核心定位

  • 发布时间:2026-03-18(与M2.7标准版同步)

  • 定位:M2.7标准版的速度优化版能力与质量完全一致,仅推理速度与吞吐大幅提升

  • 架构:同M2.7标准版(MoE,总参230B,激活约100B,200K上下文)

  • 开源状态:闭源,仅通过API开放

二、速度与性能(对比标准版)

  • 生成速度:标准版约85–93 tok/s;Highspeed >120 tok/s,提升约40%+

  • 首Token延迟:标准版0.5–1s;Highspeed <0.3s,延迟降低约50%

  • 吞吐TPS:标准版40–60;Highspeed 80–100,吞吐翻倍

  • 能力一致性:SWE-bench Pro、VIBE-Pro、GDPval-AA、Agent能力等所有评测指标与M2.7标准版完全相同

三、核心能力(同M2.7标准版)

  • 自我进化:自主参与训练迭代、Agent Harness、100+轮零人工优化

  • 软件工程:SWE-bench Pro 56.22%、VIBE-Pro 55.6%、Terminal Bench 2 57.0%

  • 多Agent协作:Toolathon 46.3%、复杂指令遵循率97%

  • 办公生产力:GDPval-AA ELO 1495、Office高保真编辑

四、适用场景

  • 实时交互:对话机器人、智能客服、实时代码补全/调试

  • 高并发:API服务、批量内容生成、企业级多用户接入

  • 低延迟:线上故障快速排查、实时决策、即时办公辅助

  • 不适合:极限数学/竞赛推理(M2.7系列本身在该场景略弱于M2.5)

五、与M2.5-highspeed对比

  • 优势:自我进化、工程/办公/Agent能力全面领先、上下文200K(M2.5为128K)

  • 速度:M2.7-highspeed略快于M2.5-highspeed(>120 vs >100 tok/s)


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能