MiniMax-M2.5-lightning
Minmax模型
MiniMax-M2.5-lightning是MiniMax于2026年2月推出的M2.5系列中的极速推理版本,专为高吞吐、低延迟的智能体(Agent)应用场景设计,在保持与标准版M2.5完全一致能力的前提下,将输出速度提升至100 TPS以上,是主流模型的2倍左右,真正实现“性能无损、速度翻倍”。
一、核心性能:速度与成本的双重突破
极致输出速度
支持 100+ tokens/秒 的稳定输出速度,远超GPT-4o(约30 TPS)、Claude 3.5(约50 TPS)等主流模型。
在编写300行代码的任务中仅需3秒即可完成,显著提升开发与交互效率。
推理成本极低
输入价格:$0.30 / 百万tokens
输出价格:$2.40 / 百万tokens
按每秒输出100 tokens计算,连续运行一小时成本约1美元;若降至50 tokens/秒,成本进一步压缩至0.3美元。
换算下来,1万美元预算可支撑4个Agent全年无休运行,彻底打破智能体规模化部署的经济瓶颈。
能力完全对齐M2.5标准版
编程、工具调用、办公自动化等核心能力与标准版完全一致,无任何功能或精度折损。
二、关键技术指标与能力表现
三、核心能力表现(与标准M2.5一致)
编程能力:SOTA级表现
SWE-Bench Verified:80.2%,接近GPT-5水平,超越Claude Opus 4.6(79.6%)。
Multi-SWE-Bench:51.3%,在多语言编程任务中位列全球第一。
具备“原生Spec能力”:在编码前主动拆解系统架构、功能模块与UI设计,实现从0到1的完整规划。
智能体任务效率提升
BrowseComp(智能体浏览任务)得分 76.3%,较M2.1提升约20%。
工具调用与搜索任务中,轮次消耗减少20%,决策路径更精简。
端到端任务执行时间从M2.1的31.3分钟缩短至22.8分钟,提速37%。
办公场景专业交付
Word研报(结构规范、数据准确)
PPT方案(逻辑清晰、视觉合理)
Excel财务模型(公式严谨、可复用)
可输出符合行业标准的:
在内部评测框架 GDPval-MM 中,对主流模型取得 59.0% 的平均胜率。
四、技术架构与训练方法
MoE混合专家架构:总参数量229B,推理时仅激活约10B参数,实现高效稀疏计算。
自研Forge RL框架:通过解耦训练引擎与Agent,支持任意Agent脚手架集成,并实现约40倍训练加速。
CISPO优化与过程奖励机制:缓解长上下文信用分配问题,将“任务真实耗时”纳入奖励函数,平衡效果与响应速度。
五、部署与生态支持
全球开源:2026年2月13日宣布开源权重,支持本地化部署。
多种接入方式:
支持OpenAI兼容接口,可无缝集成至Cursor、Claude Code、vLLM等开发工具。
已接入阿里云百炼、百度智能云、腾讯云等主流平台。
社区活跃:发布不到一天,全球用户已在MiniMax Agent上构建超1万个专家智能体,覆盖办公、金融、编程、营销等场景。
企业级应用:MiniMax内部30% 的任务由M2.5系列自主完成,编程场景中80% 的新代码由其生成。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
Minmax模型推荐
MiniMax-M2.5-lightning
MiniMax-M2.5-lightning是MiniMax于2026年2月推出的M2.5系列中的极速推理版本,专为高吞
MiniMax-M2.5-highspeed
MiniMax-M2.5-highspeed是MiniMax公司于2026年2月推出的M2.5系列中的极速推理版本,在保
minimax-m2.1
MiniMax-M2.1是由MiniMax(稀宇科技)于2025年12月25日发布的多语言编程SOTA模型,系统性提升了
MiniMax-M2.5
MiniMax-M2.5是上海MiniMax公司于2026年2月12日推出的“原生Agent生产级”大语言模型,定位为
MiniMax-M2
MiniMax-M2是MiniMax(稀宇科技)于2025年10月27日发布并开源的一款专为高效编码与智能体工
MiniMax-M1
MiniMax-M1是上海AI企业MiniMax(稀宇科技)于2025年6月17日在世界人工智能大会(WAIC)上发布的
