MiniMax-M2.5-lightning

Minmax模型

字体：大中小

MiniMax-M2.5-lightning是MiniMax于2026年2月推出的M2.5系列中的‌极速推理版本‌，专为高吞吐、低延迟的智能体（Agent）应用场景设计，在保持与标准版M2.5完全一致能力的前提下，将输出速度提升至‌100 TPS以上‌，是主流模型的2倍左右，真正实现“性能无损、速度翻倍”。

一、核心性能：速度与成本的双重突破

‌极致输出速度‌

支持 ‌100+ tokens/秒‌ 的稳定输出速度，远超GPT-4o（约30 TPS）、Claude 3.5（约50 TPS）等主流模型。
在编写300行代码的任务中仅需‌3秒‌即可完成，显著提升开发与交互效率。

‌推理成本极低‌

输入价格：‌$0.30 / 百万tokens‌
输出价格：‌$2.40 / 百万tokens‌
按每秒输出100 tokens计算，连续运行一小时成本约‌1美元‌；若降至50 tokens/秒，成本进一步压缩至‌0.3美元‌。
换算下来，‌1万美元预算可支撑4个Agent全年无休运行‌，彻底打破智能体规模化部署的经济瓶颈。

‌能力完全对齐M2.5标准版‌

编程、工具调用、办公自动化等核心能力与标准版完全一致，无任何功能或精度折损。

二、关键技术指标与能力表现

三、核心能力表现（与标准M2.5一致）

‌编程能力：SOTA级表现‌

‌SWE-Bench Verified‌：‌80.2%‌，接近GPT-5水平，超越Claude Opus 4.6（79.6%）。
‌Multi-SWE-Bench‌：‌51.3%‌，在多语言编程任务中位列全球第一。
具备“‌原生Spec能力‌”：在编码前主动拆解系统架构、功能模块与UI设计，实现从0到1的完整规划。

‌智能体任务效率提升‌

‌BrowseComp‌（智能体浏览任务）得分 ‌76.3%‌，较M2.1提升约20%。
工具调用与搜索任务中，‌轮次消耗减少20%‌，决策路径更精简。
端到端任务执行时间从M2.1的31.3分钟缩短至‌22.8分钟‌，提速37%。

‌办公场景专业交付‌

‌Word研报‌（结构规范、数据准确）
‌PPT方案‌（逻辑清晰、视觉合理）
‌Excel财务模型‌（公式严谨、可复用）
可输出符合行业标准的：
在内部评测框架 ‌GDPval-MM‌ 中，对主流模型取得 ‌59.0%‌ 的平均胜率。

四、技术架构与训练方法

‌MoE混合专家架构‌：总参数量229B，推理时仅激活约10B参数，实现高效稀疏计算。
‌自研Forge RL框架‌：通过解耦训练引擎与Agent，支持任意Agent脚手架集成，并实现约‌40倍训练加速‌。
‌CISPO优化与过程奖励机制‌：缓解长上下文信用分配问题，将“任务真实耗时”纳入奖励函数，平衡效果与响应速度。

五、部署与生态支持

‌全球开源‌：2026年2月13日宣布开源权重，支持本地化部署。
‌多种接入方式‌：

支持OpenAI兼容接口，可无缝集成至Cursor、Claude Code、vLLM等开发工具。
已接入阿里云百炼、百度智能云、腾讯云等主流平台。

‌社区活跃‌：发布不到一天，全球用户已在MiniMax Agent上构建超‌1万个专家智能体‌，覆盖办公、金融、编程、营销等场景。
‌企业级应用‌：MiniMax内部‌30%‌ 的任务由M2.5系列自主完成，编程场景中‌80%‌ 的新代码由其生成。

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Minmax模型推荐

MiniMax-M2.5-lightning

MiniMax-M2.5-lightning是MiniMax于2026年2月推出的M2.5系列中的‌极速推理版本‌，专为高吞

MiniMax-M2.5-highspeed

MiniMax-M2.5-highspeed是MiniMax公司于2026年2月推出的M2.5系列中的‌极速推理版本‌，在保

minimax-m2.1

MiniMax-M2.1是由MiniMax（稀宇科技）于2025年12月25日发布的多语言编程SOTA模型，系统性提升了

MiniMax-M2.5

MiniMax-M2.5是上海MiniMax公司于2026年2月12日推出的“原生Agent生产级”大语言模型，定位为

MiniMax-M2

MiniMax-M2是MiniMax（稀宇科技）于2025年10月27日发布并开源的一款专为‌高效编码与智能体工

MiniMax-M1

MiniMax-M1是上海AI企业MiniMax（稀宇科技）于2025年6月17日在世界人工智能大会（WAIC）上发布的