MiniMax-M2.5-lightning

Minmax模型

字体:

MiniMax-M2.5-lightning是MiniMax于2026年2月推出的M2.5系列中的‌极速推理版本‌,专为高吞吐、低延迟的智能体(Agent)应用场景设计,在保持与标准版M2.5完全一致能力的前提下,将输出速度提升至‌100 TPS以上‌,是主流模型的2倍左右,真正实现“性能无损、速度翻倍”。


一、核心性能:速度与成本的双重突破

  1. ‌极致输出速度‌

    • 支持 ‌100+ tokens/秒‌ 的稳定输出速度,远超GPT-4o(约30 TPS)、Claude 3.5(约50 TPS)等主流模型。

    • 在编写300行代码的任务中仅需‌3秒‌即可完成,显著提升开发与交互效率。

  2. ‌推理成本极低‌

    • 输入价格:‌$0.30 / 百万tokens‌

    • 输出价格:‌$2.40 / 百万tokens‌

    • 按每秒输出100 tokens计算,连续运行一小时成本约‌1美元‌;若降至50 tokens/秒,成本进一步压缩至‌0.3美元‌。

    • 换算下来,‌1万美元预算可支撑4个Agent全年无休运行‌,彻底打破智能体规模化部署的经济瓶颈。

  3. ‌能力完全对齐M2.5标准版‌

    • 编程、工具调用、办公自动化等核心能力与标准版完全一致,无任何功能或精度折损。


二、关键技术指标与能力表现

MiniMax-M2.5-lightning

三、核心能力表现(与标准M2.5一致)

  1. ‌编程能力:SOTA级表现‌

    • ‌SWE-Bench Verified‌:‌80.2%‌,接近GPT-5水平,超越Claude Opus 4.6(79.6%)。

    • ‌Multi-SWE-Bench‌:‌51.3%‌,在多语言编程任务中位列全球第一。

    • 具备“‌原生Spec能力‌”:在编码前主动拆解系统架构、功能模块与UI设计,实现从0到1的完整规划。

  2. ‌智能体任务效率提升‌

    • ‌BrowseComp‌(智能体浏览任务)得分 ‌76.3%‌,较M2.1提升约20%。

    • 工具调用与搜索任务中,‌轮次消耗减少20%‌,决策路径更精简。

    • 端到端任务执行时间从M2.1的31.3分钟缩短至‌22.8分钟‌,提速37%。

  3. ‌办公场景专业交付‌

    • ‌Word研报‌(结构规范、数据准确)

    • ‌PPT方案‌(逻辑清晰、视觉合理)

    • ‌Excel财务模型‌(公式严谨、可复用)

    • 可输出符合行业标准的:

    • 在内部评测框架 ‌GDPval-MM‌ 中,对主流模型取得 ‌59.0%‌ 的平均胜率。


四、技术架构与训练方法

  • ‌MoE混合专家架构‌:总参数量229B,推理时仅激活约10B参数,实现高效稀疏计算。

  • ‌自研Forge RL框架‌:通过解耦训练引擎与Agent,支持任意Agent脚手架集成,并实现约‌40倍训练加速‌。

  • ‌CISPO优化与过程奖励机制‌:缓解长上下文信用分配问题,将“任务真实耗时”纳入奖励函数,平衡效果与响应速度。


五、部署与生态支持

  • ‌全球开源‌:2026年2月13日宣布开源权重,支持本地化部署。

  • ‌多种接入方式‌:

    • 支持OpenAI兼容接口,可无缝集成至Cursor、Claude Code、vLLM等开发工具。

    • 已接入阿里云百炼、百度智能云、腾讯云等主流平台。

  • ‌社区活跃‌:发布不到一天,全球用户已在MiniMax Agent上构建超‌1万个专家智能体‌,覆盖办公、金融、编程、营销等场景。

  • ‌企业级应用‌:MiniMax内部‌30%‌ 的任务由M2.5系列自主完成,编程场景中‌80%‌ 的新代码由其生成。


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能