MiniMax-M2.7

智谱模型

字体:

MiniMax-M2.7是MiniMax于2026年3月18日发布的旗舰大语言模型,主打模型自我进化工程/办公生产力,是业内首个深度参与自身训练迭代的大模型。

一、核心基础信息

  • 发布时间:2026-03-18

  • 模型架构:MoE(混合专家)

  • 参数规模:总参数230B,激活参数约100B

  • 上下文窗口:200K tokens

  • 开源状态:闭源,通过API与Agent产品开放

二、核心创新:模型自我进化

M2.7最大突破是自主参与训练迭代,构建Agent Harness体系,可自行完成:

  • 设计强化学习流程、构建数十个复杂Skills

  • 分析日志、排查Bug、运行评测、优化参数

  • 连续100+轮自主迭代,零人工干预,性能提升约30%

  • 部分研发场景可承担30%–50%工作量

三、核心能力与评测表现

1. 软件工程(最强项)

  • SWE-bench Pro:56.22%,接近Claude Opus 4.6、GPT-5.3-Codex水平

  • VIBE-Pro(端到端项目):55.6%

  • Terminal Bench 2(复杂系统理解):57.0%

  • 线上故障修复:部分场景可缩短至3分钟内

  • 能力覆盖:全栈开发、系统调试、代码安全、生产级故障分析

2. 多智能体(Agent)能力

  • 原生支持Agent Teams多角色协作

  • Toolathon(工具调用):46.3%,全球第一梯队

  • 复杂指令遵循率:97%(40个2000+token长技能)

  • OpenClaw适配:MM-Claw 62.7%,接近Sonnet 4.6

3. 办公与专业生产力

  • GDPval-AA(办公能力):ELO 1495,开源模型最高

  • Office处理:Word/Excel/PPT高保真多轮编辑,适配专业办公

  • 综合评测:XSCT Arena 84.5,较M2.5提升约1.7分

四、典型应用场景

  • 研发工程:端到端项目交付、Bug排查、系统运维、代码安全

  • 企业办公:文档自动化、报告生成、数据建模、演示制作

  • 多Agent系统:团队式AI协作、复杂流程自动化、决策辅助

  • 垂直行业:金融研报分析、专业内容生成、沉浸式交互(OpenRoom)

五、与前代(M2.5)对比

  • 优势:自我进化、工程能力、Agent协作、办公生产力显著提升

  • 不足:极限推理与数学稳定性略有下降


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能