MiniMax M2.7
MiniMax M2.7 是由 MiniMax(上海)开发的推理型大语言模型,于 2026 年 3 月 18 日发布。该模型采用 Sparse Mixture-of-Experts(MoE)架构,总参数量为 2300 亿,每个 token 激活约 100 亿参数,在较低单 token 成本下提供了较强的编程与推理能力。M2.7 同时引入了自进化能力、更低的幻觉率,以及原生多 Agent 协作支持。
核心特性
- 高性价比推理能力:在智能表现上可与 GLM-5 和 Kimi K2.5 对标,但运行成本约为其三分之一,同时在等效任务下所需输出 token 减少约 20%。
- 较低幻觉率:在 AA-Omniscience Index 上的幻觉率为 34%,低于 Claude Sonnet 4.6 和 Gemini 3.1 Pro Preview。
- 多 Agent 协作:原生支持多 Agent 编排和复杂技能协同,包括运行时动态工具发现与调用。
- 自进化能力:可自主完成约 30%-50% 的强化学习研究工作流,体现出早期的模型自我改进能力。
适用场景
- 自主编码与调试:在 SWE-Pro 和 Terminal-Bench 2 上表现较强,适合实时调试、根因分析和多文件代码生成。
- 成本敏感型 Agent 工作流:适合高频、大规模的 Agent 调用场景,尤其是在需要控制单 token 成本时。
- 文档与报告生成:可处理 Word、Excel、PowerPoint 等整套文档生成任务,并覆盖财务建模等工作流。
能力与限制
| 能力维度 | 说明 |
|---|
| 推理能力 | AA Intelligence Index 为 50,截至 2026 年 3 月在 136 个模型中排名第 1,具备较强的系统级推理与链路分析能力 |
| 编程能力 | SWE-Pro 56.2%,SWE-bench Verified 78%,Terminal-Bench 2 为 57.0%,PinchBench 86.2% |
| 多模态能力 | 仅支持文本,不支持图像、音频或视频输入 |
| 响应速度 | 约 52.7 tokens/秒,略低于同类模型 54.9 tokens/秒的中位数;TTFT 为 2.05 秒 |
| 上下文窗口 | 204.8K tokens |
| 最大输出 | 131.1K tokens |
| 工具调用 | 支持动态工具搜索、多 Agent 交接以及并行工作流依赖追踪 |
| 多语言能力 | SWE Multilingual 76.5% |
已知限制
- 仅支持文本输入,不具备图像或视频等多模态能力。
- 部分独立基准(例如用于 vibe coding 的 BridgeBench)显示其相较 M2.5 有回退。
- 开放权重采用非商业许可协议发布,商业使用需要单独签署协议。
积分消耗
| 模型名称 | 输入 (Credits/Token) | Cache Write (Credits/Token) | Cache Read (Credits/Token) | 输出 (Credits/Token) | 网页搜索(Credits/次) | 计费说明 |
|---|
| MiniMax M2.7 | 0.30 | 0.375 | 0.06 | 1.20 | - | - |