跳到主要内容

MiniMax M2.7

概述

MiniMax M2.7 是由 MiniMax（上海）开发的推理型大语言模型，于 2026 年 3 月 18 日发布。该模型采用 Sparse Mixture-of-Experts（MoE）架构，总参数量为 2300 亿，每个 token 激活约 100 亿参数，在较低单 token 成本下提供了较强的编程与推理能力。M2.7 同时引入了自进化能力、更低的幻觉率，以及原生多 Agent 协作支持。

核心特性

高性价比推理能力：在智能表现上可与 GLM-5 和 Kimi K2.5 对标，但运行成本约为其三分之一，同时在等效任务下所需输出 token 减少约 20%。
较低幻觉率：在 AA-Omniscience Index 上的幻觉率为 34%，低于 Claude Sonnet 4.6 和 Gemini 3.1 Pro Preview。
多 Agent 协作：原生支持多 Agent 编排和复杂技能协同，包括运行时动态工具发现与调用。
自进化能力：可自主完成约 30%-50% 的强化学习研究工作流，体现出早期的模型自我改进能力。

适用场景

自主编码与调试：在 SWE-Pro 和 Terminal-Bench 2 上表现较强，适合实时调试、根因分析和多文件代码生成。
成本敏感型 Agent 工作流：适合高频、大规模的 Agent 调用场景，尤其是在需要控制单 token 成本时。
文档与报告生成：可处理 Word、Excel、PowerPoint 等整套文档生成任务，并覆盖财务建模等工作流。

能力与限制

能力维度	说明
推理能力	AA Intelligence Index 为 50，截至 2026 年 3 月在 136 个模型中排名第 1，具备较强的系统级推理与链路分析能力
编程能力	SWE-Pro 56.2%，SWE-bench Verified 78%，Terminal-Bench 2 为 57.0%，PinchBench 86.2%
多模态能力	仅支持文本，不支持图像、音频或视频输入
响应速度	约 52.7 tokens/秒，略低于同类模型 54.9 tokens/秒的中位数；TTFT 为 2.05 秒
上下文窗口	204.8K tokens
最大输出	131.1K tokens
工具调用	支持动态工具搜索、多 Agent 交接以及并行工作流依赖追踪
多语言能力	SWE Multilingual 76.5%

已知限制

仅支持文本输入，不具备图像或视频等多模态能力。
部分独立基准（例如用于 vibe coding 的 BridgeBench）显示其相较 M2.5 有回退。
开放权重采用非商业许可协议发布，商业使用需要单独签署协议。

积分消耗

模型名称	输入 (Credits/Token)	Cache Write (Credits/Token)	Cache Read (Credits/Token)	输出 (Credits/Token)	网页搜索（Credits/次）	计费说明
MiniMax M2.7	`0.30`	`0.375`	`0.06`	`1.20`	`-`	-

概述
核心特性
适用场景
能力与限制
- 已知限制
积分消耗