跳到主要内容

MiniMax M2.7

概述

MiniMax M2.7 是由 MiniMax(上海)开发的推理型大语言模型,于 2026 年 3 月 18 日发布。该模型采用 Sparse Mixture-of-Experts(MoE)架构,总参数量为 2300 亿,每个 token 激活约 100 亿参数,在较低单 token 成本下提供了较强的编程与推理能力。M2.7 同时引入了自进化能力、更低的幻觉率,以及原生多 Agent 协作支持。

核心特性

  • 高性价比推理能力:在智能表现上可与 GLM-5 和 Kimi K2.5 对标,但运行成本约为其三分之一,同时在等效任务下所需输出 token 减少约 20%。
  • 较低幻觉率:在 AA-Omniscience Index 上的幻觉率为 34%,低于 Claude Sonnet 4.6 和 Gemini 3.1 Pro Preview。
  • 多 Agent 协作:原生支持多 Agent 编排和复杂技能协同,包括运行时动态工具发现与调用。
  • 自进化能力:可自主完成约 30%-50% 的强化学习研究工作流,体现出早期的模型自我改进能力。

适用场景

  • 自主编码与调试:在 SWE-Pro 和 Terminal-Bench 2 上表现较强,适合实时调试、根因分析和多文件代码生成。
  • 成本敏感型 Agent 工作流:适合高频、大规模的 Agent 调用场景,尤其是在需要控制单 token 成本时。
  • 文档与报告生成:可处理 Word、Excel、PowerPoint 等整套文档生成任务,并覆盖财务建模等工作流。

能力与限制

能力维度说明
推理能力AA Intelligence Index 为 50,截至 2026 年 3 月在 136 个模型中排名第 1,具备较强的系统级推理与链路分析能力
编程能力SWE-Pro 56.2%,SWE-bench Verified 78%,Terminal-Bench 2 为 57.0%,PinchBench 86.2%
多模态能力仅支持文本,不支持图像、音频或视频输入
响应速度约 52.7 tokens/秒,略低于同类模型 54.9 tokens/秒的中位数;TTFT 为 2.05 秒
上下文窗口204.8K tokens
最大输出131.1K tokens
工具调用支持动态工具搜索、多 Agent 交接以及并行工作流依赖追踪
多语言能力SWE Multilingual 76.5%

已知限制

  • 仅支持文本输入,不具备图像或视频等多模态能力。
  • 部分独立基准(例如用于 vibe coding 的 BridgeBench)显示其相较 M2.5 有回退。
  • 开放权重采用非商业许可协议发布,商业使用需要单独签署协议。

积分消耗

模型名称输入 (Credits/Token)Cache Write (Credits/Token)Cache Read (Credits/Token)输出 (Credits/Token)网页搜索(Credits/次)计费说明
MiniMax M2.70.300.3750.061.20--