热点资讯 M3系列AI模型深度

MiniMax M3系列AI模型深度评测：性能对比与核心优势解析

2026-05-27

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

MiniMax将推出M3系列AI模型。此前M2 x系列采用混合专家架构，以稀疏激活降低计算成本，支持

5月27日，MiniMax通过其官方X平台账号正式预告了M3系列模型的发布。

官方预告 MiniMax M3 系列 AI 模型即将登场

该预告同步引述了一篇发布于arXiv预印本平台的论文《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。这篇论文系统性地阐释了已发布的M2.x系列模型的技术架构与设计哲学。

论文揭示了M2.x系列的核心技术指标。模型总参数量为2299亿，但凭借其创新的稀疏激活机制，每个词元（token）实际调用的参数仅为98亿。这一“小激活，大智能”的架构旨在以显著降低的计算开销，实现更优的实际性能表现。模型支持192K的上下文长度，其预训练数据规模达到了29.2万亿词元。

在模型结构层面，M2系列基于62层的解码器式Transformer构建。其关键创新在于集成了256个细粒度专家（Expert），并为每个输入词元动态路由，仅激活其中8个。这种混合专家模型（MoE）设计是达成高效稀疏计算的基础。

论文进一步披露了其在训练系统上的突破。MiniMax团队开发了名为“Forge”的强化学习系统，专为智能体（Agent）优化而设计。Forge系统能够统一调度白盒与黑盒智能体，通过将训练、推理与智能体逻辑解耦，结合窗口化FIFO调度、前缀树合并及专用推理加速技术，大幅降低了长序列任务（long-horizon tasks）的训练成本。

在M2.7版本中，模型展现出“自我进化”能力的早期雏形。根据论文描述，该模型已能自主诊断训练失败原因、解析系统日志并修改相关脚手架代码，从而在内部任务上实现多达100轮的自主迭代优化。

实际应用数据显示，这套自我进化机制已能处理团队30%至50%的日常迭代工作。在一项内部编程脚手架优化任务中，它带来了30%的性能提升。这表明模型正逐步融入其自身开发与优化的技术闭环，虽然处于初级阶段，但技术路径已清晰可见。

相关论文：《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。

来源：互联网

上一篇 测试岗裁员潮下，高效能工程师的自动化系统搭建指南 下一篇 AI智能体通俗解读：它如何像私人助理一样改变生活？

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

MiniMax M3系列AI模型深度评测：性能对比与核心优势解析

摘要

相关文章推荐