MiniMax M3大模型开源对标旗舰:MSA架构1M上下文深度评测
摘要
MiniMax发布M3大模型,首创MSA架构并支持1M超长上下文,全面开源。在SWE-BenchPro和多模态评测
2026年6月1日,MiniMax正式发布了新一代前沿大模型M3。这不仅是国内首个集顶尖编程能力、1M超长上下文和原生多模态能力于一体的开源大模型,更是直接对标海外闭源旗舰的一次硬核出击。
先几个核心判断放在前面:M3在训练数据上下了狠功夫——原生百万亿量级交错数据的混合训练,让语义空间高度融合。效果也很直接:在SWE-Bench Pro等软件工程以及多模态权威评测中,M3的成绩直接超越了GPT-5.5和Gemini 3.1 Pro,这可是实打实的硬指标。

值得注意的是,M3在极限任务实测中展现出的长线程自主规划能力,才是它的真正杀手锏。举个具体例子:它能耗时12小时自主复现一篇ICLR顶级论文的实验过程,这在以往几乎难以想象。更夸张的是,在没有参考代码的情况下,它连续运行了24小时,调用工具近两千次,硬生生把Hopper架构上的FP8矩阵乘硬件利用率从7.6%拉到了71.3%。这意味着什么?相当于它在无人干预的情况下,自主完成了“发现问题-调度资源-优化迭代”的完整闭环。在开放式PostTrainBench中,它还自主调度模型完成了从数据到训练再到迭代的全流程操作,这绝对可以说是“自我进化”的雏形了。
伴随M3一同发布的,还有专为长程复杂协作设计的MiniMax Code智能体产品,以及定价策略极具竞争力的Token Plan和API服务。更重要的是,官方承诺在10天内开源模型权重——这在国内大模型圈里,诚意算是相当到位了。
说到底,MiniMax M3的推出,不仅仅是在技术参数上的一次跃升。它打破了前沿多模态与长上下文技术长期被海外闭源模型垄断的格局,更重要的是,全要素开源的做法正在重塑国内开发者生态的性价比边界。这对于整个行业生态来说,都是一个值得持续跟踪的信号。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。