菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > MiniMax M3系列AI模型深度评测:性能对比与核心优势解析
热点资讯 M3系列AI模型深度

MiniMax M3系列AI模型深度评测:性能对比与核心优势解析

2026-05-27
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

MiniMax将推出M3系列AI模型。此前M2 x系列采用混合专家架构,以稀疏激活降低计算成本,支持

5月27日,MiniMax通过其官方X平台账号正式预告了M3系列模型的发布。

官方预告 MiniMax M3 系列 AI 模型即将登场

该预告同步引述了一篇发布于arXiv预印本平台的论文《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。这篇论文系统性地阐释了已发布的M2.x系列模型的技术架构与设计哲学。

论文揭示了M2.x系列的核心技术指标。模型总参数量为2299亿,但凭借其创新的稀疏激活机制,每个词元(token)实际调用的参数仅为98亿。这一“小激活,大智能”的架构旨在以显著降低的计算开销,实现更优的实际性能表现。模型支持192K的上下文长度,其预训练数据规模达到了29.2万亿词元。

在模型结构层面,M2系列基于62层的解码器式Transformer构建。其关键创新在于集成了256个细粒度专家(Expert),并为每个输入词元动态路由,仅激活其中8个。这种混合专家模型(MoE)设计是达成高效稀疏计算的基础。

论文进一步披露了其在训练系统上的突破。MiniMax团队开发了名为“Forge”的强化学习系统,专为智能体(Agent)优化而设计。Forge系统能够统一调度白盒与黑盒智能体,通过将训练、推理与智能体逻辑解耦,结合窗口化FIFO调度、前缀树合并及专用推理加速技术,大幅降低了长序列任务(long-horizon tasks)的训练成本。

在M2.7版本中,模型展现出“自我进化”能力的早期雏形。根据论文描述,该模型已能自主诊断训练失败原因、解析系统日志并修改相关脚手架代码,从而在内部任务上实现多达100轮的自主迭代优化。

实际应用数据显示,这套自我进化机制已能处理团队30%至50%的日常迭代工作。在一项内部编程脚手架优化任务中,它带来了30%的性能提升。这表明模型正逐步融入其自身开发与优化的技术闭环,虽然处于初级阶段,但技术路径已清晰可见。

相关论文:《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多