其他资讯
M3模型
MiniMax M3模型评测:1M上下文与多模态编程能力
摘要
MiniMax发布新一代模型M3,采用自研稀疏注意力架构MSA,同时具备前沿编程能力、1M超长上下
6月1日,国产大模型厂商MiniMax正式推出新一代通用大模型MiniMax M3,引发行业关注。该模型在技术架构与能力组合上均有显著突破。
M3的核心亮点在于其自主研发的稀疏注意力架构MiniMax Sparse Attention(MSA)。该架构显著提升了编程能力、智能体能力、超长上下文处理以及原生多模态支持等关键维度,实现了代际性跨越,而非简单的增量更新。
据官方资料,M3是国内首款同时具备前沿编程能力、百万级超长上下文(1M)与原生多模态支持的大模型。更关键的是,它是全球唯一将这一完整能力组合全面开源的模型。开源策略使得开发者能够直接用于垂直领域落地,对技术生态的促进意义重大。
性能方面,MiniMax公布的数据显示,在百万token上下文规模下,M3单token计算量仅为上一代模型的二十分之一。推理效率的飞跃,将显著降低实际部署成本并提升响应速度。

来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。