进阶教程 M3模型深度

MiniMax M3模型深度评测：1M超长上下文表现

2026-06-01

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

MiniMax M3：首个开放权重的百万上下文多模态模型在大模型竞争进入“深水区”的今天，

# MiniMax M3：首个开放权重的百万上下文多模态模型在大模型竞争进入“深水区”的今天，各家厂商的更新几乎已经到了日新月异的程度。就在这个节骨眼上，MiniMax 正式推出了他们的新一代旗舰文本模型——MiniMax M3。这款模型不只是在性能上摸到了前沿水平的门槛，更关键的是，它带着“首个开放权重、且同时具备顶尖代码能力、超长上下文与原生多模态”这几个标签杀进了战场。对于那些需要复杂代码生成和自主任务规划的开源方案来说，M3 无疑是目前最值得关注的选择。 **核心要点** - 上下文窗口支持 100 万个 token - 稀疏注意力（MSA）架构，将预训练数据规模扩展到 100T - 在 BrowseComp 测试中，M3 得分 83.5，超过了 Opus 4.7（79.3），整体水平略低于 Claude Opus 4.7、GPT 5.5，但部分单项指标高于国外水平 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-1293908/5db56eab7a999d3d2292bbe3ea09a4f6.png) ### 核心亮点速览快速了解 M3 的硬核实力，核心参数与特性如下：

特性维度	MiniMax M3 关键指标
上下文长度	高达 1M（100万）tokens，基于 MSA 架构
模型类型	原生多模态（Native Multimodal）
核心能力	顶尖代码生成、智能体（Agentic）任务处理
开源状态	开放权重（Open-Weight）
架构创新	MiniMax 稀疏注意力（MSA）

--- ### 深度解析：M3 的三大杀手锏 **1. 真正的“原生多模态”与海量上下文** M3 并没有走那条“先有文本，再拼视觉”的老路。它从预训练的第一步就重建了整个数据流水线，全程进行多模态训练。这意味着文本和视觉语义空间从一开始就对齐得相当彻底——无论你在解析图表、公式还是图片内容，它都游刃有余。配合专有的 MiniMax Sparse Attention（MSA）架构，M3 支撑起了高达 100 万 tokens 的上下文窗口。这可不只是一个营销数字：处理长篇代码库、长时间视频理解、以及复杂的智能体任务，都需要这种级别的底层基础设施支撑。 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-1293908/1fde6a606c6acfa63a6afa24bf5fd824.png) **2. 智能体（Agentic）能力的飞跃** 自主任务分解、工具调用、多步骤推理——这几个老大哥看了都头疼的项目，M3 打出了不错的成绩。文档中提到了两个实际案例，相当有说服力： - **学术复现：** M3 曾经被委以重任，独立自主地复现了一篇 ICLR 2025 的杰出论文。这家伙连续跑了接近 12 小时，自主完成了 18 次代码提交和 23 张实验图表的生成，核心实验完美复刻。具体来说，M3 被提供了四个仅经过预训练的基础模型，要求在 12 小时内自主完成整个流程——数据合成、训练、评估和迭代，最终让模型具备数学推理、代码生成和知识质量保证等能力。全程无人干预，M3 最终拿到 37.1 分，总排名第三，仅次于 Opus 4.7（42.4）和 GPT-5.5（39.3），但显著甩开了其他所有对手。 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-1293908/be1f0008f52d826c09611bb83db4e5c9.png) - **工业级优化：** 在 CUDA 内核优化任务中，M3 在没有人类插手的情况下，经过 147 次基准测试提交，愣是把 FP8 GEMM 内核的硬件利用率从 7.6% 拉到了 71.3%——整整 9.4 倍的速度提升。 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-1293908/6d4d8df5f8cc0eb527bd8baabee6bc9a.png) **3. 顶尖的基准测试成绩** 在多项国际权威基准测试中，M3 的表现稳在了世界领先的水平线，尤其是在代码和智能体任务上： - SWE Bench / Terminal Bench：软件工程和终端执行任务的得分极高 - 自主浏览能力：在 BrowseComp 测试中，M3 拿到了 83.5 分，超过了 Opus 4.7 的 79.3 分，自主信息检索的能力相当强悍 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-1293908/12d3d9df077827ec3e09b5b8fbb6d8a6.png) MiniMax M3 的发布，意味着这家公司在代码、智能体和长上下文这三个关键领域，已经齐刷刷达到了前沿水平。

来源：互联网

上一篇 Python全栈开发实战：用户管理系统从零实现 下一篇 Java List过滤：根据ids数组高效筛选工具指南

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

MiniMax M3模型深度评测：1M超长上下文表现

摘要

相关文章推荐