MINT-4B VLA模型正式发布:智动未来联手蔡盼盼团队
摘要
近日,广东智动未来与上海创智学院蔡盼盼教授团队联合发布了MINT-4B多模态VLA(视觉-语言-
近日,广东智动未来与上海创智学院蔡盼盼教授团队联合发布了MINT-4B多模态VLA(视觉-语言-动作)大模型。其泛化能力与实机表现极其亮眼,在英伟达等国际巨头参与的全球主流通用机器人大模型评测中位列前三,技术指标甚至超越OpenVLA、GR00T、π、UniVLA等标杆级选手。

核心创新:复刻意图而非轨迹
MINT-4B的核心突破在于理解任务意图,而非机械复刻训练时的动作轨迹。传统VLA模型过度依赖记忆中的轨迹,环境一变就容易失效。MINT-4B独创SDAT多尺度频域分词技术,将任务拆解为顶层意图与底层执行细节两个层次,通过跨尺度自回归推理实现分层解码。这样模型清楚“该做什么”,而不只是记住“怎么做”,传统VLA环境适应性差的老大难问题因此得到通透解决。
这套设计带来的直接收益:面对新场景、新物体、新任务,MINT-4B无需重新训练即可快速适应,机器人在真实世界里的部署效率显著提升。
全球评测前三,技术指标领先标杆
在英伟达等行业巨头及国际权威专家组织的全球主流通用机器人大模型评测中,MINT-4B成功跻身前三。与OpenVLA(NVIDIA)、GR00T(NVIDIA)、π(Physical Intelligence)、UniVLA(腾讯Robotics X)等国际标杆模型正面较量,多项技术指标占优,充分证明国产VLA模型已具备全球第一梯队硬实力。
已落地小智S2人形机器人,全国多地商用
目前,MINT-4B技术已搭载到智动未来小智S2人形机器人上,覆盖科教研学、商业展厅等实际场景。配套的开发与实训一体化方案有效降低了落地成本与部署门槛。该机器人在国内多个地区实现商用落地,从实验室到产业化的完整闭环已成功跑通。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。