中科第五纪FlowWAM登顶全球榜单:国产具身世界模型权威测评
摘要
具身智能领域正经历一场深刻的范式转移:从依赖视觉模拟,转向构建对物理空间的深度理
具身智能领域正经历一场深刻的范式转移:从依赖视觉模拟,转向构建对物理空间的深度理解能力。这一趋势在WorldArena全球具身世界模型基准评测的最新结果中得到了集中体现。中科第五纪研发的FlowWAM模型,凭借其在物理交互与三维空间理解上的卓越性能,成功登顶榜首。这一成绩不仅是一个排名,更是国产模型在动态、复杂现实任务中,其预测准确性与物理真实性的有力证明。

核心突破:物理遵循与三维精度双第一
WorldArena的评估体系超越了传统的视觉质量评判,从6大维度、16项指标对模型的综合能力进行考核。FlowWAM在“物理遵循”与“3D准确度”两大核心维度上均位列第一,标志着它已从“视频生成工具”进化为具备精准物理空间认知潜力的“具身大脑”。
具体优势体现在两个层面:
首先是物理遵循(Physics Adherence)的领先。这直接解决了生成模型常见的“虚假交互”顽疾。FlowWAM生成的机器人动作序列,在接触力、物体形变与力传导等细节上展现出高度的物理真实性。其轨迹预测的时空对齐精度在所有模型中最高,这意味着它输出的不是孤立的画面帧,而是符合牛顿力学的一条完整、精确的作业路径。
其次是3D准确度(3D Accuracy)的突破。这关乎模型能否构建真实、一致的三维几何场景,从根本上消除空间幻觉。在深度估计方面,其生成的场景结构与真实数据高度吻合,有效解决了单目视觉的尺度模糊问题。在透视合理性上,无论是物体随距离的尺度变化,还是复杂的光影与遮挡关系,模型都展现出严密的三维空间逻辑。
两大维度的全面领先,意味着FlowWAM在面对需要精确物理推理和空间重建的现实世界任务时,将具备更高的可靠性与落地价值。
技术路径:从感知到理解的阶梯式进化
FlowWAM的登顶,是中科第五纪在具身智能领域长期技术积累的集中爆发。其发展脉络清晰地勾勒出一条“具身大脑”的进化之路。
初代模型FAM-1,通过引入3D热力图进行二次预训练,显著降低了模型在空间理解过程中的信息损耗。这一设计使其能够在极少样本下快速微调,赋予机器人初步的少样本泛化操作能力。
随后的BridgeV2W作为第一代具身世界模型,创新性地将不同本体的机器人行为进行空间像素化统一表征。这一方法有效弥合了“从动作指令到视觉结果”的语义鸿沟,实现了跨机器人平台的未来视频准确预测,奠定了跨本体可靠操作的技术基础。
发展到当前的FlowWAM阶段,尽管其完整架构尚未公开,但从其命名中的“Flow”可以推断,模型很可能在动态物理过程的建模与因果预测上取得了关键性突破。这也正是其能在物理遵循与3D精度这两个硬核指标上建立显著优势的根本原因。
产业意义:国产模型在核心赛道的集体突围
纵观WorldArena榜单前列,中科第五纪之外,还有众多中国团队与科研机构的身影。这揭示了一个清晰的产业信号:在全球具身智能的竞赛中,中国力量正在“具身世界模型”这一决定上层应用性能的核心底层技术上,实现集体突破。
与海外巨头在通用视频生成(如Sora、Gen-3)上展现的“广度”优势不同,国内赛道呈现出鲜明的“垂直深耕”特征:技术目标从“场景识别”转向“物理理解”,研发重点从技术演示迈向在工业制造、智慧物流、家庭服务等具体场景中的规模化落地验证。
随着2026年被视为具身智能的关键应用元年,国产具身世界模型凭借在物理与空间理解上取得的扎实进展,已占据了新一轮技术发展的战略制高点。接下来的核心命题,是如何将这份技术榜单上的优势,高效转化为各垂直行业里切实的生产力与解决方案。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。