智元世界模型登顶行业榜单,夯实具身智能底座
摘要
智元自研通用世界模型GE2 0在具身智能评测中获综合排名第一,未做专项优化即展现扎实通



具身智能赛道迎来关键节点——WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果出炉。智元机器人自主研发的通用世界模型Genie Envisioner-Sim 2.0(GE 2.0),凭借全方位的综合能力优势,强势登顶该赛道综合排名榜首。
本次评测聚焦人形机器人智能化的底层能力,包括环境感知、逻辑推理与动作响应三大维度。值得注意的是,智元提交的是原生版GE 2.0——未针对任何评测题目做专项定制,仅基于公开数据进行基础微调。通用模式下的优异表现,印证了模型扎实的泛化能力与适配弹性。放眼行业,技术迭代加速、赛道竞争白热化,智元却坚持深耕底层技术,持续打磨具身世界模型的根基。此次排名,正是长期基础研发投入的阶段性回报。
技术报告显示,相比前代产品,GE 2.0并非孤立的性能提升,而是完成了能力体系的系统性重构。它构建了功能完备且稳定性更强的世界模拟引擎,能够生成动态、可迭代的虚拟仿真环境,支持机器人在其中自主推演、试错并积累经验。此举大幅降低了真实场景的调试成本,加速了算法迭代效率,最终打通了从基础感知预测、仿真推演到自主决策的完整技术闭环。
功能体系层面,GE 2.0补齐了长时序内容生成、多视角场景构建、本体状态模拟、近实时推理、奖励判别等核心模块,形成完整的世界模拟器技术闭环,可灵活适配各类机器人训练与仿真任务。
长时序推演是业界公认的难点,新版模型在此维度取得了显著突破。在数十秒级别的连续推演任务中,画面与场景逻辑的衰减幅度远低于行业基准方案。即便持续推演40至50秒,生成质量依然优于基线模型短时间内推演的结果。这意味着GE 2.0能够为机器人连续作业与长周期决策提供更可靠的支撑。
为验证仿真真实度,研发团队开展了多维度闭环对比评测。大量实验数据显示,GE 2.0模拟的场景与真实物理世界高度一致。评测不仅从宏观层面进行了效果对标,还通过逐案例对比和混淆矩阵量化分析,进一步验证了模型仿真结果的可靠性。这使得GE 2.0能够客观、精准地支撑机器人策略评估与算法验证。
模型还建立了完整的数据回流优化机制。借助奖励模型,GE 2.0自动从仿真推演过程中筛选高质量有效数据,反向驱动策略模型的迭代优化。实验结果表明,该数据闭环机制能持续提升算法性能,为模型的持续进化与能力迭代提供稳定支撑。
行业普遍判断,2026年将是具身智能规模化落地的元年。机器人技术加速从实验室走向真实场景的大规模应用,对算法的稳定性、实用性与落地性提出了更高要求。智元当前正聚焦底层技术攻坚与场景价值落地,全力打通具身智能技术闭环,推动世界模型真正融入现实应用,为人形机器人规模化部署筑牢核心技术底座。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。