热点资讯

Genesis AI开源机器人训练场测评：教你番茄炒蛋

2026-05-28

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

GenesisAI发布并开源GenesisWorld1 0及三套核心项目，为机器人和PhysicalAI提供全栈仿真基础设施

原本需要200多小时完成的真实机器人评测，如今在仿真环境中不到半小时就能跑完。

继上次发布令人瞩目的西红柿炒鸡蛋demo之后，Genesis AI今日再次推出新成果。在极客公园此前的报道中，Genesis AI CEO周衔曾透露，团队围绕“仿真平台自动化、规模化生成任务”已有更深入的构思，后续会正式公布。现在，这一答案的关键部分终于落地。

5月28日，Genesis AI正式发布Genesis World 1.0，并开源三大核心项目：Genesis World物理仿真平台、Quadrants跨平台GPU编译器，以及Nyx写实渲染器。按照Genesis AI的说法，这是一套专为机器人和Physical AI打造的全栈仿真基础设施，底层编译器、渲染器和物理引擎均由团队自主开发。

从展示视频来看，Genesis World 1.0构建的仿真世界极其贴近真实，尤其是在过去难以模拟的柔性物体形变、复杂碰撞以及机器人的灵巧操作方面表现突出。Genesis AI还展示了与真实场景1:1速率并排对比的机器人操作，两者高度一致。

Genesis World 1.0的首要目标并非立刻生成更多训练数据，而是让机器人模型评测更快、更具可重复性，并且继续保持开源。

对于机器人基础模型而言，真实世界一直是最慢、成本最高、最难以规模化的评测环境。一个模型检查点、一套数据配方、一次控制策略调整，最终都必须在真实硬件上验证。然而，真实机器人只能以1倍速运行，测试还受限于硬件数量、场地、人力、磨损、校准误差和安全风险。Genesis AI要解决的正是这一瓶颈。

在最新技术博客中，Genesis AI给出了一个直观对比：一次覆盖数百个任务、每个任务重复数百次的模型评测，若在真实世界中进行，需要一台机器人和一名操作员连续运行200多小时；而在仿真中，数万次episode可在不到0.5小时内完成。团队还表示，其仿真评测结果与真实硬件rollout的相关性达到89%。

这些数据目前仍来自Genesis AI内部披露，尚未经独立验证，但它们指向一个清晰的方向：Genesis World 1.0试图证明，仿真可以成为助力机器人scaling的有效途径——首先作为一个足够接近真实世界、能够反复测量机器人模型的试验场。

01 机器人的仿真试验场

Genesis World 1.0最直观的变化，是将机器人领域真正棘手的物理细节整合进了同一个仿真世界。其中，普通人最容易感知的是视觉真实感。这对机器人至关重要——机器人模型最终看到的不是理想世界，而是摄像头眼中的世界。光照、镜头畸变、模糊、反射、材质差异，都会影响模型在真实环境中的判断。

更难的是接触与变形。Genesis World 1.0展示了一个完全由接触物理驱动的yoyo系统。yoyo看似玩具，但对仿真来说并不简单：涉及绳子、旋转、缠绕、张力变化和持续接触。类似的还有垃圾袋、折纸和颠勺。颠勺demo中，锅内同时存在多种物体，它们的形态、接触和运动方式各不相同，系统处理得相当出色。

此外，本次demo的一大进步在于灵巧操作的仿真。Genesis World 1.0展示的并非单一机械臂或单一夹爪任务，而是将不同形态的末端执行器纳入同一套仿真框架：既有Wuji/Sharpa这样的五指灵巧手，也有更传统的夹爪。它们面对的也不是标准化的刚体抓取，而是垃圾袋、纸张、绳子、锅内食材这类接触状态不断变化的对象。

例如垃圾袋demo中，机器人需要用双手撑开袋口并套入垃圾桶。这一动作对人来说很平常，但对机器人仿真却极具挑战：袋口会塌陷，薄膜会折叠，手指与袋子之间不断发生滑动、拉扯和重新接触。仔细观察，它并不像真正的塑料袋，更接近布料的柔软皱褶，但这本身已说明系统能够处理复杂薄壳、大变形接触，以及多指手与软物体之间的连续交互。折纸demo则展示了elastoplastic thin shell manipulation，机器人需让纸张发生折叠、弯曲和保形，难度远超刚体抓取。

Genesis不仅模拟画面和物理运动，还模拟机器人本体及传感器。在Unitree机器人demo中，画面右侧甚至显示了关节温度。这意味着仿真不只关心机器人能否行走，还试图将IMU、关节温度这类更贴近真实硬件状态的信号纳入其中。另一组demo展示了lidar和触觉传感器模拟：机器人抱起纸箱时，画面同时给出点云和手掌触觉读数。

这些细节使Genesis World 1.0的目标更加明确：它不只是构建一个能看视频的虚拟世界，而是要模拟机器人实际会面对的世界，包括相机、触觉、雷达、关节状态，以及不同任务中不断变化的接触关系。Genesis还展示了一个domain randomization测试。同一任务可以在不同物体、材质、桌面、光照和场景布局中反复变化。对机器人模型而言，这才是仿真的真正意义：不是在一个完美场景中跑通一次，而是在大量相似但不相同的世界中反复失败、测量和修正。

02 仿真不只是造数据，先要能验模型

Genesis AI这条技术线索，最初并非始于机器人demo，而是源于一个博士期间的开源仿真项目。2024年12月，在创立Genesis AI之前，周衔与合作者发布了开源仿真项目Genesis。该项目采用Apache-2.0协议，定位为面向通用机器人和具身AI学习的仿真平台，底层统一多种物理求解器，上层则尝试通过生成式框架自动生成场景、任务和机器人数据。

当时最吸引人的想象是“一句话生成物理世界”：利用生成式框架调用物理引擎，自动生成场景、任务、动作、奖励函数和多模态数据。这个想法直观且诱人。机器人缺乏数据，尤其缺乏真实物理交互中的高质量数据。一个人倒水、切菜、系线、撑开垃圾袋，其中包含大量隐含的接触、摩擦、力反馈和材料变化。仅靠真实机器人一点点采集，不仅慢，也难以覆盖足够多的任务、物体和环境变化。如果仿真平台足够真实，再让上层生成式系统自动提出任务、生成场景、设计奖励函数、训练策略，它就有可能变成一个机器人数据工厂。这也是周衔最初设想的路径：用LLM驱动物理引擎，为机器人创造数据。

然而到了Genesis World 1.0，Genesis AI对仿真的表述变得更加克制且工程化。在最新技术博客中，Genesis AI明确写道，他们现在将simulation视为机器人基础模型的“evaluation and iteration engine”，而不仅仅是data generator。原因很现实：如果一个模型用仿真数据训练，又在同一仿真分布中评测，效果变好可能只是更适应simulator，而非真正更适应真实世界。因此Genesis AI选择先做一件更基础的事：验证仿真评测与真实硬件rollout之间的相关性。

按照他们的说法，这一阶段的目标是在不依赖仿真数据做预训练的前提下，建立simulation与real world之间的强相关。也就是说，模型主要从真实世界数据中学习，再被放入仿真环境进行闭环评测。如果仿真中的表现排序与真实硬件上的表现排序一致，仿真才有资格成为模型迭代的工具。

Genesis AI在博客中特别强调了closed-loop evaluation，即闭环评测。过去许多机器人模型会报告固定数据集上的动作预测误差，如R-squared或MAE。这些指标自然有用，能发现模型输出是否异常，也可作为训练过程中的sanity check。但Genesis AI认为，一旦几个模型在这些开环指标上进入相近区间，它们就很难区分真实世界中的表现差异。原因在于：机器人模型不是在做动作预测的答卷，而是在物理世界中连续犯错。一次轻微的视觉误判、一次抓取偏移、一次接触不稳，都可能在后续动作中被放大。模型真正需要被测量的，不只是某一帧预测得对不对，而是当环境持续变化时，它能否感知、行动、纠错，最终完成任务。正因如此，Genesis AI将仿真评测做成closed-loop：让模型在仿真环境中实际执行任务，而非只在静态数据集上预测动作。

Genesis AI在博客中披露，他们在14个任务上评估了Small、Medium、Large三个不同规模和架构的模型，每个任务在真实世界和仿真中各跑200个episode，再用100万次bootstrap估计置信区间。最终，仿真评测与真实硬件rollout的Pearson correlation达到0.8996，MMRV为0.0166。这也体现了Genesis从2024年到2026年叙事上的转变：从“生成一个物理世界”，走向“先让这个物理世界足够可信”。

03 开源一套机器人世界的底层工具

Genesis World 1.0完全开源，同时释放了三层工具：物理引擎、渲染器和编译器。

第一层是Genesis World本身，负责模拟机器人真正会遇到的物理世界：刚体、可变形物体、布料、颗粒、流体、薄壳，以及不同机器人本体和末端执行器之间的复杂接触。对机器人而言，这一层决定了“世界会不会按真实方式回应动作”。

第二层是Nyx。它负责让机器人看到的世界更接近真实相机。Genesis AI在技术博客中指出，游戏引擎优化的是视觉吸引力，离线渲染器追求物理准确但速度太慢；机器人需要的是另一种渲染器：能大规模生成接近真实摄像头的图像，并且足够快地支撑评测。换言之，Nyx的意义不在于做出最讨好人眼的画面，而是尽量贴近机器之眼。

第三层是Quadrants。它看似最不吸引眼球，却能说明Genesis为何要做全栈。机器人仿真并非只跑在一种机器上：工程师可能在MacBook上调试，大规模评测跑在GPU集群里，部分控制和验证未来还可能跑在机器人板端。Quadrants支持CUDA、ROCm、Apple Metal、Vulkan以及x86/ARM64 CPU，目标是让同一套Python kernel能在不同硬件后端运行。它的意义不是“又一个编译器”，而是让仿真栈尽量不被单一硬件锁死。

这三层合在一起，构成了Genesis World 1.0的核心：一个既能模拟物理、又能模拟视觉、还能大规模运行的机器人世界。也只有在三层都成立之后，自动生成任务才有意义。

在技术博客后半部分，团队提到了一条programmatic pipeline：自动生成simulation environment，包括scene layout、asset selection、environment code和success metrics。换句话说，未来的仿真系统不再被动接收人类写好的任务，而是可以自行扩展任务空间、生成评测场景，并定义什么叫完成任务。这使Genesis World 1.0从一个开源工具，走向一个更大的目标。

他们在结尾提出的方向是self-evolving physical AI：内循环发生在仿真中，agent生成环境，模型执行任务，仿真系统评分，策略持续改进；外循环发生在真实世界中，真实部署暴露edge cases，再反过来校准simulator和任务分布。这解释了为什么Genesis AI要把仿真、渲染和编译器一起做出来，又一起开源。他们想做的不是让机器人少跑几次真机测试，而是让机器人研发从人手设计任务、人手调参、人手排队上真机，逐渐演变成一个能自我产生问题、验证答案、再回到现实中修正自己的系统。

如果这条路走通，仿真就不再只是现实世界的替身。它会变成机器人学习现实世界的一种方式。

*头图来源：Genesis AI

来源：互联网

上一篇 Canva可画AI搜索标题模板精选榜单 下一篇 QoderWake虚拟环境配置：Conda管理多版本依赖库完整指南

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

Genesis AI开源机器人训练场测评：教你番茄炒蛋

摘要

01 机器人的仿真试验场

02 仿真不只是造数据，先要能验模型

03 开源一套机器人世界的底层工具

相关文章推荐