菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > Genesis AI开源机器人训练场测评:教你番茄炒蛋
热点资讯

Genesis AI开源机器人训练场测评:教你番茄炒蛋

2026-05-28
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

GenesisAI发布并开源GenesisWorld1 0及三套核心项目,为机器人和PhysicalAI提供全栈仿真基础设施


原本需要200多小时完成的真实机器人评测,如今在仿真环境中不到半小时就能跑完。

继上次发布令人瞩目的西红柿炒鸡蛋demo之后,Genesis AI今日再次推出新成果。在极客公园此前的报道中,Genesis AI CEO周衔曾透露,团队围绕“仿真平台自动化、规模化生成任务”已有更深入的构思,后续会正式公布。现在,这一答案的关键部分终于落地。

5月28日,Genesis AI正式发布Genesis World 1.0,并开源三大核心项目:Genesis World物理仿真平台、Quadrants跨平台GPU编译器,以及Nyx写实渲染器。按照Genesis AI的说法,这是一套专为机器人和Physical AI打造的全栈仿真基础设施,底层编译器、渲染器和物理引擎均由团队自主开发。

从展示视频来看,Genesis World 1.0构建的仿真世界极其贴近真实,尤其是在过去难以模拟的柔性物体形变、复杂碰撞以及机器人的灵巧操作方面表现突出。Genesis AI还展示了与真实场景1:1速率并排对比的机器人操作,两者高度一致。

Genesis World 1.0的首要目标并非立刻生成更多训练数据,而是让机器人模型评测更快、更具可重复性,并且继续保持开源。

对于机器人基础模型而言,真实世界一直是最慢、成本最高、最难以规模化的评测环境。一个模型检查点、一套数据配方、一次控制策略调整,最终都必须在真实硬件上验证。然而,真实机器人只能以1倍速运行,测试还受限于硬件数量、场地、人力、磨损、校准误差和安全风险。Genesis AI要解决的正是这一瓶颈。

在最新技术博客中,Genesis AI给出了一个直观对比:一次覆盖数百个任务、每个任务重复数百次的模型评测,若在真实世界中进行,需要一台机器人和一名操作员连续运行200多小时;而在仿真中,数万次episode可在不到0.5小时内完成。团队还表示,其仿真评测结果与真实硬件rollout的相关性达到89%。

这些数据目前仍来自Genesis AI内部披露,尚未经独立验证,但它们指向一个清晰的方向:Genesis World 1.0试图证明,仿真可以成为助力机器人scaling的有效途径——首先作为一个足够接近真实世界、能够反复测量机器人模型的试验场。

01 机器人的仿真试验场

Genesis World 1.0最直观的变化,是将机器人领域真正棘手的物理细节整合进了同一个仿真世界。其中,普通人最容易感知的是视觉真实感。这对机器人至关重要——机器人模型最终看到的不是理想世界,而是摄像头眼中的世界。光照、镜头畸变、模糊、反射、材质差异,都会影响模型在真实环境中的判断。

更难的是接触与变形。Genesis World 1.0展示了一个完全由接触物理驱动的yoyo系统。yoyo看似玩具,但对仿真来说并不简单:涉及绳子、旋转、缠绕、张力变化和持续接触。类似的还有垃圾袋、折纸和颠勺。颠勺demo中,锅内同时存在多种物体,它们的形态、接触和运动方式各不相同,系统处理得相当出色。

此外,本次demo的一大进步在于灵巧操作的仿真。Genesis World 1.0展示的并非单一机械臂或单一夹爪任务,而是将不同形态的末端执行器纳入同一套仿真框架:既有Wuji/Sharpa这样的五指灵巧手,也有更传统的夹爪。它们面对的也不是标准化的刚体抓取,而是垃圾袋、纸张、绳子、锅内食材这类接触状态不断变化的对象。

例如垃圾袋demo中,机器人需要用双手撑开袋口并套入垃圾桶。这一动作对人来说很平常,但对机器人仿真却极具挑战:袋口会塌陷,薄膜会折叠,手指与袋子之间不断发生滑动、拉扯和重新接触。仔细观察,它并不像真正的塑料袋,更接近布料的柔软皱褶,但这本身已说明系统能够处理复杂薄壳、大变形接触,以及多指手与软物体之间的连续交互。折纸demo则展示了elastoplastic thin shell manipulation,机器人需让纸张发生折叠、弯曲和保形,难度远超刚体抓取。

Genesis不仅模拟画面和物理运动,还模拟机器人本体及传感器。在Unitree机器人demo中,画面右侧甚至显示了关节温度。这意味着仿真不只关心机器人能否行走,还试图将IMU、关节温度这类更贴近真实硬件状态的信号纳入其中。另一组demo展示了lidar和触觉传感器模拟:机器人抱起纸箱时,画面同时给出点云和手掌触觉读数。

这些细节使Genesis World 1.0的目标更加明确:它不只是构建一个能看视频的虚拟世界,而是要模拟机器人实际会面对的世界,包括相机、触觉、雷达、关节状态,以及不同任务中不断变化的接触关系。Genesis还展示了一个domain randomization测试。同一任务可以在不同物体、材质、桌面、光照和场景布局中反复变化。对机器人模型而言,这才是仿真的真正意义:不是在一个完美场景中跑通一次,而是在大量相似但不相同的世界中反复失败、测量和修正。

02 仿真不只是造数据,先要能验模型

Genesis AI这条技术线索,最初并非始于机器人demo,而是源于一个博士期间的开源仿真项目。2024年12月,在创立Genesis AI之前,周衔与合作者发布了开源仿真项目Genesis。该项目采用Apache-2.0协议,定位为面向通用机器人和具身AI学习的仿真平台,底层统一多种物理求解器,上层则尝试通过生成式框架自动生成场景、任务和机器人数据。

当时最吸引人的想象是“一句话生成物理世界”:利用生成式框架调用物理引擎,自动生成场景、任务、动作、奖励函数和多模态数据。这个想法直观且诱人。机器人缺乏数据,尤其缺乏真实物理交互中的高质量数据。一个人倒水、切菜、系线、撑开垃圾袋,其中包含大量隐含的接触、摩擦、力反馈和材料变化。仅靠真实机器人一点点采集,不仅慢,也难以覆盖足够多的任务、物体和环境变化。如果仿真平台足够真实,再让上层生成式系统自动提出任务、生成场景、设计奖励函数、训练策略,它就有可能变成一个机器人数据工厂。这也是周衔最初设想的路径:用LLM驱动物理引擎,为机器人创造数据。

然而到了Genesis World 1.0,Genesis AI对仿真的表述变得更加克制且工程化。在最新技术博客中,Genesis AI明确写道,他们现在将simulation视为机器人基础模型的“evaluation and iteration engine”,而不仅仅是data generator。原因很现实:如果一个模型用仿真数据训练,又在同一仿真分布中评测,效果变好可能只是更适应simulator,而非真正更适应真实世界。因此Genesis AI选择先做一件更基础的事:验证仿真评测与真实硬件rollout之间的相关性。

按照他们的说法,这一阶段的目标是在不依赖仿真数据做预训练的前提下,建立simulation与real world之间的强相关。也就是说,模型主要从真实世界数据中学习,再被放入仿真环境进行闭环评测。如果仿真中的表现排序与真实硬件上的表现排序一致,仿真才有资格成为模型迭代的工具。

Genesis AI在博客中特别强调了closed-loop evaluation,即闭环评测。过去许多机器人模型会报告固定数据集上的动作预测误差,如R-squared或MAE。这些指标自然有用,能发现模型输出是否异常,也可作为训练过程中的sanity check。但Genesis AI认为,一旦几个模型在这些开环指标上进入相近区间,它们就很难区分真实世界中的表现差异。原因在于:机器人模型不是在做动作预测的答卷,而是在物理世界中连续犯错。一次轻微的视觉误判、一次抓取偏移、一次接触不稳,都可能在后续动作中被放大。模型真正需要被测量的,不只是某一帧预测得对不对,而是当环境持续变化时,它能否感知、行动、纠错,最终完成任务。正因如此,Genesis AI将仿真评测做成closed-loop:让模型在仿真环境中实际执行任务,而非只在静态数据集上预测动作。

Genesis AI在博客中披露,他们在14个任务上评估了Small、Medium、Large三个不同规模和架构的模型,每个任务在真实世界和仿真中各跑200个episode,再用100万次bootstrap估计置信区间。最终,仿真评测与真实硬件rollout的Pearson correlation达到0.8996,MMRV为0.0166。这也体现了Genesis从2024年到2026年叙事上的转变:从“生成一个物理世界”,走向“先让这个物理世界足够可信”。

03 开源一套机器人世界的底层工具

Genesis World 1.0完全开源,同时释放了三层工具:物理引擎、渲染器和编译器。

第一层是Genesis World本身,负责模拟机器人真正会遇到的物理世界:刚体、可变形物体、布料、颗粒、流体、薄壳,以及不同机器人本体和末端执行器之间的复杂接触。对机器人而言,这一层决定了“世界会不会按真实方式回应动作”。

第二层是Nyx。它负责让机器人看到的世界更接近真实相机。Genesis AI在技术博客中指出,游戏引擎优化的是视觉吸引力,离线渲染器追求物理准确但速度太慢;机器人需要的是另一种渲染器:能大规模生成接近真实摄像头的图像,并且足够快地支撑评测。换言之,Nyx的意义不在于做出最讨好人眼的画面,而是尽量贴近机器之眼。

第三层是Quadrants。它看似最不吸引眼球,却能说明Genesis为何要做全栈。机器人仿真并非只跑在一种机器上:工程师可能在MacBook上调试,大规模评测跑在GPU集群里,部分控制和验证未来还可能跑在机器人板端。Quadrants支持CUDA、ROCm、Apple Metal、Vulkan以及x86/ARM64 CPU,目标是让同一套Python kernel能在不同硬件后端运行。它的意义不是“又一个编译器”,而是让仿真栈尽量不被单一硬件锁死。

这三层合在一起,构成了Genesis World 1.0的核心:一个既能模拟物理、又能模拟视觉、还能大规模运行的机器人世界。也只有在三层都成立之后,自动生成任务才有意义。

在技术博客后半部分,团队提到了一条programmatic pipeline:自动生成simulation environment,包括scene layout、asset selection、environment code和success metrics。换句话说,未来的仿真系统不再被动接收人类写好的任务,而是可以自行扩展任务空间、生成评测场景,并定义什么叫完成任务。这使Genesis World 1.0从一个开源工具,走向一个更大的目标。

他们在结尾提出的方向是self-evolving physical AI:内循环发生在仿真中,agent生成环境,模型执行任务,仿真系统评分,策略持续改进;外循环发生在真实世界中,真实部署暴露edge cases,再反过来校准simulator和任务分布。这解释了为什么Genesis AI要把仿真、渲染和编译器一起做出来,又一起开源。他们想做的不是让机器人少跑几次真机测试,而是让机器人研发从人手设计任务、人手调参、人手排队上真机,逐渐演变成一个能自我产生问题、验证答案、再回到现实中修正自己的系统。

如果这条路走通,仿真就不再只是现实世界的替身。它会变成机器人学习现实世界的一种方式。

*头图来源:Genesis AI

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多