英伟达全能世界模型登场!物理AI加速机器人与自动驾驶
摘要
先给出一个明确判断:物理AI的规模化落地,很可能比业界预期更早到来。 就在今天,英伟
先给出一个明确判断:物理AI的规模化落地,很可能比业界预期更早到来。
就在今天,英伟达在2026年台北GTC大会上正式发布了Cosmos 3——一款基于Transformer混合架构的物理AI世界模型。官方将其定义为“全球首个完全开源的全能模型”。这里的“全能”并非营销噱头:它真正实现了对文本、图像、视频、环境音效及动作的原生理解与生成。用黄仁勋的原话来说:“物理AI的指数级增长近在眼前。”

这一判断的底气来自实质性的突破:Cosmos 3将物理AI的训练与评估周期,从过去的数月压缩至数天。过去开发者需要分别运行多个模型才能串联推理、生成与动作流程,如今单一模型即可完成全线任务。这不仅是效率提升,更从根本上改变了机器人、自动驾驶等领域的研发节奏。
在开源世界模型的竞技场上,Cosmos 3的成绩单极具说服力。在Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench等业内公认的硬核基准测试中,其世界生成准确率均位列第一。在动作策略维度,RoboLab与RoboArena的榜首同样被它收入囊中。简言之,该模型既“看得准”,也“做得对”。
目前Cosmos的生态版图已初具规模。思灵机器人、斗山机器人、LG电子、三星、Skild AI以及国内理想汽车均为其用户。更值得关注的是,英伟达今天同时宣布推出Isaac GR00T人形机器人参考设计,计划于2026年底由宇树科技落地。与此同时,英伟达正联合美、欧、韩的人形机器人厂商,共同打造研究级机器人。这盘棋显然不止于模型销售。
后续演进路径同样清晰。英伟达同步成立了Cosmos联盟,成员包括思灵机器人、德国黑森林实验室、Runway、Skild AI等机构,目标明确:推动下一代世界模型向前迭代。
回看行业判断,国投证券的分析一针见血:物理AI是人工智能的下一个演进方向,但挑战不容忽视——数据成本高企、物理定律难以建模,都是绕不开的障碍。而世界模型与空间智能,正是为物理AI提供感知与认知三维世界基座的关键拼图。
浙商证券则点出了另一个变量:物理AI的实现范式尚未收敛,当前需要世界模型与VLA(视觉-语言-动作模型)协同作战。但市场空间已被勾勒——英伟达测算,制造与物流产业的重塑空间约50万亿美元;投资机构Coatue Management的估算更为保守,约6万亿美元。具体数字并非关键,方向已然明确:物理AI赛道,发令枪已经打响。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。