谷歌Genie接入街景数据:真实街道场景模拟深度解析
摘要
谷歌将海量街景数据接入其Genie世界模型,可生成基于真实地点的交互式模拟环境。该功能
我们习惯于在谷歌地图上调用街景,向朋友指认童年住过的街道,或者在规划行程时,提前“漫步”于巴黎酒店门前的石板路。现在,这项基础功能正在进化,它将提供沉浸式的街道模拟体验,你甚至可以调整天气,预览暴雨或暴雪中的城市景象。

这正是谷歌最新整合项目的核心目标。谷歌DeepMind宣布,其庞大的全球街景数据库已接入“Project Genie”——一个能够生成多样化交互式环境的通用世界模型。这项集成功能已在谷歌I/O开发者大会上正式发布。
DeepMind开放性研究团队的研究科学家杰克·帕克-霍尔德阐述了其潜力:“这项技术的应用前景广阔,无论是用于训练AI智能体与机器人,还是为人类提供自由的探索工具,都极具价值。这也是Genie项目一贯的研发方向。”
他给出了一个具体案例:假设一台新机器人即将在伦敦投入运行。Genie可以模拟出阳光罕见地穿透云层、照亮维多利亚式建筑立面的场景,让机器人在真实环境中遇到类似光照变化时,能够从容应对。
对于普通用户而言,应用场景同样直观:计划前往纽约旅行,但想预览的不是当下的秋季景色。冬季的街道会积雪吗?你可以提前用Genie模拟出那条街道银装素裹的模样。
这一切的基石,是谷歌持续二十年、覆盖全球的街景数据采集工程。通过街景车队和人员背负的“追踪背包”,谷歌已累计捕获超过2800亿张图像,足迹遍及全球110个国家和地区。
帕克-霍尔德强调:“街景为我们提供了海量真实世界地点的图像数据。将如此丰富的现实世界信息与动态模拟能力相结合,其潜力是巨大的。”
回顾其发展路径,谷歌于去年8月发布了世界模型Genie 3的研究预览版,并于今年1月向美国的谷歌AI Ultra订阅用户开放访问,允许用户通过文本或图像提示创建可交互的虚拟世界。该项目的长期愿景是服务于教育体验、游戏原型开发以及机器人训练。
目前,Genie 3已在为Waymo的模拟器提供支持,帮助其自动驾驶系统训练应对“龙卷风”或“道路出现大象”等极端罕见场景。接入街景数据后,这一能力有望助力Waymo更高效地将业务拓展至全球更多城市。
Waymo拥有自研的模拟器,并依靠它成功将自动驾驶服务扩展至美国11座城市。两者的关键差异在于:Waymo的模拟视角始终锁定在车辆本身,而结合了街景数据的Genie不仅能基于真实地理位置构建世界,还能将视角灵活切换至行人、骑行者或机器人等其他智能体。
据悉,谷歌已开始向部分美国Ultra用户开放街景与Genie的集成功能测试,并计划在未来逐步扩大访问范围。全球范围内的Ultra用户预计将在未来几周内陆续获得体验权限。
DeepMind产品经理迭戈·里瓦斯表示,团队的目标是让尽可能多的用户体验到这项新功能。但他也明确指出,无论是街景集成还是Genie整体,目前仍处于实验阶段,在模拟的准确性与真实性方面仍有很长的路要走。
从谷歌团队展示的演示样本来看——包括对笔者曾居住街区进行的水下环境模拟——效果令人印象深刻,场景还原度较高。但整体观感更接近精致的游戏引擎画面,尚未达到照片级的真实感。此外,模型目前缺乏对物理规律的感知能力,即无法理解因果关系。例如,在一段模拟雪中奔跑的场景中,人物直接穿过了仙人掌和灌木丛。
相比之下,谷歌的图像生成模型Nano Banana已能在图表中准确生成文字,视频生成模型Veo也能理解纸船随波逐流、烟雾逐渐消散、布料覆盖物体等复杂物理规律。
值得注意的是,这些物理规律并非通过硬编码规则植入模型,而是模型通过海量数据的被动观察逐渐“习得”的,其过程类似于生命体对世界的认知学习。
对于模型的现状与未来,帕克-霍尔德给出了一个时间预期:“就这类世界模型而言,我认为它在输出准确性和视觉质量上,大概落后于当前顶尖的视频生成模型六到十二个月。但这无疑是我们终将解决的问题。”
谷歌地图总监乔纳森·赫伯特,一位12年前以实习生身份加入街景团队的资深成员,分享了他的见解。他认为,Genie目前还无法对一条街道进行完全精准的毫米级三维重建,但真正的技术突破在于AI展现出的“空间连续性”。当用户环顾360度后,AI能够正确记忆并模拟身后的环境,并在此基础上持续构建连贯的新场景。
“我们长期思考的核心命题是,如何基于街景数据,构建出对世界最丰富、最精准的数字化模型,”赫伯特说,“将地图数据以创新的方式应用于前沿AI研究,正是我们长久以来的愿景。”
Q&A
Q1:谷歌Genie世界模型是什么,有哪些功能?
Genie是谷歌DeepMind开发的通用世界模型,核心功能是生成多样化的交互式虚拟环境。用户可通过文本描述或上传图片作为提示,创建可交互的游戏世界。目前,Genie 3已向美国谷歌AI Ultra订阅用户开放,主要应用于教育模拟、游戏开发与机器人训练。接入街景数据后,新增了模拟真实街道场景及调整天气效果的能力。
Q2:街景数据接入Genie后,对Waymo自动驾驶训练有什么帮助?
Genie 3目前已为Waymo的模拟器提供技术支持,用于训练自动驾驶系统应对龙卷风、道路突发动物等极端罕见场景。与Waymo原有模拟器相比,接入街景数据的Genie不仅能基于真实地理位置构建高保真模拟世界,还能将训练视角从车辆灵活切换至行人或机器人等其他智能体,这有助于Waymo加速其全球城市拓展的布局与测试。
Q3:Genie的街景模拟目前有哪些局限性?
目前Genie的街景模拟在视觉效果上更接近高级电子游戏画面,尚未达到照片级的真实感。模型缺乏物理感知能力,无法理解物体间的因果关系,导致模拟中可能出现人物穿透障碍物等不合理现象。此外,对街道的完全精准三维重建尚未实现。研发人员评估,该模型在输出质量和准确性上,大约落后于顶尖视频生成模型六至十二个月。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。