其他资讯

谷歌Genie接入街景数据：真实街道场景模拟深度解析

2026-05-23

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

谷歌将海量街景数据接入其Genie世界模型，可生成基于真实地点的交互式模拟环境。该功能

我们习惯于在谷歌地图上调用街景，向朋友指认童年住过的街道，或者在规划行程时，提前“漫步”于巴黎酒店门前的石板路。现在，这项基础功能正在进化，它将提供沉浸式的街道模拟体验，你甚至可以调整天气，预览暴雨或暴雪中的城市景象。

谷歌将街景数据接入Genie世界模型，可模拟真实街道场景

这正是谷歌最新整合项目的核心目标。谷歌DeepMind宣布，其庞大的全球街景数据库已接入“Project Genie”——一个能够生成多样化交互式环境的通用世界模型。这项集成功能已在谷歌I/O开发者大会上正式发布。

DeepMind开放性研究团队的研究科学家杰克·帕克-霍尔德阐述了其潜力：“这项技术的应用前景广阔，无论是用于训练AI智能体与机器人，还是为人类提供自由的探索工具，都极具价值。这也是Genie项目一贯的研发方向。”

他给出了一个具体案例：假设一台新机器人即将在伦敦投入运行。Genie可以模拟出阳光罕见地穿透云层、照亮维多利亚式建筑立面的场景，让机器人在真实环境中遇到类似光照变化时，能够从容应对。

对于普通用户而言，应用场景同样直观：计划前往纽约旅行，但想预览的不是当下的秋季景色。冬季的街道会积雪吗？你可以提前用Genie模拟出那条街道银装素裹的模样。

这一切的基石，是谷歌持续二十年、覆盖全球的街景数据采集工程。通过街景车队和人员背负的“追踪背包”，谷歌已累计捕获超过2800亿张图像，足迹遍及全球110个国家和地区。

帕克-霍尔德强调：“街景为我们提供了海量真实世界地点的图像数据。将如此丰富的现实世界信息与动态模拟能力相结合，其潜力是巨大的。”

回顾其发展路径，谷歌于去年8月发布了世界模型Genie 3的研究预览版，并于今年1月向美国的谷歌AI Ultra订阅用户开放访问，允许用户通过文本或图像提示创建可交互的虚拟世界。该项目的长期愿景是服务于教育体验、游戏原型开发以及机器人训练。

目前，Genie 3已在为Waymo的模拟器提供支持，帮助其自动驾驶系统训练应对“龙卷风”或“道路出现大象”等极端罕见场景。接入街景数据后，这一能力有望助力Waymo更高效地将业务拓展至全球更多城市。

Waymo拥有自研的模拟器，并依靠它成功将自动驾驶服务扩展至美国11座城市。两者的关键差异在于：Waymo的模拟视角始终锁定在车辆本身，而结合了街景数据的Genie不仅能基于真实地理位置构建世界，还能将视角灵活切换至行人、骑行者或机器人等其他智能体。

据悉，谷歌已开始向部分美国Ultra用户开放街景与Genie的集成功能测试，并计划在未来逐步扩大访问范围。全球范围内的Ultra用户预计将在未来几周内陆续获得体验权限。

DeepMind产品经理迭戈·里瓦斯表示，团队的目标是让尽可能多的用户体验到这项新功能。但他也明确指出，无论是街景集成还是Genie整体，目前仍处于实验阶段，在模拟的准确性与真实性方面仍有很长的路要走。

从谷歌团队展示的演示样本来看——包括对笔者曾居住街区进行的水下环境模拟——效果令人印象深刻，场景还原度较高。但整体观感更接近精致的游戏引擎画面，尚未达到照片级的真实感。此外，模型目前缺乏对物理规律的感知能力，即无法理解因果关系。例如，在一段模拟雪中奔跑的场景中，人物直接穿过了仙人掌和灌木丛。

相比之下，谷歌的图像生成模型Nano Banana已能在图表中准确生成文字，视频生成模型Veo也能理解纸船随波逐流、烟雾逐渐消散、布料覆盖物体等复杂物理规律。

值得注意的是，这些物理规律并非通过硬编码规则植入模型，而是模型通过海量数据的被动观察逐渐“习得”的，其过程类似于生命体对世界的认知学习。

对于模型的现状与未来，帕克-霍尔德给出了一个时间预期：“就这类世界模型而言，我认为它在输出准确性和视觉质量上，大概落后于当前顶尖的视频生成模型六到十二个月。但这无疑是我们终将解决的问题。”

谷歌地图总监乔纳森·赫伯特，一位12年前以实习生身份加入街景团队的资深成员，分享了他的见解。他认为，Genie目前还无法对一条街道进行完全精准的毫米级三维重建，但真正的技术突破在于AI展现出的“空间连续性”。当用户环顾360度后，AI能够正确记忆并模拟身后的环境，并在此基础上持续构建连贯的新场景。

“我们长期思考的核心命题是，如何基于街景数据，构建出对世界最丰富、最精准的数字化模型，”赫伯特说，“将地图数据以创新的方式应用于前沿AI研究，正是我们长久以来的愿景。”

Q&A

Q1：谷歌Genie世界模型是什么，有哪些功能？

Genie是谷歌DeepMind开发的通用世界模型，核心功能是生成多样化的交互式虚拟环境。用户可通过文本描述或上传图片作为提示，创建可交互的游戏世界。目前，Genie 3已向美国谷歌AI Ultra订阅用户开放，主要应用于教育模拟、游戏开发与机器人训练。接入街景数据后，新增了模拟真实街道场景及调整天气效果的能力。

Q2：街景数据接入Genie后，对Waymo自动驾驶训练有什么帮助？

Genie 3目前已为Waymo的模拟器提供技术支持，用于训练自动驾驶系统应对龙卷风、道路突发动物等极端罕见场景。与Waymo原有模拟器相比，接入街景数据的Genie不仅能基于真实地理位置构建高保真模拟世界，还能将训练视角从车辆灵活切换至行人或机器人等其他智能体，这有助于Waymo加速其全球城市拓展的布局与测试。

Q3：Genie的街景模拟目前有哪些局限性？

目前Genie的街景模拟在视觉效果上更接近高级电子游戏画面，尚未达到照片级的真实感。模型缺乏物理感知能力，无法理解物体间的因果关系，导致模拟中可能出现人物穿透障碍物等不合理现象。此外，对街道的完全精准三维重建尚未实现。研发人员评估，该模型在输出质量和准确性上，大约落后于顶尖视频生成模型六至十二个月。

来源：互联网

上一篇 杰克科技主力净流入794.85万，近5日股价涨2.85%成交额3.48亿 下一篇 OpenAI破解80年数学猜想：菲尔兹奖得主深度解读核心突破

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

谷歌Genie接入街景数据：真实街道场景模拟深度解析

摘要

Q&A

相关文章推荐