您的位置 : 资讯 > 其他资讯 > 高德ABot-World登顶四项权威评测，全球唯一在物理合规性、动作可控性、零样本泛化均达第一的世界模型

高德ABot-World登顶四项权威评测，全球唯一在物理合规性、动作可控性、零样本泛化均达第一的世界模型

来源：菜鸟下载 | 更新时间：2026-04-28

高德发布开放环境全自主具身机器人“途途”，ABot全栈技术体系首次亮相 4月19日，北京亦

高德发布开放环境全自主具身机器人“途途”，ABot全栈技术体系首次亮相

4月19日，北京亦庄的一场机器人半程马拉松见证了行业里程碑。阿里巴巴旗下高德正式发布了全球首款面向开放环境的全自主具身机器人——“高德途途”。这款四足机器人不仅完成了复杂避障与密集人群穿行，其核心突破在于成功协助视障人士完成了实际路线导航。这标志着具身智能技术首次真正跨越了从实验室封闭环境到真实开放世界的鸿沟。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

途途能够胜任导盲这类高可靠性场景，其底层支撑是高德全新发布的ABot全栈具身技术体系。该体系的优势在于，它基于海量真实场景与千万级多模态数据，将高德积累多年的空间智能资产高效转化为具身模型的核心训练资源。这宣告了全球首个以通用人工智能（AGI）为目标的全栈具身技术体系正式落地。

在架构层面，ABot体系摒弃了传统“单点拼凑、封闭验证”的碎片化路径。它以AGI为核心，首次将数据引擎、基座模型与执行中枢深度耦合为统一系统。目前，高德ABot系列模型已在全球15项权威基准测试中取得领先水平（SOTA），技术实力得到验证。

ABot体系：三层飞轮式闭环，驱动具身智能持续进化

ABot体系如何运作？其核心是一个由数据、模型、应用三层构成的闭环飞轮设计。这不是简单的功能叠加，而是深度咬合、互为驱动的精密结构，实现了“数据驱动模型、模型服务应用、应用反哺数据”的良性循环。这一设计精准解决了数据稀缺、仿真鸿沟与技能泛化三大行业瓶颈，构建了能够自我迭代的完整进化闭环。

数据是具身智能的“燃料”，决定了其泛化能力上限。但真机采集成本高昂，难以规模化。如何破局？

作为数据层核心，ABot-World提供了解决方案。它通过批量合成视频、深度、点云、轨迹四类训练数据，结合强化学习引擎在虚拟环境中定义奖惩、反复试错。本质上，它以高保真仿真替代昂贵真机采集，弥合了仿真与现实的鸿沟，将数据成本降低了数个数量级。

模型层聚焦解决两大挑战：具身操作的通用性与导航的长程性。其核心是感知与决策的协同。ABot-M专精操作，ABot-N负责导航，两者分工训练，再通过“模型技能”机制组合调用，从而协同完成长程复杂任务。

应用层的核心是具身版“龙虾”——ABot-Claw。它将异构机器人统一于共享认知框架下，打造了具备调度、记忆、分层控制与社会对齐能力的“执行中枢”。这直接应对了长程任务闭环难、知识不共享等行业痛点。

ABot体系的设计逻辑沿袭自高德成熟的空间智能飞轮。依托近10亿月活场景产生的海量时空数据与实时反馈，算法在闭环中持续迭代，推动模型对物理世界的认知不断深化。这个飞轮每日在真实世界中自动演进，构成了高德的体系化优势：不依赖单点技术突破，而是依靠整个飞轮在真实场景中持续运转的“转速”来建立竞争壁垒。

ABot-World：物理合规性、动作可控性、零样本泛化三大维度全球领先

当主流世界模型仍受困于“视觉幻觉”与动力学脱节时，ABot-World实现了关键突破。它成为全球首个将物理定律深度嵌入生成全流程的可微分、可进化动力学引擎。作为ABot体系的底层仿真基座，它直接决定了上层模型的物理一致性与泛化上限。正是以该引擎为核心，ABot体系才彻底打通了“虚拟训练-真实部署”的闭环。

架构上，ABot-World专为具身智能设计了14B DiT架构，以观测与动作为输入，在潜空间直接生成符合时空动力学的未来状态序列。同时，基于千万级真实数据与多层级采样治理，它成功突破了单一任务的泛化限制。

场景构建上，其3DGS冷启动空间基座面向手机拍摄、航测图等稀疏输入，通过“粗建模、高保真修复再到蒸馏回环”的自动化流程，能将低质量视频转化为高质量3D场景，大幅降低了数据构建成本。

训练方面，模型首创了Diffusion-DPO物理偏好对齐框架，由视觉语言模型生成物理规则清单并独立判别，构建优劣样本对，从而驱动模型主动抑制违反物理规律的行为。同时，拉格朗日动力学与3DGS重建的融合，使得每一帧画面都成为包含质量、摩擦、接触力等属性的可微分物理快照。

此外，ABot-World构建了“训练+数据”双引擎并行架构，实现了模型自进化。依托自有地图与脱敏数据，结合3DGS技术实现厘米级重建与光照一致性，系统已累计生产了万级3D真实场景、百万级推理数据与千万级训练轨迹，覆盖了99%的典型生活场景。通过接入视觉语言-动作闭环，模型实现了“预测即训练，演练即学习”的持续进化，并通过跨形态动作映射，统一支持多种机械形态的精确控制。

在PBench、EZSbench、WorldArena、Agibot World Challenge等主流评测中，ABot-World持续保持领先，并且是唯一在物理合规性、动作可控性、零样本泛化三大维度均达到SOTA的模型。

ABot-N & ABot-M：ABot体系的“运动双核”，跨本体导航与操作基座斩获11项SOTA

若将ABot全栈体系视为具身智能的“运行大脑”，那么ABot-N与ABot-M便是其关键的“运动双核”。它们分别掌管机器人的“导航”与“操作”，直接响应物理世界中“去哪里”与“做什么”的基础指令。依托统一架构设计，高德打造了可解耦又可协同的专用基座模型，一举突破了跨形态适配与跨任务泛化的技术瓶颈。

作为全球首个实现五大核心导航任务“大一统”的视觉语言-动作基座模型，ABot-N具备了意图理解、自主决策与持续进化的能力，是途途走向开放世界的核心导航引擎。它采用层级式“大脑-动作”架构，通过多模块协同实现单一模型对导航任务的全覆盖，打破了传统专用架构的泛化限制。

ABot-N推出后，迅速在VLN-CE（R2R/RxR）、HM3D-OVON、EVT-Bench等7大权威基准上全面刷新SOTA，在导航精度、社会合规性、零样本泛化能力上实现了显著领先。

另一方面，ABot-M是全球首个统一架构的具身操作基座模型。其目标明确：实现一个“通用大脑”适配多种机器人形态，从而大幅提升操作模型在异构机器人和多样化任务场景下的泛化能力。

为此，ABot-M提出了全球首个动作流形学习，将学习目标从去噪重构转为流形投影，显著提升了动作生成的稳定性与解码效率，在高自由度全身控制等复杂场景中展现出更强的可扩展性。在感知端，它采用语义流和动作流双流并行的架构，有效提升了精细操作的执行精度。

在LIBERO、LIBERO-Plus、RoboCasa GR1、RoboTwin 2.0等主流评测中，ABot-M全面超越了π0.5、UniVLA、OpenVLA-OFT等强基线，在泛化能力、鲁棒性与跨形态迁移三个维度实现了系统性领先。

此外，ABot-N与ABot-M的多项子成果已入选ICLR、CVPR等顶级学术会议，成为精确、高效、安全的机器人导航与操作领域的范式参考。

ABot-Claw：首创“Map as Memory”的通用集中式Harness架构

记忆是机器人跨越认知与执行鸿沟的基石。传统机器视觉受限于“视野之外即未知”，记忆碎片化，严重制约了泛化能力。

为突破这一瓶颈，ABot-Claw首创了“Map as Memory”理念，重构了具身智能的记忆机制。作为ABot体系的“执行中枢”，ABot-Claw采用集中式Harness架构，将高德地图与用户私有地图设为全局认知锚点，把多模态感知数据统一映射至共享语义空间，形成可动态刷新、持久沉淀的“世界记忆”。新终端接入后，仅需读取全局上下文即可零成本继承环境认知，彻底打破了场景孤岛。

同时，ABot-Claw采用“云端大脑—边缘响应”两级设计，兼顾了智能深度与执行可靠性。在调度层面，该架构支持多种异构机器人的并行协作与任务接力，故障时自动接续，实现了任务上下文的无缝移交与跨形态协作。这标志着机器人系统正从“单体智能”向“体系智能”演进，机器人成为共享记忆、统一调度、协同进化的智能网络节点。

ABot-Claw还首创了闭环反馈与纠错机制，在模糊指令理解、跨机导引等复杂场景中，充分验证了其鲁棒性与泛化能力。

伴随高德途途的全球首秀，高德同步宣布将开源ABot全体系。这不仅是对“AMAP AI Inside”核心理念的深度践行，也将重塑具身智能的研发范式，加速AGI时代的到来。一个由开放、协同的智能体驱动的未来，正在加速成为现实。

菜鸟下载发布此文仅为传递信息，不代表菜鸟下载认同其观点或证实其描述。

展开

更多>>