全新具身大模型推荐:越疆空弈DobotWAM深度评测
摘要
机器人学习动作与构建数据模型的最大痛点,并非学不会,而是“只会一招”——场景一变
机器人学习动作与构建数据模型的最大痛点,并非学不会,而是“只会一招”——场景一变就失效。这一行业顽疾长期无解。近日,深圳具身智能企业越疆科技发布自研世界动作模型空弈DobotWAM具身大模型,用实打实的数据给出突破方案:该模型在全球公认的具身智能标准评测基准LIBERO上,四个标准任务套件平均成功率高达99.25%,综合排名第一。

这标志着从“动作复现”到“动作理解”的关键跃迁。基于视觉-语言-动作(VLA)建模框架,空弈DobotWAM引入三项核心机制,完成四项关键技术的系统升级。
拆解来看,越疆在空弈DobotWAM中做了四件事:第一,用3D空间表征替换纯2D图像纹理,让机器人不再只看“平面图”,而是直接显式感知物体的位置与几何结构——相当于赋予机器人立体视觉深度;第二,引入关节动态几何损失,将每个关节的运动状态与末端执行器所受的几何约束一并融入训练,这一步能显著减少轨迹漂移与抓取失败;第三,高级VLM任务拆解机制对复杂语言指令进行语义分层,避免机器人“听懂局部指令、搞砸全局任务”;第四,构建高品质数据飞轮+真机复盘闭环,用真实机器人反复试验的数据持续反哺模型,大幅提升算法从仿真到真实环境的迁移能力。
越疆团队明确表示,这套体系的核心目标不只是让机器人学会“模仿动作”,更是理解“动作为什么这么做”。
效果如何?看几项高精度接触作业测试。在多场景分类抓取任务中,空弈DobotWAM能在完全非结构化的场景下精准定位小目标,完成姿态估计,稳定抓取各类物体。再如插充电器——全程自主完成目标定位、轴线对齐、精准插入,尤其在双臂协作旋转调整姿态时,机械臂动作连贯流畅。还有插笔帽这类看似简单实则需极高精度的操作,模型能准确判断笔身与笔帽的相对位置和开口方向,全程无滑脱、无推倒,稳定完成精细插入。
这三项任务分别考验小目标定位、强几何约束下的末端控制能力,以及实时误差修正能力。
从战略维度看,越疆近三年完成了从协作机器人到具身智能的产品跃迁。空弈DobotWAM的发布,标志着这家企业已从“全球协作机器人第一”向“具身智能头部企业”硬核迈进。更重要的是,公司指明了具身智能的真实演进方向——不是预设轨迹的舞蹈、翻跟头等表演性动作,而是插接、抓取、对准这类直面物理世界的“硬核任务”。
更值得关注的是,这套模型并未停留在实验室。空弈DobotWAM已搭载在越疆人形机器人上,并实现商业化落地:电影院里的爆米花机器人,单日工作14小时;汽车产线的夜班工序中,能够自主排障。这些真实场景的“答卷”比任何理论验证都更有说服力。
未来越疆将持续迭代空弈DobotWAM,推动机器人从“能看懂、能行动”,迈向“能适应、能泛化、能长期可靠执行”——这才是具身智能真正的终极目标。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。