菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > 对话余轶南:5亿融资后,如何5个月实现Demo到量产跨越
热点资讯

对话余轶南:5亿融资后,如何5个月实现Demo到量产跨越

2026-05-13
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

5月11日,消费级具身智能赛道传来一则重磅消息:Vbot维他动力宣布完成近5亿元Pre-A轮融资

5月11日,消费级具身智能赛道传来一则重磅消息:Vbot维他动力宣布完成近5亿元Pre-A轮融资。这笔由东方嘉富、华泰紫金、复星锐正联合领投,尚颀资本、明荟致远跟投,老股东凯辉基金、今日资本、高瓴创投继续加持的融资,创下了国内该赛道迄今为止的单笔融资纪录。

这笔钱怎么花?方向很明确:提升大规模量产产能、铺设全国销售网络,以及投入新一代全尺寸人形机器人的研发。目前,Vbot团队规模已超百人,从产品设计、软硬件研发、AI算法到供应链、生产制造、销售与服务,形成了完整的全栈能力闭环。

比融资数字更值得关注的,是交付的落地。Vbot首款超能机器狗首批500台已正式量产下线,通过微信小程序和京东平台发货;5月计划完成1500台交付,6月产能将爬升至每月2500台。与此同时,上海长宁来福士、北京蓝色港湾的线下体验店已开门迎客,本月还将入驻京东Mall、山姆会员店等全国核心零售渠道,覆盖范围将超过10个省市。

从工程样机到合格产品,Vbot用了5个月时间,解决了上千个软硬件bug,甚至将关键结构件的强度做到了汽车标准的5倍,才算真正跨过量产这道坎。而更令人意外的是用户数据:核心用户日均交互超过80次,日活稳定在2小时以上,有的用户甚至养成了早晚各“遛”一次机器狗的习惯。

图片拍摄于 2025 年 10 月,产品为工程样机|图片来源:维他动力

为什么是Vbot率先跑通了消费级具身智能的量产闭环?真实用户到底在用机器狗做什么?选择先做四足再攻人形的路径,背后是怎样的商业思考?具身智能的终局又指向何方?

带着这些问题,我们与Vbot维他动力创始人兼CEO余轶南博士进行了一次深度对话。以下是经过编辑的对话实录。

一、做物理世界的机器人,量产才是最大的难关

问及本轮融资最被看重的核心,余轶南的答案很直接:全栈闭环能力。“我们用一年半时间证明了,能把这件事从头到尾跑通。从产品设计、研发到供应链、生产制造、销售交付,整个链条都打通了。”他强调,具身智能不是单点技术,而是硬件、软件、算法与商业的完整闭环,缺乏全栈能力的团队往往止步于量产之前。

公司成立于2024年底,至今已完成四轮融资。但在余轶南看来,这个节奏在飞速发展的具身智能行业“真不算快”。“我们中间停了一段时间,全力投入产品开发和渠道建设。这一轮融资的核心节点就是量产。今年还会再融,因为这个行业跑得太快,必须有足够的弹药。”

量产之路远比想象中艰难。从去年四五月的demo,到今年能批量交付的合格产品,中间横亘着一道“巨大的鸿沟”。去年年底发布产品并开启预定,到今年4月底开启全款支付,中间整整5个月,团队进行了三轮完整的产线试制,所有零部件开模并做大规模准入测试,解决了上千个软硬件bug。

“这个过程非常痛苦,但真正能走出来的企业才会有市场。”余轶南坦言,大部分硬件创业公司都倒在这个阶段,“尤其是做物理世界的机器人,量产才是最大的难关。”

他举了一个具体例子:结构件强度。基于十年汽车产业的经验,团队最初按照汽车的最高标准来设计,但测试结果却完全不够用。“机器人一直在运动,关节不断承受地面冲击。我们最后测出,某些关键部件的强度峰值要求,是汽车的5倍。”而且,机器人材料还必须兼顾轻量化,不能使用过重的钢材。反复迭代材料与工艺后,问题虽然解决,但代价是成本上升和交付推迟。

首批500台 Vbot 超能机器狗在 Vbot 超能工厂正式量产下线|图片来源:维他动力

面对即将从每月1500台提升至2500台的产能爬坡,供应链和品控能否跟上?余轶南表示已做足准备,核心策略是“品控前移”——直接管控上游一级核心供应商的生产工艺和出厂检测,配备专用检测设备,制定严格流程,将有问题的部件拦截在生产端。“现在零部件良品率已提升到非常好的水平,组装效率也在提高,6月做到2500台/月完全没有问题。”

二、用户比我们想象的更爱它:日均交互80次

首批用户数据出炉,画像与团队此前的预判高度吻合。在产品推出前,团队曾调研200位四足机器人用户,总结出核心特征:超过50%为有6-12岁孩子的三口或五口之家;绝大多数是新能源汽车和iPhone用户;属于“科技敏感型”而非价格敏感型,愿意为中高端价格带的优质技术产品买单。唯一超出预期的是,购买给老人作陪伴的家庭占比也相当高。

图片来源:维他动力

更令人惊讶的是用户的实际使用数据。核心用户日均使用时长达到4-6小时,包括在家交互和户外“遛狗”;日均交互次数超过80次。这个数字是什么概念?智能汽车的日均交互通常在十几次,手机AI助手也就二三十次,且多为功能指令。而Vbot的用户与机器狗之间是聊天式交互,一来一回,小朋友甚至可以连续对话几十个回合。

日活也相当稳定,并非新鲜感过后就闲置。“很多用户真的把它当成了家庭一员,每天早晚各遛一次,就像对待真狗一样。”

功能使用方面,陪伴娱乐位居首位,尤其受儿童欢迎。教育功能则是许多家长的心头好——机器狗不仅能讲解课本知识,更能全程用英文与孩子对话,这种沉浸式语言学习效果远超书本。此外,远程视频、家庭安防、老人守护等功能的使用率也很高。

用户行为也存在意料之外的惊喜。C端用法基本在预期内,但B端需求却成为意外收获。由于产品硬件配置高、性价比突出,许多行业客户主动找上门,将机器狗用于二次开发,覆盖物业、工厂、农业、仓储等巡检场景,乃至农药喷洒、管道检测等。“这一点特别像大疆,本是C端无人机,却衍生出大量行业应用。”余轶南类比道。

这让他联想到拓竹3D打印的发展路径:在拓竹之前,3D打印市场以B端为主;拓竹将C端产品做好后,C端市场占比已飙升至八成,出货量远超所有工业3D打印公司的总和。“具身智能很可能走同样的路。”不过他也指出,目前B端需求占比仍不足5%,C端仍是绝对核心。长期来看,C端市场规模也必然远大于分散且单场景需求量有限的B端。

商业模式目前以硬件销售为主。“现阶段核心目标是出货量、规模和用户满意度。”余轶南介绍,整机价格已包含基础4G流量和AI Token费用,能满足大部分用户需求。对使用量极大的用户,则提供每月几十元的增值服务包。未来商业模式将分为三层:硬件销售、周边配件、软件订阅与应用服务。“第三层将是最大的市场,就像手机上的APP生态。我们已经看到用户在购买配件,未来会持续丰富生态。”

三、为什么先四足后人形?Vbot要做的是生活空间机器人平台

Vbot机器狗被称为“行业顶配”,这一定位体现在四个核心方面:

第一,高功率密度关节电机,动力比行业平均水平高出近50%;第二,极简传感器配置,遵循第一性原理,仅采用一对双目摄像头、一个激光雷达和四麦克风阵列;第三,594Wh高能量密度电池,实现4-5小时续航,达到行业领先水平;第四,也是最重要的一点,端侧搭载了128TOPS的AI算力。

“目前行业里很多机器狗,甚至部分人形机器人,端侧算力只有5-10TOPS,更多只能完成基础运动控制。”余轶南解释道,“但家庭场景的机器人需要同时处理环境理解、语音交互、多模态感知和实时决策,对端侧算力要求极高。只有把算力拉满,才能让用户获得无感的交互体验。”这四点结合,使产品在硬件上达到了标杆级水平,同时实现了优秀的成本控制。

团队将产品定义为“具身智能平台”,而非单一硬件。历史上的电子产品分为两类:功能型产品(如相机、录音笔)和平台型产品(如PC、手机)。机器人无疑属于后者。机器狗的移动、交互、负重、导航等能力是平台基础,本身不直接产生价值,但在此之上可以生长出无数应用:家居中控、非接触健康监测、老人陪伴、儿童教育、随行跟拍、小件递送、宠物远程照顾、AI交互编程等等。

“过去一年我们主要完成了平台本身的开发,今年重点将放在应用侧,把平台价值做厚。”余轶南说。

面对行业竞相押注人形机器人的热潮,Vbot为何选择先做四足?余轶南认为这是商业路径的选择问题。“具身智能面临两大不确定性:技术不确定性和商业不确定性。我们希望先解决商业的确定性,再攻克技术的不确定性。”四足机器人的软硬件架构相对成熟,能最快打通从供应链到销售的全链条,验证市场需求。而且,做四足所积累的电子电器架构、传感器、供应链、操作系统、AI模型、数据飞轮等核心能力,可以100%复用到人形机器人上。

“很多公司先做人形,结果就是demo做了一个又一个,永远无法量产,也无法验证商业价值。我们先把四足做起来,有了收入、用户和数据,再做人形就会顺理成章得多。”

人形机器人的研发已在推进中,今年将推出样机。余轶南的目标很明确:“既要好看,又要好用。”他认为,市场上大多数人形机器人要么被视为进工厂干活的工具,无需注重美观;要么被看作玩具,不必强调实用。但伟大的产品一定是既好看又好用又好玩的,如同iPhone和Mac。人形机器人最适合商场、餐厅、写字楼、公共设施及家庭等需要与人打交道的场景,美观至关重要,同时它又必须能解决实际问题。

技术布局聚焦三个核心方向:全尺寸人形机器人本体研发,兼顾运动与任务能力;手足一体的世界模型研发,覆盖通用操作与移动能力;以及Agentic OS架构的具身智能系统研发,作为未来承载所有应用的机器人操作系统。

“现在整个行业的技术路线正从发散走向收敛。”余轶南总结道。硬件上,关节电机、传感器、灵巧手等技术快速成熟;软件上,三层模型架构日益清晰:上层是VRL模型负责意图理解和任务规划(0.1-1Hz);中间是隐空间世界模型负责感知、记忆和预测(10-20Hz);下层是反应式视觉语言动作模型负责实时控制(50-100Hz以上)。“谁能把这个技术链条整合成完整系统,谁就能拿到通往终局的钥匙。”

四、未来,物理AI的通用模型会不会出现?

消费级机器人常被视作“玩具”,如何看待这种认知?余轶南认为无需刻意消解。“好玩本身就是一个非常重要的价值,甚至比有用更重要。你会发现,今天纯粹的刚需品反而不好卖,又好玩又好用的东西才最好卖。”关键在于,产品不能只是纯玩具。“如果花一万多买个只能玩三个月的玩具,大部分消费者不会买单。产品必须既好玩又有用,才能成为家庭的标配。”

隐私安全是另一个焦点。Vbot确立了三条基本原则:第一,非必要不上传数据,所有能在端侧处理的均在端侧完成并脱敏;第二,所有数据上传必须获得用户明确授权;第三,即使数据上传云端,所有权完全属于用户,未经授权绝不使用。“这是全球通用原则,也是我们做产品的底线。”

展望2026年,如果整个行业只能验证一个关键问题,会是什么?余轶南的答案是:物理世界是否存在一个通用的AI模型,能够适配所有场景和所有机器人本体?

互联网大模型已证明,一个通用模型可以完成数字世界中的多场景任务。但在物理世界,这件事尚未被验证。机器人面对的是千差万别的真实环境:不同的家庭、空间、机器人形态乃至运动方式。“未来到底能不能有一个通用的物理AI模型,同时适配这些复杂场景和不同机器人?如果有,整个具身智能行业的发展速度,会比我们想象的快得多。”

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多