菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI资讯新闻 > 小鹏VLA智驾深度测评:日均58.8万亿Token如何重塑行业格局
热点资讯 小鹏 小鹏VLA智驾深度 第二代VLA

小鹏VLA智驾深度测评:日均58.8万亿Token如何重塑行业格局

2026-05-14
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

2026年3月16日,小鹏汽车举办了一场深度技术对话。创始人何小鹏与通用智能中心负责人刘

2026年3月16日,小鹏汽车举办了一场深度技术对话。创始人何小鹏与通用智能中心负责人刘先明,进行了一场两小时的“Ask Me Anything”直播,核心议题直指第二代视觉语言动作模型的正式推送。

这场直播传递了一个清晰的信号:依赖工程师手动编写海量规则代码的辅助驾驶开发模式,已成为历史。一个能够理解、推理并与物理世界交互的AI大模型时代,正拉开序幕。

这远非一次常规的OTA升级,而是一场彻底的自我革新。刘先明将其形容为“杀死自己,回炉重造”。背后是一场投入超20亿元、高峰期月耗近3亿元的豪赌,其目标是彻底告别过去十年的技术路径。

当小鹏决心颠覆过往,它究竟在构建怎样的未来图景?这场底层变革,又将如何重塑智能驾驶的竞争格局?

辅助驾驶的终极形态,应是“无感”的陪伴

何小鹏在直播中提及一个亲身体验:过去带母亲使用辅助驾驶时,系统的突兀制动和偶发卡顿,让家人难以完全信任。

这揭示了一个行业核心痛点:历经多年演进,为何高阶辅助驾驶对大多数用户而言,仍是充满不确定性的“科技玩具”,而非稳定可靠的“出行伙伴”?

问题的根源在于传统技术范式。

近十年来,主流方案将驾驶任务拆解为感知、预测、规划、控制等独立模块。工程师们为每个模块预设成千上万条“if-then”规则,如同为AI准备了一份详尽的应试题库。这套方法在规则明确的高速场景下解决了有无问题,但面对城市场景的无限复杂性时,其天花板迅速显现。

无论是缺失车道线的乡道、人车混行的狭窄街巷,还是临时设置的施工围挡,规则系统一旦无法匹配预设条件,便会陷入困惑或采取保守的急刹策略。它缺乏人类驾驶员基于常识的预判与理解能力,无法解读微开车门背后的风险,也难以应对交警的现场手势指挥。

这直接导致了用户体验的四大短板:安全感缺失、能力边界清晰、通行效率低下,以及场景表现不可预测。

“顶级的智能驾驶应该像白开水,无处不在却又让人浑然不觉。”刘先明的比喻,精准概括了新范式的追求。

小鹏的答案是原生第二代VLA模型。它摒弃了对高精地图的依赖,也跳出了人工规则的桎梏。其工作逻辑更趋近于人类:通过“视觉”观察环境,经由“大脑”模型进行实时推理与决策,最终输出驾驶动作。

一个标志性的“14秒自主绕行”测试视频展现了这种能力。面对导航未提示的道路封锁,车辆未请求接管,而是经过短暂的环境分析与路径推演,自主找到了可行的绕行方案。这种基于理解的动态决策能力,被定义为传统代码难以实现的“智能涌现”。

这场革命的本质,是从“指令式编程”到“认知智能”的范式跃迁。小鹏不再试图穷举所有规则,而是致力于赋予机器理解物理世界底层规律的能力。

20亿投入背后:一场关于效率与泛化的豪赌

若将特斯拉FSD视为全球技术参照系,小鹏第二代VLA的目标,则是打造一个更精通中国复杂路况的本地化标杆。

传统辅助驾驶系统的信息流存在“翻译损耗”。摄像头捕捉的红灯图像,需先被识别、编码,再转化为控制指令,过程如同脑中进行外语翻译,延迟高且动作生硬。

第二代VLA的核心突破在于“端到端”重构,以近乎“暴力”的效率消除了中间环节。视觉信号经由大模型处理,直接映射为驾驶动作,实现了感知与决策的一体化。

在小鹏的技术框架中,智驾能力上限由“模型 × 算力 × 数据 × 车辆平台”共同决定。

第二代VLA的基座是一个720亿参数的庞大模型。与过去仅学习驾驶行为不同,新模型旨在构建一个内置物理规律的“世界模型”。重力、摩擦力、光影变化等成为模型的先天常识。它不仅能识别物体,更能通过长思维链推理,理解“路面湿滑将导致制动距离延长”这类因果关系。

训练这一模型需要巨量资源。小鹏构建了由3万张AI芯片组成的算力集群,研发投入在高峰期达到每月3亿元。

在车端,自研的图灵AI芯片与模型、编译器深度协同优化,将关键推理任务的延迟从通用芯片的800毫秒压缩至80毫秒。据称,其单芯片有效算力约等于10颗英伟达Orin-X。这种软硬一体的垂直整合,是复杂模型得以实时车端运行的关键。

算力是引擎,数据则是燃料。小鹏披露了一组对比数据:2026年2月某周,国内主流大模型的周调用量约为5.16万亿Token,而第二代VLA模型的日均Token调用量高达58.8万亿。这种高密度、高质量的数据“投喂”,是模型快速迭代的基础。

同时,一个日均可模拟3000万公里行驶的仿真系统,持续生成各种极端、罕见的长尾场景,供AI在虚拟世界中反复锤炼。由此构建的“云端模型工厂”,实现了每五天一次的全链路迭代。自2025年科技日以来的130天内,已迭代超过400个模型版本。AI的进化节奏,正从“以年计”加速至“以天计”。

横跨5000公里:一场定义泛化能力的终极路测

任何前沿技术,都需在真实路况中接受严苛检验。

在第二代VLA推送前,一场从新疆喀什到上海、全程超5000公里的极限挑战正在进行。这条路线覆盖高速、国道、城市道路、乡村土路,并遭遇沙尘、大雪、横风等极端天气,堪称中国路况的完整剖面。

挑战首日,测试车辆在复杂路况与恶劣天气交织下,完成了超1000公里行程,实现全程“零接管”。相较于依赖固定规则的传统系统,第二代VLA凭借更接近人类的认知与决策逻辑,在动态混乱场景中展现出更强的适应性与从容度。

其底层逻辑在于,模型学习的是通行物理世界的通用规律,而非特定区域的交规合集。因此,只要具备基本道路条件,它便能像经验丰富的司机一样,实现“有路即可通行”。

对用户而言,最直接的体验提升在于“驾驶情绪稳定指数”。据小鹏内部测试,在同等复杂路况下,第二代VLA带来的综合体验提升接近5倍。这意味着更少的突兀制动、更果断的决策以及更低的人工接管需求。

这正是实现“让家人安心使用”愿景的技术基石:安全是底线,而丝滑、可预期、人性化的体验,才是建立长期用户信任的核心。

据悉,自3月19日起,小鹏将逐步向P7 Ultra、G7及X9 Ultra等车型推送第二代VLA。何小鹏承诺,量产版本的体验将“更为稳定、一致”。对于更广泛的Max版车型用户,一款能力对标行业顶尖L2水平的“蒸馏版”软件,也将在下半年提供。

未来十年:汽车进化为“一体化超级智能体”

如果说VLA主要攻克了“车如何自动驾驶”的难题,那么小鹏的长期布局,显然超越了驾驶本身。

今年初,小鹏完成了一次关键的组织整合:将智能座舱中心与自动驾驶中心合并,成立“通用智能中心”,由刘先明统一领导。

这一调整指向一个明确的技术趋势——舱驾深度融合。其终极形态,是让汽车进化成为一个完整的、可自主交互与行动的“超级智能体”。

可以设想这样一个场景:当你对车辆说出“我有点累,想在前面那家看起来不错的咖啡馆停一下”,系统不仅能理解语义意图,还能通过VLA的视觉能力实时识别并评估沿途咖啡馆,随后自动规划路径、安全驶入车位。座舱交互与车辆驾驶,被同一智能大脑无缝衔接。

这也印证了何小鹏的判断:“上一个十年属于电动化,下一个十年将属于智能经济体。此刻忽视‘智能体+汽车’的融合,无异于十年前错过电动化浪潮。”

这个统一的物理AI技术底座,其价值将辐射至汽车之外,同步赋能小鹏在Robotaxi、飞行汽车及人形机器人等领域的探索。从这个视角看,第二代VLA的发布不仅是一次产品迭代,更是小鹏为未来十年投身“物理AI世界”所构建的核心基石。

据了解,目前已有海内外多家车企就第二代VLA技术展开接触与洽谈。何小鹏表示,对其技术的全球场景泛化能力与系统鲁棒性抱有充分信心。

在定义下一个十年的物理AI核心赛道上,中国企业已经全面提速。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多