热点资讯小鹏小鹏VLA智驾深度第二代VLA

小鹏VLA智驾深度测评：日均58.8万亿Token如何重塑行业格局

2026-05-14

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

2026年3月16日，小鹏汽车举办了一场深度技术对话。创始人何小鹏与通用智能中心负责人刘

2026年3月16日，小鹏汽车举办了一场深度技术对话。创始人何小鹏与通用智能中心负责人刘先明，进行了一场两小时的“Ask Me Anything”直播，核心议题直指第二代视觉语言动作模型的正式推送。

这场直播传递了一个清晰的信号：依赖工程师手动编写海量规则代码的辅助驾驶开发模式，已成为历史。一个能够理解、推理并与物理世界交互的AI大模型时代，正拉开序幕。

这远非一次常规的OTA升级，而是一场彻底的自我革新。刘先明将其形容为“杀死自己，回炉重造”。背后是一场投入超20亿元、高峰期月耗近3亿元的豪赌，其目标是彻底告别过去十年的技术路径。

当小鹏决心颠覆过往，它究竟在构建怎样的未来图景？这场底层变革，又将如何重塑智能驾驶的竞争格局？

辅助驾驶的终极形态，应是“无感”的陪伴

何小鹏在直播中提及一个亲身体验：过去带母亲使用辅助驾驶时，系统的突兀制动和偶发卡顿，让家人难以完全信任。

这揭示了一个行业核心痛点：历经多年演进，为何高阶辅助驾驶对大多数用户而言，仍是充满不确定性的“科技玩具”，而非稳定可靠的“出行伙伴”？

问题的根源在于传统技术范式。

近十年来，主流方案将驾驶任务拆解为感知、预测、规划、控制等独立模块。工程师们为每个模块预设成千上万条“if-then”规则，如同为AI准备了一份详尽的应试题库。这套方法在规则明确的高速场景下解决了有无问题，但面对城市场景的无限复杂性时，其天花板迅速显现。

无论是缺失车道线的乡道、人车混行的狭窄街巷，还是临时设置的施工围挡，规则系统一旦无法匹配预设条件，便会陷入困惑或采取保守的急刹策略。它缺乏人类驾驶员基于常识的预判与理解能力，无法解读微开车门背后的风险，也难以应对交警的现场手势指挥。

这直接导致了用户体验的四大短板：安全感缺失、能力边界清晰、通行效率低下，以及场景表现不可预测。

“顶级的智能驾驶应该像白开水，无处不在却又让人浑然不觉。”刘先明的比喻，精准概括了新范式的追求。

小鹏的答案是原生第二代VLA模型。它摒弃了对高精地图的依赖，也跳出了人工规则的桎梏。其工作逻辑更趋近于人类：通过“视觉”观察环境，经由“大脑”模型进行实时推理与决策，最终输出驾驶动作。

一个标志性的“14秒自主绕行”测试视频展现了这种能力。面对导航未提示的道路封锁，车辆未请求接管，而是经过短暂的环境分析与路径推演，自主找到了可行的绕行方案。这种基于理解的动态决策能力，被定义为传统代码难以实现的“智能涌现”。

这场革命的本质，是从“指令式编程”到“认知智能”的范式跃迁。小鹏不再试图穷举所有规则，而是致力于赋予机器理解物理世界底层规律的能力。

20亿投入背后：一场关于效率与泛化的豪赌

若将特斯拉FSD视为全球技术参照系，小鹏第二代VLA的目标，则是打造一个更精通中国复杂路况的本地化标杆。

传统辅助驾驶系统的信息流存在“翻译损耗”。摄像头捕捉的红灯图像，需先被识别、编码，再转化为控制指令，过程如同脑中进行外语翻译，延迟高且动作生硬。

第二代VLA的核心突破在于“端到端”重构，以近乎“暴力”的效率消除了中间环节。视觉信号经由大模型处理，直接映射为驾驶动作，实现了感知与决策的一体化。

在小鹏的技术框架中，智驾能力上限由“模型 × 算力 × 数据 × 车辆平台”共同决定。

第二代VLA的基座是一个720亿参数的庞大模型。与过去仅学习驾驶行为不同，新模型旨在构建一个内置物理规律的“世界模型”。重力、摩擦力、光影变化等成为模型的先天常识。它不仅能识别物体，更能通过长思维链推理，理解“路面湿滑将导致制动距离延长”这类因果关系。

训练这一模型需要巨量资源。小鹏构建了由3万张AI芯片组成的算力集群，研发投入在高峰期达到每月3亿元。

在车端，自研的图灵AI芯片与模型、编译器深度协同优化，将关键推理任务的延迟从通用芯片的800毫秒压缩至80毫秒。据称，其单芯片有效算力约等于10颗英伟达Orin-X。这种软硬一体的垂直整合，是复杂模型得以实时车端运行的关键。

算力是引擎，数据则是燃料。小鹏披露了一组对比数据：2026年2月某周，国内主流大模型的周调用量约为5.16万亿Token，而第二代VLA模型的日均Token调用量高达58.8万亿。这种高密度、高质量的数据“投喂”，是模型快速迭代的基础。

同时，一个日均可模拟3000万公里行驶的仿真系统，持续生成各种极端、罕见的长尾场景，供AI在虚拟世界中反复锤炼。由此构建的“云端模型工厂”，实现了每五天一次的全链路迭代。自2025年科技日以来的130天内，已迭代超过400个模型版本。AI的进化节奏，正从“以年计”加速至“以天计”。

横跨5000公里：一场定义泛化能力的终极路测

任何前沿技术，都需在真实路况中接受严苛检验。

在第二代VLA推送前，一场从新疆喀什到上海、全程超5000公里的极限挑战正在进行。这条路线覆盖高速、国道、城市道路、乡村土路，并遭遇沙尘、大雪、横风等极端天气，堪称中国路况的完整剖面。

挑战首日，测试车辆在复杂路况与恶劣天气交织下，完成了超1000公里行程，实现全程“零接管”。相较于依赖固定规则的传统系统，第二代VLA凭借更接近人类的认知与决策逻辑，在动态混乱场景中展现出更强的适应性与从容度。

其底层逻辑在于，模型学习的是通行物理世界的通用规律，而非特定区域的交规合集。因此，只要具备基本道路条件，它便能像经验丰富的司机一样，实现“有路即可通行”。

对用户而言，最直接的体验提升在于“驾驶情绪稳定指数”。据小鹏内部测试，在同等复杂路况下，第二代VLA带来的综合体验提升接近5倍。这意味着更少的突兀制动、更果断的决策以及更低的人工接管需求。

这正是实现“让家人安心使用”愿景的技术基石：安全是底线，而丝滑、可预期、人性化的体验，才是建立长期用户信任的核心。

据悉，自3月19日起，小鹏将逐步向P7 Ultra、G7及X9 Ultra等车型推送第二代VLA。何小鹏承诺，量产版本的体验将“更为稳定、一致”。对于更广泛的Max版车型用户，一款能力对标行业顶尖L2水平的“蒸馏版”软件，也将在下半年提供。

未来十年：汽车进化为“一体化超级智能体”

如果说VLA主要攻克了“车如何自动驾驶”的难题，那么小鹏的长期布局，显然超越了驾驶本身。

今年初，小鹏完成了一次关键的组织整合：将智能座舱中心与自动驾驶中心合并，成立“通用智能中心”，由刘先明统一领导。

这一调整指向一个明确的技术趋势——舱驾深度融合。其终极形态，是让汽车进化成为一个完整的、可自主交互与行动的“超级智能体”。

可以设想这样一个场景：当你对车辆说出“我有点累，想在前面那家看起来不错的咖啡馆停一下”，系统不仅能理解语义意图，还能通过VLA的视觉能力实时识别并评估沿途咖啡馆，随后自动规划路径、安全驶入车位。座舱交互与车辆驾驶，被同一智能大脑无缝衔接。

这也印证了何小鹏的判断：“上一个十年属于电动化，下一个十年将属于智能经济体。此刻忽视‘智能体+汽车’的融合，无异于十年前错过电动化浪潮。”

这个统一的物理AI技术底座，其价值将辐射至汽车之外，同步赋能小鹏在Robotaxi、飞行汽车及人形机器人等领域的探索。从这个视角看，第二代VLA的发布不仅是一次产品迭代，更是小鹏为未来十年投身“物理AI世界”所构建的核心基石。

据了解，目前已有海内外多家车企就第二代VLA技术展开接触与洽谈。何小鹏表示，对其技术的全球场景泛化能力与系统鲁棒性抱有充分信心。

在定义下一个十年的物理AI核心赛道上，中国企业已经全面提速。

来源：互联网

上一篇 黄仁勋万字访谈：推理芯片万亿美元市场，我们算得太保守了 下一篇 2026年小米SU7深度测评：性能、合规与创新设计的全面解析

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

小鹏VLA智驾深度测评：日均58.8万亿Token如何重塑行业格局

摘要

辅助驾驶的终极形态，应是“无感”的陪伴

20亿投入背后：一场关于效率与泛化的豪赌

横跨5000公里：一场定义泛化能力的终极路测

未来十年：汽车进化为“一体化超级智能体”

相关文章推荐