小鹏第二代VLA:引领智驾新潮流,跃升T0档
2026-03-24 17:38:47未知 作者:徽声在线
作者 | 王秋凤 改写 | 徽声在线编辑
3月2日,以“THE FUTURE”为主题的小鹏汽车第二代VLA媒体体验日活动盛大举行。在活动现场,董事长兼CEO何小鹏郑重宣布,第二代VLA将于本月开启全量推送。从某种意义上来说,与其称其为“第二代”,不如说是全新打造。与第一代VLA基于L2的思路不同,此次的VLA路径直接指向L4,展现出小鹏汽车在智能驾驶领域的重大突破与远大抱负。
简单来讲,第二代VLA摒弃了传统的语言转译环节,原本的V - L - A链转变为更为直接的V - A链,这一改变看似简单,实则意义深远。
攻克L2难题,方能安心驾驶
传统的VLA模型遵循着“视觉输入—语言转译—动作输出”的三段式逻辑。它先将图像等多种传感器所获取的信息,全部翻译成文本形式,接着运用语言模型对这些文本进行理解分析,进而生成相应的指令,最后交给系统去执行操作。然而,这样的过程存在明显弊端。信息在来回转换的过程中,不可避免地会出现耗散情况,而且还会产生较大的延迟,通常延迟时间在几百毫秒的级别。在时敏型场景中,这种延迟可能会带来严重后果。例如,当车辆时速达到80公里时,500毫秒的时间车辆就会行驶10多米的距离,如此一来,在遇到突发状况时,系统很可能来不及做出有效的处置。
第二代VLA则大胆创新,解雇了“语言翻译官”这一角色。它从视觉及其他信息的融合处理,直接到动作指令的输出,系统依靠“下意识”进行决策。这种决策方式与人类在面对时敏型场景时的下意识动作极为相似。其背后依托的是专家模型,该模型建立在多年丰富的驾驶经验基础之上,能够为各种情况提供最优解决方案。如此一来,系统的反应速度必然大幅提升。
那么,小鹏的这种“下意识动作”是否准确可靠呢?这就要回到当前L2级别辅助驾驶所存在的痛点问题上来。
目前,L2级别的辅助驾驶在不同场景下采用不同的逻辑。高速驾驶有一套逻辑,城区行驶有另一套逻辑,小路和停车场又有一套逻辑。这种“缝合怪”式的模式,导致每次场景切换时,车辆都可能出现顿挫、犹豫或者退出辅助驾驶的情况,极大地影响了用户的驾驶体验。
更为棘手的是一些反人类的操作现象。比如,前方道路明明出现拥堵状况,车辆却不知道减速,直到快接近拥堵点时才突然一脚重刹,让车内人员猝不及防;在窄路会车时,车辆既不主动避让,也不减速慢行,给对向车辆和自身都带来安全隐患;与大型车辆并行时,车辆不懂得拉开安全距离,而是全程紧紧贴着大车行驶,让驾驶者提心吊胆。
而小鹏的第二代VLA(严格意义上应称为V - A)则展现出了人类般的“分寸感”。在夜间没有照明的小路上行驶时,系统能够提前精准识别路面上的坑洼和障碍物,并主动减速绕行,整个过程无需人工接管,就如同白天在有清晰标线的大路上行驶一样轻松自如,让驾驶者无需为路况担忧。
当路边交警示意停车时,系统能够像人类一样迅速理解交警的意图,平稳地将车辆停靠在路边。在一次极具挑战性的测试中,后方传来救护车的鸣笛声,第二代VLA果断地打灯、靠边、减速,为救护车让出生命通道,这一系列动作流畅自然,充分体现了其智能性和人性化。
这表明,声音也作为重要的外界信息,成为了系统融合输入的一部分,不再仅仅局限于视觉或者毫米波雷达数据。更为关键的是,这些反应不仅及时迅速,而且并非是通过预先编程设定好的。这些能力是模型在处理上亿个视频切片的过程中“涌现”出来的,也就是说,系统无需事先拟定规则,就能够通过大量的数据学习,领悟到这个世界的运行规则。
这在很大程度上解决了所有智能驾驶公司最为头痛的长尾问题。在现实世界中,驾驶场景是无穷无尽的,极端情况更是无法穷举。如果系统能够像人类一样,仅凭借对底层规则的认知和长期驾车所形成的“肌肉记忆”,就能够处理绝大多数此前未曾遇到过的情况,那么智能驾驶的安全性和可靠性将得到极大提升。
能力跃升,跻身智驾T0档
这种“分寸感”,在过去一直是人类司机所独有的优势。L2系统虽然努力模拟人类驾驶行为,但一到关键时刻就容易“露馅”,而第二代VLA则成功解决了这一问题。这预示着第二代VLA已经建立了通往L4的坚实框架,为未来实现更高级别的自动驾驶奠定了基础。
这些卓越能力的背后,是小鹏汽车辨识能力的显著跃升。第二代VLA对夜间深色物体的识别率大幅提升72%,这意味着即使在黑暗的环境中,车辆也能准确识别穿黑衣服的行人以及无路灯路段的障碍物,大大提高了夜间行驶的安全性。路面障碍物识别能力提升124%,侧后车辆识别能力提升118%,前车轨迹预测精准性提升300%,夜间决策准确性提升96%。窄路平均接管里程直接提升13倍,即使是新手司机也能轻松应对会车和走窄路的情况。
小鹏智驾中心负责人刘先明给出了一个更为震撼的数据:第二代VLA的安全接管里程提升了50倍,平均接管里程提升25倍。这意味着用户每行驶50倍的距离才需要接管一次车辆,从过去“时刻准备接管”的紧张状态,转变为“偶尔看一下就行”的轻松体验,两者之间的差距可谓天差地别。小鹏的第二代VLA,已经成功跳出业内“一线”的能力范畴,进入了无人可比的智驾T0档,成为智能驾驶领域的佼佼者。
安全与效率兼得,背后的奥秘
如果说“安心”解决了用户敢不敢使用智能驾驶的问题,“能力”回答了车辆能不能安全行驶的问题,那么“效率”则决定了用户愿不愿意使用智能驾驶。而效率恰恰是传统智能驾驶最难跨越的一道坎。
有些智能驾驶系统给人的印象是过于“莽撞”,在行驶过程中不顾周围环境,一味地追求速度;而有些则过于保守,遇到加塞情况只会一味让行,调头时慢吞吞的,常常堵住后面一长串车辆,影响整体交通效率。
第二代VLA则巧妙地把握了风格,拿捏得恰到好处。在广州晚高峰的实测中,导航软件预估44分钟的路程,第二代VLA仅用了43分钟,比人类驾驶还快1分钟;而传统的L2智驾系统跑了48分钟,投入运营的Robotaxi用时更长,显示出其策略更为保守。小鹏官方公布了一系列效率提升的数据,其中最关键的当属综合行车效率提升23%。在拥堵的大中城市街道上,这种效率提升是所有驾驶者梦寐以求的,甚至比专车司机开得还要好。
何小鹏表示:“好的智驾应该像坐电梯一样,按下启动键,就能够从家里顺利到达公司。没人会关心电梯是怎么运行的,只关心是否到达了目的地,这才是‘国民智驾’的本质。”效率提升的背后,是第二代VLA决策逻辑的重构,它让智能驾驶更加贴近人类的实际需求。
当前,智驾行业正站在关键的转折点上,面临着两种不同的发展路径选择。一边是基于L2能力进行持续的“小修小补”,在有限的边界内不断迭代体验;另一边则是推倒重来,以L4为目标,从底层重构技术框架。小鹏汽车果断选择了后者,展现出了其前瞻性的战略眼光和勇于创新的精神。
第二代VLA的核心突破在于,将系统的思考过程转变为一种类似人类的下意识反应。这种转变并非易事,需要投入大量的资源。
这套架构的投入堪称惊人:3万卡算力、20多亿的训练费用、50PB的训练数据。从2025年科技日至今,已经迭代了468版模型,平均一天迭代4版。小鹏自研的图灵AI芯片单颗可提供750TOPS有效算力,基座模型编译效率提升12倍。这些投入为第二代VLA的卓越性能提供了有力保障。
在训练数据规模已经很大的前提下,意味着通过不断地迭代优化,就有可能逐步达到L4级别的自动驾驶水平,同时具备跨场景泛化能力。具身智能、飞行汽车等未来交通领域的产品都可以在同样的基座模型上发展V - A链,实现技术的共享与融合。
刘先明因此充满底气地说:“小鹏第二代VLA,是小鹏与行业拉开代际差距的时刻,可能是目前中国最领先的智驾系统。”这一评价充分体现了小鹏汽车在智能驾驶领域的技术实力和领先地位。
玩法改变,影响波及整个市场
与第一代VLA相比,第二代VLA似乎已经铺好了通往L4的坚实路径,这与特斯拉FSD从V13到V14的质变恰好相互对应。即便不考虑技术内容,仅从用户体验出发,小鹏第二代VLA很可能是唯一能够在全球市场与特斯拉FSD竞争的中国智驾方案,小鹏汽车也因此重新回到了智驾的T0梯队。全量推送后,市场层面恐怕会普遍意识到,原来自动驾驶才是物理AI Agent第一个实现商业化落地的方案。
过去,人们总是认为AI领域烧钱却不赚钱。但如果小鹏第二代VLA的体验能够超出L2一大截,并且毫不犹豫地直指L4,那么正向的商业循环就有可能建立起来。从这一点来看,小鹏的二代VLA很可能将引发市场竞争主线的重大变化,推动整个智能驾驶行业向更高水平发展。
以往,辅助驾驶一直被视为汽车的“价值增量”,依附于汽车产品本身。就目前的市场情况而言,智能驾驶的核心仍然是安全、省心、好用。智驾的普及,不仅意味着要在入门级车型上普及智能驾驶技术,更意味着要在全系产品上普及能力更强、体验更佳、适用性空前广泛的智驾系统。从而在用户心理上形成普遍接受并尽快拥有的强烈愿望,市场的宽度将因此发生巨大变化,真正的全民智驾时代才有望到来。
再进一步说,第二代VLA表明已经打通了指向L4的道路,一切都将变得不一样。何小鹏相信“汽车领域很快将迎来跨域融合”。此前,具身智能看起来和汽车完全不同,在外观、运动方式、控制、动力、线束等方面都与汽车存在差异。但在AI向物理Agent进发的过程中,与汽车的自动驾驶需求产生了技术路线交叠。动力、控制、底盘包括AI基座模型都在逐渐融合。小鹏二代VLA,可能是一场即将席卷整个市场的风暴的先兆,将引发行业的深刻变革。
如果跨域跨产业的“融合”预期能够顺利落实,不仅将导致技术和供应链的复用、合并,还将极大地加速用户心智的教育和占领。客户从第二代VLA的超预期体验当中,大概率会意识到,一个强智能体时代已经来临。整个商业模式、商业价值体系都将因此产生颠覆性的变化。
而小鹏的第二代VLA则第一次在公众面前,为这种潜在的变化揭开了神秘的面纱,让人们看到了智能驾驶未来的无限可能。

