自动驾驶VLA技术，被理想和小鹏寄予厚望，却被华为和地平线抛弃-有驾

当暴雨夜遇上施工锥桶：自动驾驶的十字路口，谁在定义“聪明”？

上周五深夜，我开车回家，暴雨如注。前方突然出现施工区域，锥桶歪歪扭扭地摆成蛇形，还夹杂着几块反光板。我猛踩刹车，手心全是汗——那一刻我突然想：如果这是辆“智能车”，它会怎么选？靠语言指令理解“危险”？还是凭本能绕开障碍？2025年的自动驾驶江湖，正被这个问题撕裂成两派。当理想和小鹏高举VLA大旗试图用“语言”驯服机器，华为们却冷笑一声：何必多此一举？

一、技术分岔口：2025智驾的信仰之战

今年8月，中国智驾圈炸开了锅。理想推送“VLA司机大模型”，小鹏新P7亮出20Hz VLA架构；转头华为乾崑ADS 4随问界M9 OTA商用，直接押注WA（World Action）世界模型。表面是技术路线之争，内里却是生存逻辑的碰撞。VLA把自然语言塞进驾驶链路，让车“理解”红灯的含义；WA则像老司机凭直觉过弯，跳过语言直击物理本质。 小鹏G7 Ultra发布会上，何小鹏直言：“几十亿才能做真VLA，几个亿堆出来的只是微型端到端。”华为靳玉志当场回怼：“语言模型缺三维空间感知，WA才是终局。”台下工程师们苦笑：这哪是技术讨论？分明是资源军备赛的宣言书。

二、从神坛到边缘：VLA的起落启示录

时间倒回2024年，VLA还是行业救世主。特斯拉端到端大模型留下两大黑箱：系统为何急刹？为何对没见过的施工锥桶束手无策？谷歌最早提出的VLA方案，在“视觉-动作”间插入语言桥梁，把像素转成语义规则。理想智驾负责人郎咸朋曾打了个精妙比方：“端到端像猴子开车凭本能，VLA像教练开车——它知道红灯=禁止通行，还能预判‘前方积水可能打滑’。” 当时理想29.3亿公里实车日志加持，小鹏72B参数云端基座支撑，VLA被捧为L3落地前的“最后10%”。可2025年风云突变：华为、Momenta、博世集体转向WA，连地平线都公开质疑：“语言是认知冗余，物理规则才是根。”

为什么被抛弃？VLA的致命伤在于它太“人”了。 人类依赖语言传递经验，但车要的是毫秒级反应。一位不愿透露姓名的芯片工程师向我吐槽：“我们测试3B参数VLA模型，在Thor-U芯片上只能跑10Hz——相当于每秒卡10帧的机器人。暴雨夜你等它‘思考’完，早就撞上护栏了。”更残酷的是，VLA不是技术问题，是资源绞肉机。 算力上，理想13 EFLOPS云端集群喂饱72B模型，而中小车企0.6 EFLOPS算力连7B模型都烧不起，单次训练1.2亿元相当于哪吒全年研发费的40%；数据上，三元组（视觉-语言-动作）需5-10倍长尾密度，没10万公里车队只能买二手数据；芯片上，英伟达40万片Thor-U被头部瓜分32万片，零跑被迫溢价30%抢8万片现货。元戎CEO周光说得直白：“7B-10B参数+22T token才配叫VLA，否则都是PPT。”

三、真假VLA：一场资源禀赋的残酷映射

技术路线从来无关对错，只关乎你兜里有多少钱。2025年行业最魔幻一幕，是“真假VLA”口水战。小鹏宣称G7 Ultra搭载“纯血VLA”，理想AD Max却被何小鹏称为“嫁接版”。背后真相更扎心：小鹏押注自研芯片+千卡集群，理想绑定英伟达生态，而Momenta曹旭东一针见血：“VLA安全提升5-10倍，L4需要100-1000倍，杯水车薪。” 我曾在深圳某智驾论坛见过一位新势力CTO，他灌下半瓶啤酒苦笑：“我们买不起真VLA，只能采购Momenta阉割版算法，还要按车价分成——这哪是技术合作？分明是交保护费。”更讽刺的是，当头部企业争论语言是否必要时，中小车企已集体“富士康化”：没有算力、没有数据、没有芯片，只能把冲压焊接做到极致，利润被算法公司和芯片厂两头吃干抹净。 有行业报告显示，2025年L2+智驾方案均价上涨37%，但车企单车利润反降15%——技术革命成了智驾主权的再集中。

四、用户只关心：暴雨夜能否安全到家

争论最激烈时，普通车主根本不在乎acronym。上个月，朋友刚提的小鹏G6在杭州暴雨天误刹三次，他吐槽：“什么VLA、WA？我只想要车位到车位不接管！”这戳中了技术信仰的软肋。VLA派赌语言推理能泛化长尾场景，WA派押注物理规则保障绝对安全，但用户体验才是终极试金石。 有趣的是，路线选择暴露了企业基因：理想背靠13 EFLOPS算力必须All in VLA，华为有云端世界模型自然跳过语言。地平线CTO余凯私下聊起时说：“特斯拉像WA先驱，但中国路况复杂十倍——施工锥桶异形摆放？语言解释或许真有用。”可Momenta用数据反驳：其WA模型在暴雨测试中接管率0.03次/千公里，远优于VLA的0.15次。

五、让子弹飞：技术没有终局，只有适者生存

2025-2026年将是分水岭。若VLA在Q4率先实现“城市L3+长尾误判降十倍”，理想小鹏将借通用AI基座杀入机器人领域；若华为WA拿下“无保护左转+暴雨零接管”，主机厂智驾方案将彻底平台化。但历史总爱开玩笑：2019年Mobileye主导的视觉方案，2023年被激光雷达反超，如今纯视觉又卷土重来。技术路线没有高下，只有适不适合；市场终局没有标准答案，只有体验唯一试金石。 我想起在博世展台看到的演示：WA模型让测试车在洒水车水雾中精准识别行人，而VLA因“语言延迟”多用了0.8秒——生死往往就在这毫秒间。

暴雨夜的故事还没结局。当我最终绕过施工区，收音机正播放华为新专利：“世界模型通过流体力学预判水洼深度”。我笑了笑关掉它。方向盘终究握在人手里，技术只是工具。2025年L3落地前夜，最讽刺的真相或许是：当工程师们为“语言是否必要”争得面红耳赤时，用户只想要一个承诺——下个雨夜，我的车别把我丢在半路。子弹还会飞一年，但交付数据终将说话。到那时，或许我们会发现：所谓技术信仰，不过是生存策略裹着科学外衣的舞蹈。而舞蹈的终场音乐，永远由坐在驾驶座上的人按下播放键。

自动驾驶VLA技术，被理想和小鹏寄予厚望，却被华为和地平线抛弃

当暴雨夜遇上施工锥桶：自动驾驶的十字路口，谁在定义“聪明”？

一、技术分岔口：2025智驾的信仰之战

二、从神坛到边缘：VLA的起落启示录

三、真假VLA：一场资源禀赋的残酷映射

四、用户只关心：暴雨夜能否安全到家

五、让子弹飞：技术没有终局，只有适者生存

全部评论（0）

热门推荐

自动驾驶VLA技术，被理想和小鹏寄予厚望，却被华为和地平线抛弃

当暴雨夜遇上施工锥桶：自动驾驶的十字路口，谁在定义“聪明”？

一、技术分岔口：2025智驾的信仰之战

二、从神坛到边缘：VLA的起落启示录

三、真假VLA：一场资源禀赋的残酷映射

四、用户只关心：暴雨夜能否安全到家

五、让子弹飞：技术没有终局，只有适者生存

全部评论 （0）

热门推荐

全部评论（0）