自动驾驶VLA技术,被理想和小鹏寄予厚望,却被华为和地平线抛弃

当暴雨夜遇上施工锥桶:自动驾驶的十字路口,谁在定义“聪明”?

上周五深夜,我开车回家,暴雨如注。前方突然出现施工区域,锥桶歪歪扭扭地摆成蛇形,还夹杂着几块反光板。我猛踩刹车,手心全是汗——那一刻我突然想:如果这是辆“智能车”,它会怎么选?靠语言指令理解“危险”?还是凭本能绕开障碍?2025年的自动驾驶江湖,正被这个问题撕裂成两派。当理想和小鹏高举VLA大旗试图用“语言”驯服机器,华为们却冷笑一声:何必多此一举?

一、技术分岔口:2025智驾的信仰之战

今年8月,中国智驾圈炸开了锅。理想推送“VLA司机大模型”,小鹏新P7亮出20Hz VLA架构;转头华为乾崑ADS 4随问界M9 OTA商用,直接押注WA(World Action)世界模型。表面是技术路线之争,内里却是生存逻辑的碰撞。VLA把自然语言塞进驾驶链路,让车“理解”红灯的含义;WA则像老司机凭直觉过弯,跳过语言直击物理本质。 小鹏G7 Ultra发布会上,何小鹏直言:“几十亿才能做真VLA,几个亿堆出来的只是微型端到端。”华为靳玉志当场回怼:“语言模型缺三维空间感知,WA才是终局。”台下工程师们苦笑:这哪是技术讨论?分明是资源军备赛的宣言书。

自动驾驶VLA技术,被理想和小鹏寄予厚望,却被华为和地平线抛弃-有驾

二、从神坛到边缘:VLA的起落启示录

时间倒回2024年,VLA还是行业救世主。特斯拉端到端大模型留下两大黑箱:系统为何急刹?为何对没见过的施工锥桶束手无策?谷歌最早提出的VLA方案,在“视觉-动作”间插入语言桥梁,把像素转成语义规则。理想智驾负责人郎咸朋曾打了个精妙比方:“端到端像猴子开车凭本能,VLA像教练开车——它知道红灯=禁止通行,还能预判‘前方积水可能打滑’。” 当时理想29.3亿公里实车日志加持,小鹏72B参数云端基座支撑,VLA被捧为L3落地前的“最后10%”。可2025年风云突变:华为、Momenta、博世集体转向WA,连地平线都公开质疑:“语言是认知冗余,物理规则才是根。”

为什么被抛弃?VLA的致命伤在于它太“人”了。 人类依赖语言传递经验,但车要的是毫秒级反应。一位不愿透露姓名的芯片工程师向我吐槽:“我们测试3B参数VLA模型,在Thor-U芯片上只能跑10Hz——相当于每秒卡10帧的机器人。暴雨夜你等它‘思考’完,早就撞上护栏了。”更残酷的是,VLA不是技术问题,是资源绞肉机。 算力上,理想13 EFLOPS云端集群喂饱72B模型,而中小车企0.6 EFLOPS算力连7B模型都烧不起,单次训练1.2亿元相当于哪吒全年研发费的40%;数据上,三元组(视觉-语言-动作)需5-10倍长尾密度,没10万公里车队只能买二手数据;芯片上,英伟达40万片Thor-U被头部瓜分32万片,零跑被迫溢价30%抢8万片现货。元戎CEO周光说得直白:“7B-10B参数+22T token才配叫VLA,否则都是PPT。”

自动驾驶VLA技术,被理想和小鹏寄予厚望,却被华为和地平线抛弃-有驾

三、真假VLA:一场资源禀赋的残酷映射

技术路线从来无关对错,只关乎你兜里有多少钱。2025年行业最魔幻一幕,是“真假VLA”口水战。小鹏宣称G7 Ultra搭载“纯血VLA”,理想AD Max却被何小鹏称为“嫁接版”。背后真相更扎心:小鹏押注自研芯片+千卡集群,理想绑定英伟达生态,而Momenta曹旭东一针见血:“VLA安全提升5-10倍,L4需要100-1000倍,杯水车薪。” 我曾在深圳某智驾论坛见过一位新势力CTO,他灌下半瓶啤酒苦笑:“我们买不起真VLA,只能采购Momenta阉割版算法,还要按车价分成——这哪是技术合作?分明是交保护费。”更讽刺的是,当头部企业争论语言是否必要时,中小车企已集体“富士康化”:没有算力、没有数据、没有芯片,只能把冲压焊接做到极致,利润被算法公司和芯片厂两头吃干抹净。 有行业报告显示,2025年L2+智驾方案均价上涨37%,但车企单车利润反降15%——技术革命成了智驾主权的再集中。

四、用户只关心:暴雨夜能否安全到家

自动驾驶VLA技术,被理想和小鹏寄予厚望,却被华为和地平线抛弃-有驾

争论最激烈时,普通车主根本不在乎acronym。上个月,朋友刚提的小鹏G6在杭州暴雨天误刹三次,他吐槽:“什么VLA、WA?我只想要车位到车位不接管!”这戳中了技术信仰的软肋。VLA派赌语言推理能泛化长尾场景,WA派押注物理规则保障绝对安全,但用户体验才是终极试金石。 有趣的是,路线选择暴露了企业基因:理想背靠13 EFLOPS算力必须All in VLA,华为有云端世界模型自然跳过语言。地平线CTO余凯私下聊起时说:“特斯拉像WA先驱,但中国路况复杂十倍——施工锥桶异形摆放?语言解释或许真有用。”可Momenta用数据反驳:其WA模型在暴雨测试中接管率0.03次/千公里,远优于VLA的0.15次。

五、让子弹飞:技术没有终局,只有适者生存

2025-2026年将是分水岭。若VLA在Q4率先实现“城市L3+长尾误判降十倍”,理想小鹏将借通用AI基座杀入机器人领域;若华为WA拿下“无保护左转+暴雨零接管”,主机厂智驾方案将彻底平台化。但历史总爱开玩笑:2019年Mobileye主导的视觉方案,2023年被激光雷达反超,如今纯视觉又卷土重来。技术路线没有高下,只有适不适合;市场终局没有标准答案,只有体验唯一试金石。 我想起在博世展台看到的演示:WA模型让测试车在洒水车水雾中精准识别行人,而VLA因“语言延迟”多用了0.8秒——生死往往就在这毫秒间。

自动驾驶VLA技术,被理想和小鹏寄予厚望,却被华为和地平线抛弃-有驾

暴雨夜的故事还没结局。当我最终绕过施工区,收音机正播放华为新专利:“世界模型通过流体力学预判水洼深度”。我笑了笑关掉它。方向盘终究握在人手里,技术只是工具。2025年L3落地前夜,最讽刺的真相或许是:当工程师们为“语言是否必要”争得面红耳赤时,用户只想要一个承诺——下个雨夜,我的车别把我丢在半路。 子弹还会飞一年,但交付数据终将说话。到那时,或许我们会发现:所谓技术信仰,不过是生存策略裹着科学外衣的舞蹈。而舞蹈的终场音乐,永远由坐在驾驶座上的人按下播放键。

0

全部评论 (0)

暂无评论