智能驾驶的竞争已从比拼硬件配置和模型规模,转向构建“模型-数据-算力-芯片”的持续迭代闭环。理想汽车自动驾驶负责人詹锟与芯片负责人谢炎近期在一场访谈中,详细拆解了公司为追赶特斯拉FSD V14所做的技术布局,核心落点在于自研的马赫M100芯片与马赫VLA模型体系。
詹锟将追赶FSD的目标分解为两个层面。基础体验上,理想需要在安全感、效率和舒适度上达到与FSD同等的水平,这是基本功。而在高阶能力上,特斯拉展现出的礼让特殊车辆、极窄通行精准感知、识别交警指挥等能力,背后涉及架构与数据的深层原因。他认为,过去的范式可能限制了这些能力的涌现,理想正在架构层面进行大量尝试,以寻求突破。
在模型路线上,詹锟明确表示,将VLA(视觉-语言-行为模型)与世界模型整合是行业共同趋势。语言在理解环境、交通规则和复杂决策中不可或缺,基于视觉和语言原生的基础模型可能是长远方向。谢炎进一步解释,迈向L3、L4级自动驾驶需要解决越来越边缘的“长尾问题”,模型必须具备类似人类的推理能力,而这种能力的来源正是语言模型。例如,理解交警手势的含义,无法仅靠收集更多数据解决,需要模型具备语义理解与逻辑判断力。
支撑这套模型体系的硬件基础是理想自研的马赫M100芯片。该芯片采用数据流架构,已被应用于今年发布的L8、L9车型上,并成功运行了马赫VLA模型。谢炎透露,理想的最终形态是在车内构建一个统一的AI计算中心,所有AI任务均可调度至此,实现高效分配与任务隔离。这与传统“舱驾一体”思路不同,他认为高端智驾对确定性要求极高,内存与计算资源需专属,简单将芯片拼合并不能降低成本或提升效率。
对于自研芯片的商业可行性,谢炎算了一笔账。芯片先期投入每年可能达数亿元,因此车企需达到年营收1000亿以上、研发投入占比10% 的规模,才能持续投入。他同时指出,成本不能仅看芯片颗数。以理想Livis系统搭载的2颗马赫M100为例,总面积约800平方毫米,相当于8部高端手机芯片的面积。当车辆出货量达大几十万辆时,所需晶圆面积巨大,足以摊薄成本。
在数据层面,詹锟承认随着车队规模扩大,数据对模型提升的边际效应会呈现“对数曲线”式衰减,这是AI发展的普遍规律。但理想的目标是通过规模加速收敛,关键在于提升数据质量。一方面利用车端神经网络触发器精准捕捉长尾场景,另一方面在端到端范式下,确保行为数据的干净与一致性至关重要。
此次访谈勾勒出理想汽车向AI底层延伸的清晰路径:从应用端的智驾体验,到模型架构的革新,再到底层芯片与计算中心的设计,试图打通从数据采集到算力支撑的完整闭环。在特斯拉凭借Dojo超算与自研芯片构建深厚壁垒的背景下,国内新势力车企的这场垂直整合竞赛,正将智能驾驶的竞争推向更底层的技术较量。