智能駕駛的競爭已從比拼硬件配置和模型規模,轉向構建“模型-數據-算力-芯片”的持續迭代閉環。理想汽車自動駕駛負責人詹錕與芯片負責人謝炎近期在一場訪談中,詳細拆解了公司為追趕特斯拉FSD V14所做的技術佈局,核心落點在於自研的馬赫M100芯片馬赫VLA模型體系

詹錕將追趕FSD的目標分解為兩個層面。基礎體驗上,理想需要在安全感、效率和舒適度上達到與FSD同等的水平,這是基本功。而在高階能力上,特斯拉展現出的禮讓特殊車輛、極窄通行精準感知、識別交警指揮等能力,背後涉及架構與數據的深層原因。他認為,過去的範式可能限制了這些能力的湧現,理想正在架構層面進行大量嘗試,以尋求突破。

在模型路線上,詹錕明確表示,將VLA(視覺-語言-行為模型)與世界模型整合是行業共同趨勢。語言在理解環境、交通規則和複雜決策中不可或缺,基於視覺和語言原生的基礎模型可能是長遠方向。謝炎進一步解釋,邁向L3、L4級自動駕駛需要解決越來越邊緣的“長尾問題”,模型必須具備類似人類的推理能力,而這種能力的來源正是語言模型。例如,理解交警手勢的含義,無法僅靠收集更多數據解決,需要模型具備語義理解與邏輯判斷力。

支撐這套模型體系的硬件基礎是理想自研的馬赫M100芯片。該芯片採用數據流架構,已被應用於今年發佈的L8、L9車型上,併成功運行了馬赫VLA模型。謝炎透露,理想的最終形態是在車內構建一個統一的AI計算中心,所有AI任務均可調度至此,實現高效分配與任務隔離。這與傳統“艙駕一體”思路不同,他認為高端智駕對確定性要求極高,內存與計算資源需專屬,簡單將芯片拼合並不能降低成本或提升效率。

對於自研芯片的商業可行性,謝炎算了一筆賬。芯片先期投入每年可能達數億元,因此車企需達到年營收1000億以上、研發投入佔比10% 的規模,才能持續投入。他同時指出,成本不能僅看芯片顆數。以理想Livis系統搭載的2顆馬赫M100為例,總面積約800平方毫米,相當於8部高端手機芯片的面積。當車輛出貨量達大幾十萬輛時,所需晶圓面積巨大,足以攤薄成本。

在數據層面,詹錕承認隨著車隊規模擴大,數據對模型提升的邊際效應會呈現“對數曲線”式衰減,這是AI發展的普遍規律。但理想的目標是通過規模加速收斂,關鍵在於提升數據質量。一方面利用車端神經網絡觸發器精準捕捉長尾場景,另一方面在端到端範式下,確保行為數據的乾淨與一致性至關重要。

此次訪談勾勒出理想汽車向AI底層延伸的清晰路徑:從應用端的智駕體驗,到模型架構的革新,再到底層芯片與計算中心的設計,試圖打通從數據採集到算力支撐的完整閉環。在特斯拉憑藉Dojo超算與自研芯片構建深厚壁壘的背景下,國內新勢力車企的這場垂直整合競賽,正將智能駕駛的競爭推向更底層的技術較量。