理想汽車釋出具身智慧系統，自研晶片與VLA模型對標特斯拉FSD

理想汽車在6月15日的軟體與具身智慧釋出會上，系統性地展示了其面向下一代智慧汽車的AI技術體系。這場釋出會的核心，是將汽車重新定義為一套完整的具身智慧系統，併為此打造了從晶片、作業系統到大模型的垂直技術棧。

釋出會最受關注的是理想自研的車規級AI晶片馬赫M100 Ultra。這款晶片採用5nm工藝，單顆算力達到1280TOPS，更關鍵的是其實際算力利用率超過82%。理想汽車CTO謝炎解釋，這得益於晶片採用了資料流架構，而非傳統的馮·諾依曼架構。在AI計算任務中，資料流架構讓資料流動驅動計算發生，避免了傳統架構中大量電晶體用於快取和排程的效率瓶頸。晶片內部超過一半的晶圓面積給了神經網路處理器，NPU由56個計算單元和1個數據處理模組構成。CPU部分則採用24核心Arm Cortex-A78AE，記憶體系統為8路LPDDR5X，頻寬達273GB/s。理想將馬赫M100與智駕領域主流晶片Thor-U進行了效能對比，在CNN骨幹網路、UniAD以及理想自研的MindVLA核心模型等測試中表現出色。更重要的是，這顆晶片並非只服務於輔助駕駛，它已經跑通了車內所有智慧化場景，包括語言大模型、Agent任務和多模態感知。

在軟體層面，理想釋出了馬赫VLA大模型，作為具身智慧的機器智慧核心。理想汽車基座模型負責人詹錕坦言，在深度體驗特斯拉FSD V14.3後壓力很大，並宣佈了一個激進目標：計劃在第四季度對齊特斯拉FSD V14的能力。馬赫VLA的核心變化在於架構統一，它將傳統輔助駕駛系統中分離的感知、預測和規劃模組，整合進一個原生多模態MoE模型框架內，讓看見、理解、思考和行動在同一體系中對齊。這解決了過去“看見了但決策不對”的割裂問題。在效率上，新一代系統反應耗時0.28秒，快於普通人0.45秒的平均反應時間，在120km/h車速下可多出約6米的安全距離。這一提升來自從視覺輸入、模型推理到底盤響應的全鏈路最佳化，整體端到端時延降低了40%。視覺能力方面，理想推出了3D ViT感知模型，試圖讓系統從“看見障礙物”進化到“理解場景”，能夠識別紅綠燈顏色、施工路牌文字或保安手勢等語義資訊。

語言智慧方面，理想淘汰了此前的模型，釋出了雲端模型馬赫Mind-Pro和端側模型馬赫Mind-Edge。馬赫Mind-Pro面向車載Agent場景，在指令跟隨、長文本理解、數學推理和工具呼叫等基準測試中進入行業第一梯隊。理想特別強調了效率指標：通過Token壓縮技術，在任務完成率不下降的前提下，整體Token消耗降低38%，工具呼叫冗餘輪次降低47%。馬赫Mind-Edge則是端側原生智慧體模型，採用多模態流式時序建模，可在車端本地完成全天候主動感知、人車互動和自主控車，資料不上傳。

硬體底座之上，理想還發布了新一代座艙架構SS HW 4.0，首發搭載驍龍座艙8797 Elite晶片，支援全景寬幅屏和90Hz高重新整理率。影音系統升級為9.3.6環繞全景聲，並將支援CarPlay與Apple Music的空間音訊。

理想汽車CEO李想在釋出會上對智慧汽車的本質給出了自己的判斷。他認為，當前行業定義的“軟體定義硬體、聯網線上、可持續升級”仍是規則驅動的功能系統，並非真正的智慧。真正的具身智慧汽車，需要在安全上從功能安全進化到保護人類安全，在能力上從呼叫功能進化到獨立完成任務，在效率上從行動緩慢進化到高於人類。他將具身智慧汽車的產品本質概括為電動車、職業司機、AI計算機和生活助手的融合。現場演示了複雜任務規劃能力，如根據航班號接機並安排素食餐廳、規劃燕京八景遊覽路線、按指定順序接多位家人並最終抵達生日地點等，系統均能理解上下文並生成可執行的方案。

理想汽車預告了今年三個關鍵OTA節點：7月重點提升輔助駕駛效率，覆蓋限寬墩、限高杆等場景；9月和12月將進一步釋放更多能力。這場釋出會清晰地勾勒出理想汽車從功能驅動向智慧體驅動轉型的技術藍圖，其全棧自研的晶片與模型佈局，也加劇了智慧汽車領域在AI算力和演算法上的競爭。

理想汽車釋出具身智慧系統，自研晶片與VLA模型對標特斯拉FSD

延伸閱讀

相關深度報道

相關每日新聞