理想汽車在6月15日的軟件與具身智能發佈會上,系統性地展示了其面向下一代智能汽車的AI技術體系。這場發佈會的核心,是將汽車重新定義為一套完整的具身智能系統,併為此打造了從芯片、操作系統到大模型的垂直技術棧。
發佈會最受關注的是理想自研的車規級AI芯片馬赫M100 Ultra。這款芯片採用5nm工藝,單顆算力達到1280TOPS,更關鍵的是其實際算力利用率超過82%。理想汽車CTO謝炎解釋,這得益於芯片採用了數據流架構,而非傳統的馮·諾依曼架構。在AI計算任務中,數據流架構讓數據流動驅動計算發生,避免了傳統架構中大量晶體管用於緩存和調度的效率瓶頸。芯片內部超過一半的晶圓面積給了神經網絡處理器,NPU由56個計算單元和1個數據處理模塊構成。CPU部分則採用24核心Arm Cortex-A78AE,內存系統為8路LPDDR5X,帶寬達273GB/s。理想將馬赫M100與智駕領域主流芯片Thor-U進行了性能對比,在CNN骨幹網絡、UniAD以及理想自研的MindVLA核心模型等測試中表現出色。更重要的是,這顆芯片並非只服務於輔助駕駛,它已經跑通了車內所有智能化場景,包括語言大模型、Agent任務和多模態感知。
在軟件層面,理想發佈了馬赫VLA大模型,作為具身智能的機器智能核心。理想汽車基座模型負責人詹錕坦言,在深度體驗特斯拉FSD V14.3後壓力很大,並宣佈了一個激進目標:計劃在第四季度對齊特斯拉FSD V14的能力。馬赫VLA的核心變化在於架構統一,它將傳統輔助駕駛系統中分離的感知、預測和規劃模塊,整合進一個原生多模態MoE模型框架內,讓看見、理解、思考和行動在同一體系中對齊。這解決了過去“看見了但決策不對”的割裂問題。在效率上,新一代系統反應耗時0.28秒,快於普通人0.45秒的平均反應時間,在120km/h車速下可多出約6米的安全距離。這一提升來自從視覺輸入、模型推理到底盤響應的全鏈路優化,整體端到端時延降低了40%。視覺能力方面,理想推出了3D ViT感知模型,試圖讓系統從“看見障礙物”進化到“理解場景”,能夠識別紅綠燈顏色、施工路牌文字或保安手勢等語義信息。
語言智能方面,理想淘汰了此前的模型,發佈了雲端模型馬赫Mind-Pro和端側模型馬赫Mind-Edge。馬赫Mind-Pro面向車載Agent場景,在指令跟隨、長文本理解、數學推理和工具調用等基準測試中進入行業第一梯隊。理想特別強調了效率指標:通過Token壓縮技術,在任務完成率不下降的前提下,整體Token消耗降低38%,工具調用冗餘輪次降低47%。馬赫Mind-Edge則是端側原生智能體模型,採用多模態流式時序建模,可在車端本地完成全天候主動感知、人車交互和自主控車,數據不上傳。
硬件底座之上,理想還發布了新一代座艙架構SS HW 4.0,首發搭載驍龍座艙8797 Elite芯片,支持全景寬幅屏和90Hz高刷新率。影音系統升級為9.3.6環繞全景聲,並將支持CarPlay與Apple Music的空間音頻。
理想汽車CEO李想在發佈會上對智能汽車的本質給出了自己的判斷。他認為,當前行業定義的“軟件定義硬件、聯網在線、可持續升級”仍是規則驅動的功能系統,並非真正的智能。真正的具身智能汽車,需要在安全上從功能安全進化到保護人類安全,在能力上從調用功能進化到獨立完成任務,在效率上從行動緩慢進化到高於人類。他將具身智能汽車的產品本質概括為電動車、職業司機、AI計算機和生活助手的融合。現場演示了複雜任務規劃能力,如根據航班號接機並安排素食餐廳、規劃燕京八景遊覽路線、按指定順序接多位家人並最終抵達生日地點等,系統均能理解上下文並生成可執行的方案。
理想汽車預告了今年三個關鍵OTA節點:7月重點提升輔助駕駛效率,覆蓋限寬墩、限高杆等場景;9月和12月將進一步釋放更多能力。這場發佈會清晰地勾勒出理想汽車從功能驅動向智能體驅動轉型的技術藍圖,其全棧自研的芯片與模型佈局,也加劇了智能汽車領域在AI算力和算法上的競爭。