理想汽车发布具身智能系统，自研芯片与VLA模型对标特斯拉FSD

理想汽车在6月15日的软件与具身智能发布会上，系统性地展示了其面向下一代智能汽车的AI技术体系。这场发布会的核心，是将汽车重新定义为一套完整的具身智能系统，并为此打造了从芯片、操作系统到大模型的垂直技术栈。

发布会最受关注的是理想自研的车规级AI芯片马赫M100 Ultra。这款芯片采用5nm工艺，单颗算力达到1280TOPS，更关键的是其实际算力利用率超过82%。理想汽车CTO谢炎解释，这得益于芯片采用了数据流架构，而非传统的冯·诺依曼架构。在AI计算任务中，数据流架构让数据流动驱动计算发生，避免了传统架构中大量晶体管用于缓存和调度的效率瓶颈。芯片内部超过一半的晶圆面积给了神经网络处理器，NPU由56个计算单元和1个数据处理模块构成。CPU部分则采用24核心Arm Cortex-A78AE，内存系统为8路LPDDR5X，带宽达273GB/s。理想将马赫M100与智驾领域主流芯片Thor-U进行了性能对比，在CNN骨干网络、UniAD以及理想自研的MindVLA核心模型等测试中表现出色。更重要的是，这颗芯片并非只服务于辅助驾驶，它已经跑通了车内所有智能化场景，包括语言大模型、Agent任务和多模态感知。

在软件层面，理想发布了马赫VLA大模型，作为具身智能的机器智能核心。理想汽车基座模型负责人詹锟坦言，在深度体验特斯拉FSD V14.3后压力很大，并宣布了一个激进目标：计划在第四季度对齐特斯拉FSD V14的能力。马赫VLA的核心变化在于架构统一，它将传统辅助驾驶系统中分离的感知、预测和规划模块，整合进一个原生多模态MoE模型框架内，让看见、理解、思考和行动在同一体系中对齐。这解决了过去“看见了但决策不对”的割裂问题。在效率上，新一代系统反应耗时0.28秒，快于普通人0.45秒的平均反应时间，在120km/h车速下可多出约6米的安全距离。这一提升来自从视觉输入、模型推理到底盘响应的全链路优化，整体端到端时延降低了40%。视觉能力方面，理想推出了3D ViT感知模型，试图让系统从“看见障碍物”进化到“理解场景”，能够识别红绿灯颜色、施工路牌文字或保安手势等语义信息。

语言智能方面，理想淘汰了此前的模型，发布了云端模型马赫Mind-Pro和端侧模型马赫Mind-Edge。马赫Mind-Pro面向车载Agent场景，在指令跟随、长文本理解、数学推理和工具调用等基准测试中进入行业第一梯队。理想特别强调了效率指标：通过Token压缩技术，在任务完成率不下降的前提下，整体Token消耗降低38%，工具调用冗余轮次降低47%。马赫Mind-Edge则是端侧原生智能体模型，采用多模态流式时序建模，可在车端本地完成全天候主动感知、人车交互和自主控车，数据不上传。

硬件底座之上，理想还发布了新一代座舱架构SS HW 4.0，首发搭载骁龙座舱8797 Elite芯片，支持全景宽幅屏和90Hz高刷新率。影音系统升级为9.3.6环绕全景声，并将支持CarPlay与Apple Music的空间音频。

理想汽车CEO李想在发布会上对智能汽车的本质给出了自己的判断。他认为，当前行业定义的“软件定义硬件、联网在线、可持续升级”仍是规则驱动的功能系统，并非真正的智能。真正的具身智能汽车，需要在安全上从功能安全进化到保护人类安全，在能力上从调用功能进化到独立完成任务，在效率上从行动缓慢进化到高于人类。他将具身智能汽车的产品本质概括为电动车、职业司机、AI计算机和生活助手的融合。现场演示了复杂任务规划能力，如根据航班号接机并安排素食餐厅、规划燕京八景游览路线、按指定顺序接多位家人并最终抵达生日地点等，系统均能理解上下文并生成可执行的方案。

理想汽车预告了今年三个关键OTA节点：7月重点提升辅助驾驶效率，覆盖限宽墩、限高杆等场景；9月和12月将进一步释放更多能力。这场发布会清晰地勾勒出理想汽车从功能驱动向智能体驱动转型的技术蓝图，其全栈自研的芯片与模型布局，也加剧了智能汽车领域在AI算力和算法上的竞争。

理想汽车发布具身智能系统，自研芯片与VLA模型对标特斯拉FSD

延伸阅读

相关深度报道

相关每日新闻