面壁CEO：端侧模型已提前达到GPT-4水平，国产芯片软件生态仍需补课

面壁智能CEO称端侧模型智能水平提前达到GPT-4，2025年为落地元年。

在2025年智源大会期间，面壁智能CEO李大海与AI Infra负责人李宇轩接受了媒体群访，围绕端侧模型进展、国产算力适配、智能体落地和开源策略等话题，释放出一系列关键信号。其中最引人关注的判断是：端侧模型的智能水平已提前达到GPT-4级别。

李大海此前曾预测这一目标将在2026年底实现，如今进度大幅提前。他以面壁近期发布的MiniCPM-5 1B版本为例，该模型在Artificial Analysis榜单上取得17.6分，与OpenAI在2024年5月发布的GPT-4o得分仅差零点几分，而后者参数规模约为200B，MiniCPM-5 1B仅有1B参数。李大海认为，这验证了面壁一直强调的“大模型知识密度定律”——在参数规模大幅压缩的同时，智能水平仍能持续提升。

尽管模型能力增长迅速，但端侧落地的最大制约仍在芯片侧。李大海指出，模型与芯片的结合是当前瓶颈，一批国产存算一体端侧AI芯片正在流片，一旦这些芯片能够提供更有竞争力的功耗、算力和带宽，端侧应用将迎来更多爆发。他将2025年定义为端侧模型落地元年，去年四季度在汽车上的正式量产是重要标志。在落地形态上，他主张端云协同，将上下文管理和部分高频推理放在端侧完成，而非全部依赖云端。

在产业定位上，面壁将自己视作“端侧模型的基础设施”。公司会持续发布世界领先的端侧基础模型赋能开发者，同时直接服务出货量大的重要设备厂商，并在AI原生端侧设备上探索自有硬件产品。李大海透露，面壁已与高通形成全球战略合作，达到协同设计程度，在高效推理上的积累使其在手机、汽车等功耗敏感设备上具备竞争优势。

国产算力方面，李大海坦言，过去行业更多依赖英伟达芯片集群做训练，推理逐步转向国产芯片，但今年训练工作也开始向国产卡迁移。然而，国产芯片集群在软件生态上仍有很多课要补，模型公司无法独自完成所有适配工作，需要芯片公司提供更多支持。面壁一方面与国产芯片公司深入配合，另一方面与智源主导的FlagOS软件生态深度合作，从模型训练牵引和顶层规划两个方向推进。李宇轩补充说，训练对精度要求更高，面壁通过“模型风洞”技术先在华为等国产卡上进行深度评测，并与英伟达对齐，确认精度可用后再推进更大模型训练。

智能体方面，李大海认为技术正在快速进化，面壁早在2024年就已将智能体技术用于人工智能辅助审判并协助法官落地。但他也指出，外界对智能体的期待偏高，希望其实现零介入、100%完成并100%负责，这需要时间打磨。在手机场景中，端侧模型与智能体结合的重要方向是改变人与设备的交互方式，端侧模型在隐私友好性、实时性和可靠性上更具优势。

对于行业竞争激烈的背景下仍坚持开源，李大海解释，开源是高效商业模式，能以更低成本触达潜在客户，帮助客户在内部用更扎实的数据说服决策层，从而提升从技术影响力到商业合作的转化效率。他认为，一家公司的核心竞争力在“冰山之下”，已开源的部分不足以让别人完全学会核心能力，企业应靠技术前瞻性和速度持续构建更复杂的竞争优势。

谈及端侧AI的终局，李大海判断，长期看模型与芯片将走向更深协同，甚至模型公司也可能生产自己的芯片，但这仍是较远的终局，可能需要十年起步。模型侧可以跑得很快，但芯片流片背后仍有大量不能被AI自动完成的工作。面壁已初步完成用AI训练AI，下一步自然会考虑如何用AI去流片，但这一过程不会很快到来。

过去一年，面壁在资本、技术和产业落地上均有进展。资本层面获得了更多投资人支持，包括具有国家队属性的资本和产业资本。技术层面持续推进基础模型、数据治理和AI训练AI框架，并推出了流式全双工端侧全模态模型。产业层面，除了智能汽车和手机，面壁还将端侧模型部署到无人机、潜水器等终端，并在法律领域协助最高人民法院推进全国法院“一张网”试点，已落地全国20到30个城市。

面壁CEO：端侧模型已提前达到GPT-4水平，国产芯片软件生态仍需补课

延伸阅读

相关深度报道

相关每日新闻