在2025年智源大会期间,面壁智能CEO李大海与AI Infra负责人李宇轩接受了媒体群访,围绕端侧模型进展、国产算力适配、智能体落地和开源策略等话题,释放出一系列关键信号。其中最引人关注的判断是:端侧模型的智能水平已提前达到GPT-4级别。

李大海此前曾预测这一目标将在2026年底实现,如今进度大幅提前。他以面壁近期发布的MiniCPM-5 1B版本为例,该模型在Artificial Analysis榜单上取得17.6分,与OpenAI在2024年5月发布的GPT-4o得分仅差零点几分,而后者参数规模约为200B,MiniCPM-5 1B仅有1B参数。李大海认为,这验证了面壁一直强调的“大模型知识密度定律”——在参数规模大幅压缩的同时,智能水平仍能持续提升。

尽管模型能力增长迅速,但端侧落地的最大制约仍在芯片侧。李大海指出,模型与芯片的结合是当前瓶颈,一批国产存算一体端侧AI芯片正在流片,一旦这些芯片能够提供更有竞争力的功耗、算力和带宽,端侧应用将迎来更多爆发。他将2025年定义为端侧模型落地元年,去年四季度在汽车上的正式量产是重要标志。在落地形态上,他主张端云协同,将上下文管理和部分高频推理放在端侧完成,而非全部依赖云端。

在产业定位上,面壁将自己视作“端侧模型的基础设施”。公司会持续发布世界领先的端侧基础模型赋能开发者,同时直接服务出货量大的重要设备厂商,并在AI原生端侧设备上探索自有硬件产品。李大海透露,面壁已与高通形成全球战略合作,达到协同设计程度,在高效推理上的积累使其在手机、汽车等功耗敏感设备上具备竞争优势。

国产算力方面,李大海坦言,过去行业更多依赖英伟达芯片集群做训练,推理逐步转向国产芯片,但今年训练工作也开始向国产卡迁移。然而,国产芯片集群在软件生态上仍有很多课要补,模型公司无法独自完成所有适配工作,需要芯片公司提供更多支持。面壁一方面与国产芯片公司深入配合,另一方面与智源主导的FlagOS软件生态深度合作,从模型训练牵引和顶层规划两个方向推进。李宇轩补充说,训练对精度要求更高,面壁通过“模型风洞”技术先在华为等国产卡上进行深度评测,并与英伟达对齐,确认精度可用后再推进更大模型训练。

智能体方面,李大海认为技术正在快速进化,面壁早在2024年就已将智能体技术用于人工智能辅助审判并协助法官落地。但他也指出,外界对智能体的期待偏高,希望其实现零介入、100%完成并100%负责,这需要时间打磨。在手机场景中,端侧模型与智能体结合的重要方向是改变人与设备的交互方式,端侧模型在隐私友好性、实时性和可靠性上更具优势。

对于行业竞争激烈的背景下仍坚持开源,李大海解释,开源是高效商业模式,能以更低成本触达潜在客户,帮助客户在内部用更扎实的数据说服决策层,从而提升从技术影响力到商业合作的转化效率。他认为,一家公司的核心竞争力在“冰山之下”,已开源的部分不足以让别人完全学会核心能力,企业应靠技术前瞻性和速度持续构建更复杂的竞争优势。

谈及端侧AI的终局,李大海判断,长期看模型与芯片将走向更深协同,甚至模型公司也可能生产自己的芯片,但这仍是较远的终局,可能需要十年起步。模型侧可以跑得很快,但芯片流片背后仍有大量不能被AI自动完成的工作。面壁已初步完成用AI训练AI,下一步自然会考虑如何用AI去流片,但这一过程不会很快到来。

过去一年,面壁在资本、技术和产业落地上均有进展。资本层面获得了更多投资人支持,包括具有国家队属性的资本和产业资本。技术层面持续推进基础模型、数据治理和AI训练AI框架,并推出了流式全双工端侧全模态模型。产业层面,除了智能汽车和手机,面壁还将端侧模型部署到无人机、潜水器等终端,并在法律领域协助最高人民法院推进全国法院“一张网”试点,已落地全国20到30个城市。