在2025年智源大會期間,面壁智能CEO李大海與AI Infra負責人李宇軒接受了媒體群訪,圍繞端側模型進展、國產算力適配、智能體落地和開源策略等話題,釋放出一系列關鍵信號。其中最引人關注的判斷是:端側模型的智能水平已提前達到GPT-4級別。
李大海此前曾預測這一目標將在2026年底實現,如今進度大幅提前。他以面壁近期發佈的MiniCPM-5 1B版本為例,該模型在Artificial Analysis榜單上取得17.6分,與OpenAI在2024年5月發佈的GPT-4o得分僅差零點幾分,而後者參數規模約為200B,MiniCPM-5 1B僅有1B參數。李大海認為,這驗證了面壁一直強調的“大模型知識密度定律”——在參數規模大幅壓縮的同時,智能水平仍能持續提升。
儘管模型能力增長迅速,但端側落地的最大制約仍在芯片側。李大海指出,模型與芯片的結合是當前瓶頸,一批國產存算一體端側AI芯片正在流片,一旦這些芯片能夠提供更有競爭力的功耗、算力和帶寬,端側應用將迎來更多爆發。他將2025年定義為端側模型落地元年,去年四季度在汽車上的正式量產是重要標誌。在落地形態上,他主張端雲協同,將上下文管理和部分高頻推理放在端側完成,而非全部依賴雲端。
在產業定位上,面壁將自己視作“端側模型的基礎設施”。公司會持續發佈世界領先的端側基礎模型賦能開發者,同時直接服務出貨量大的重要設備廠商,並在AI原生端側設備上探索自有硬件產品。李大海透露,面壁已與高通形成全球戰略合作,達到協同設計程度,在高效推理上的積累使其在手機、汽車等功耗敏感設備上具備競爭優勢。
國產算力方面,李大海坦言,過去行業更多依賴英偉達芯片集群做訓練,推理逐步轉向國產芯片,但今年訓練工作也開始向國產卡遷移。然而,國產芯片集群在軟件生態上仍有很多課要補,模型公司無法獨自完成所有適配工作,需要芯片公司提供更多支持。面壁一方面與國產芯片公司深入配合,另一方面與智源主導的FlagOS軟件生態深度合作,從模型訓練牽引和頂層規劃兩個方向推進。李宇軒補充說,訓練對精度要求更高,面壁通過“模型風洞”技術先在華為等國產卡上進行深度評測,並與英偉達對齊,確認精度可用後再推進更大模型訓練。
智能體方面,李大海認為技術正在快速進化,面壁早在2024年就已將智能體技術用於人工智能輔助審判並協助法官落地。但他也指出,外界對智能體的期待偏高,希望其實現零介入、100%完成並100%負責,這需要時間打磨。在手機場景中,端側模型與智能體結合的重要方向是改變人與設備的交互方式,端側模型在隱私友好性、實時性和可靠性上更具優勢。
對於行業競爭激烈的背景下仍堅持開源,李大海解釋,開源是高效商業模式,能以更低成本觸達潛在客戶,幫助客戶在內部用更紮實的數據說服決策層,從而提升從技術影響力到商業合作的轉化效率。他認為,一家公司的核心競爭力在“冰山之下”,已開源的部分不足以讓別人完全學會核心能力,企業應靠技術前瞻性和速度持續構建更復雜的競爭優勢。
談及端側AI的終局,李大海判斷,長期看模型與芯片將走向更深協同,甚至模型公司也可能生產自己的芯片,但這仍是較遠的終局,可能需要十年起步。模型側可以跑得很快,但芯片流片背後仍有大量不能被AI自動完成的工作。面壁已初步完成用AI訓練AI,下一步自然會考慮如何用AI去流片,但這一過程不會很快到來。
過去一年,面壁在資本、技術和產業落地上均有進展。資本層面獲得了更多投資人支持,包括具有國家隊屬性的資本和產業資本。技術層面持續推進基礎模型、數據治理和AI訓練AI框架,並推出了流式全雙工端側全模態模型。產業層面,除了智能汽車和手機,面壁還將端側模型部署到無人機、潛水器等終端,並在法律領域協助最高人民法院推進全國法院“一張網”試點,已落地全國20到30個城市。