面壁CEO：端側模型已提前達到GPT-4水平，國產晶片軟體生態仍需補課

面壁智慧CEO稱端側模型智慧水平提前達到GPT-4，2025年為落地元年。

在2025年智源大會期間，面壁智慧CEO李大海與AI Infra負責人李宇軒接受了媒體群訪，圍繞端側模型進展、國產算力適配、智慧體落地和開源策略等話題，釋放出一系列關鍵訊號。其中最引人關注的判斷是：端側模型的智慧水平已提前達到GPT-4級別。

李大海此前曾預測這一目標將在2026年底實現，如今進度大幅提前。他以面壁近期釋出的MiniCPM-5 1B版本為例，該模型在Artificial Analysis榜單上取得17.6分，與OpenAI在2024年5月釋出的GPT-4o得分僅差零點幾分，而後者引數規模約為200B，MiniCPM-5 1B僅有1B引數。李大海認為，這驗證了面壁一直強調的“大模型知識密度定律”——在引數規模大幅壓縮的同時，智慧水平仍能持續提升。

儘管模型能力增長迅速，但端側落地的最大制約仍在晶片側。李大海指出，模型與晶片的結合是當前瓶頸，一批國產存算一體端側AI晶片正在流片，一旦這些晶片能夠提供更有競爭力的功耗、算力和頻寬，端側應用將迎來更多爆發。他將2025年定義為端側模型落地元年，去年四季度在汽車上的正式量產是重要標誌。在落地形態上，他主張端雲協同，將上下文管理和部分高頻推理放在端側完成，而非全部依賴雲端。

在產業定位上，面壁將自己視作“端側模型的基礎設施”。公司會持續釋出世界領先的端側基礎模型賦能開發者，同時直接服務出貨量大的重要裝置廠商，並在AI原生端側裝置上探索自有硬體產品。李大海透露，面壁已與高通形成全球戰略合作，達到協同設計程度，在高效推理上的積累使其在手機、汽車等功耗敏感裝置上具備競爭優勢。

國產算力方面，李大海坦言，過去行業更多依賴輝達晶片叢集做訓練，推理逐步轉向國產晶片，但今年訓練工作也開始向國產卡遷移。然而，國產晶片叢集在軟體生態上仍有很多課要補，模型公司無法獨自完成所有適配工作，需要晶片公司提供更多支援。面壁一方面與國產晶片公司深入配合，另一方面與智源主導的FlagOS軟體生態深度合作，從模型訓練牽引和頂層規劃兩個方向推進。李宇軒補充說，訓練對精度要求更高，面壁通過“模型風洞”技術先在華為等國產卡上進行深度評測，並與輝達對齊，確認精度可用後再推進更大模型訓練。

智慧體方面，李大海認為技術正在快速進化，面壁早在2024年就已將智慧體技術用於人工智慧輔助審判並協助法官落地。但他也指出，外界對智慧體的期待偏高，希望其實現零介入、100%完成並100%負責，這需要時間打磨。在手機場景中，端側模型與智慧體結合的重要方向是改變人與裝置的互動方式，端側模型在隱私友好性、即時性和可靠性上更具優勢。

對於行業競爭激烈的背景下仍堅持開源，李大海解釋，開源是高效商業模式，能以更低成本觸達潛在客戶，幫助客戶在內部用更紮實的資料說服決策層，從而提升從技術影響力到商業合作的轉化效率。他認為，一家公司的核心競爭力在“冰山之下”，已開源的部分不足以讓別人完全學會核心能力，企業應靠技術前瞻性和速度持續構建更復雜的競爭優勢。

談及端側AI的終局，李大海判斷，長期看模型與晶片將走向更深協同，甚至模型公司也可能生產自己的晶片，但這仍是較遠的終局，可能需要十年起步。模型側可以跑得很快，但晶片流片背後仍有大量不能被AI自動完成的工作。面壁已初步完成用AI訓練AI，下一步自然會考慮如何用AI去流片，但這一過程不會很快到來。

過去一年，面壁在資本、技術和產業落地上均有進展。資本層面獲得了更多投資人支援，包括具有國家隊屬性的資本和產業資本。技術層面持續推進基礎模型、資料治理和AI訓練AI框架，並推出了流式全雙工端側全模態模型。產業層面，除了智慧汽車和手機，面壁還將端側模型部署到無人機、潛水器等終端，並在法律領域協助最高人民法院推進全國法院“一張網”試點，已落地全國20到30個城市。

面壁CEO：端側模型已提前達到GPT-4水平，國產晶片軟體生態仍需補課

延伸閱讀

相關深度報道

相關每日新聞