“港股AGI第一股”雲知聲在6月8日發佈了其最新自研成果——通用大語言模型U2。這款模型並未沿襲行業盲目堆砌參數和Token的路徑,而是基於MoE(混合專家)範式,融合了快思考與慢思考機制,旨在實現“小參數強能力、少Token高產出、低算力低成本”的目標。

從公佈的基準測試成績來看,U2已展現出躋身國產大模型第一陣列的實力。在衡量長上下文能力的AA-LCR評測中,U2以70分位居對比模型首位,領先第二名0.5分。知識與推理能力方面,U2以87.9分的成績領跑。指令遵循能力上,其IFBench得分為77.3分,同樣位列第一。在備受關注的智能體能力上,U2在SWE-Bench Verified評測中獲得75分,排名第三;在Claw-Eval評測中得分76.9分,僅次於MiniMax的相關模型。此外,在面向真實辦公場景的GDPval評測中,U2也取得了72.5分,顯示出紮實的專業任務交付能力。

U2的核心差異化在於其“原生智能體”的定位。它並非一個主要面向聊天場景的對話模型,而是一個擁有近3000億參數、面向任務執行的系統。通過內置的長程工作編排與自主糾錯能力,U2可以像一位高級工程師那樣,將複雜任務拆解、排序、執行,並在過程中自我校驗和修正。例如,它能夠獨立完成從後端邏輯到前端頁面排布的全流程編程任務,甚至可以根據簡單指令自動搜索規則、生成可玩的俄羅斯方塊遊戲。在處理如大宗商品市場分析這類需要跨行業數據檢索、多源信息清洗和深度結構化分析的複雜知識工作時,U2也能在短時間內整合零散信息,生成帶有數據表格和邏輯判斷的詳細報告。

支撐這種高效任務執行能力的是U2在技術架構上的多項創新。為提升“智能密度”,雲知聲對高質量知識數據進行了深度提純和結構化編碼,讓小參數模型承載了更大的知識量。模型採用高效稀疏架構,激活參數僅佔總量的約十分之一,顯著降低了推理成本。同時,通過優化語義表徵和壓縮推理路徑,U2的單個Token能承載更豐富的語義信息,從而用更少的Token完成更復雜的任務。在複雜推理層面,U2引入了獨特的“混合思考機制”,借鑑人腦解題方式,在隱空間進行高效探索,並在不確定性升高時切換回顯式思維鏈,這套機制在保留多路徑探索能力的同時,節省了約25%的思考Token消耗。此外,通過Agent-Harness協同訓練範式,模型的智能體能力與任務執行鏈路在訓練閉環中相互促進、持續優化。

雲知聲的技術佈局不止於模型層。自2012年成立以來,公司已構建起“芯片+算力+模型+應用”的全棧AI能力,其自研“蜂鳥”系列芯片出貨量已超億顆,這為其在端側部署大模型提供了獨特優勢。在商業化層面,雲知聲的產品已深度落地於智慧醫療、智慧交通、智慧生活及物聯網等多個領域。例如,其醫療解決方案已在近450家醫院部署,交通方案服務於深圳、廣州等多地地鐵系統。這種在高價值B端場景的深耕,使其成為國產大模型公司中變現能力突出的玩家。財報數據顯示,雲知聲2025年營收達12.1億元,同比增長29%,其中大模型相關收入達6.1億元,同比暴漲1076%,已撐起半壁江山。公司虧損顯著收窄,下半年已幾近盈虧平衡。

U2的發佈,不僅是雲知聲自身從語音技術公司向AGI公司跨越的又一個里程碑,也折射出國產大模型產業正在從參數競賽轉向追求真實場景效率與商業閉環的成熟化趨勢。其“低算力成本、高任務產出”的路徑,為行業提供了在應用層實現規模化落地的另一種可能。