雲知聲釋出原生Agent大模型U2，評測躋身國產第一陣列

“港股AGI第一股”雲知聲在6月8日釋出了其最新自研成果——通用大語言模型U2。這款模型並未沿襲行業盲目堆砌引數和Token的路徑，而是基於MoE（混合專家）範式，融合了快思考與慢思考機制，旨在實現“小引數強能力、少Token高產出、低算力低成本”的目標。

從公佈的基準測試成績來看，U2已展現出躋身國產大模型第一陣列的實力。在衡量長上下文能力的AA-LCR評測中，U2以70分位居對比模型首位，領先第二名0.5分。知識與推理能力方面，U2以87.9分的成績領跑。指令遵循能力上，其IFBench得分為77.3分，同樣位列第一。在備受關注的智慧體能力上，U2在SWE-Bench Verified評測中獲得75分，排名第三；在Claw-Eval評測中得分76.9分，僅次於MiniMax的相關模型。此外，在面向真實辦公場景的GDPval評測中，U2也取得了72.5分，顯示出紮實的專業任務交付能力。

U2的核心差異化在於其“原生智慧體”的定位。它並非一個主要面向聊天場景的對話模型，而是一個擁有近3000億引數、面向任務執行的系統。通過內建的長程工作編排與自主糾錯能力，U2可以像一位高階工程師那樣，將複雜任務拆解、排序、執行，並在過程中自我校驗和修正。例如，它能夠獨立完成從後端邏輯到前端頁面排布的全流程程式設計任務，甚至可以根據簡單指令自動搜尋規則、生成可玩的俄羅斯方塊遊戲。在處理如大宗商品市場分析這類需要跨行業資料檢索、多源資訊清洗和深度結構化分析的複雜知識工作時，U2也能在短時間內整合零散資訊，生成帶有資料表格和邏輯判斷的詳細報告。

支撐這種高效任務執行能力的是U2在技術架構上的多項創新。為提升“智慧密度”，雲知聲對高質量知識資料進行了深度提純和結構化編碼，讓小引數模型承載了更大的知識量。模型採用高效稀疏架構，啟用引數僅佔總量的約十分之一，顯著降低了推理成本。同時，通過最佳化語義表徵和壓縮推理路徑，U2的單個Token能承載更豐富的語義資訊，從而用更少的Token完成更復雜的任務。在複雜推理層面，U2引入了獨特的“混合思考機制”，借鑑人腦解題方式，在隱空間進行高效探索，並在不確定性升高時切換回顯式思維鏈，這套機制在保留多路徑探索能力的同時，節省了約25%的思考Token消耗。此外，通過Agent-Harness協同訓練範式，模型的智慧體能力與任務執行鏈路在訓練閉環中相互促進、持續最佳化。

雲知聲的技術佈局不止於模型層。自2012年成立以來，公司已構建起“晶片+算力+模型+應用”的全棧AI能力，其自研“蜂鳥”系列晶片出貨量已超億顆，這為其在端側部署大模型提供了獨特優勢。在商業化層面，雲知聲的產品已深度落地於智慧醫療、智慧交通、智慧生活及物聯網等多個領域。例如，其醫療解決方案已在近450家醫院部署，交通方案服務於深圳、廣州等多地地鐵系統。這種在高價值B端場景的深耕，使其成為國產大模型公司中變現能力突出的玩家。財報資料顯示，雲知聲2025年營收達12.1億元，同比增長29%，其中大模型相關收入達6.1億元，同比暴漲1076%，已撐起半壁江山。公司虧損顯著收窄，下半年已幾近盈虧平衡。

U2的釋出，不僅是雲知聲自身從語音技術公司向AGI公司跨越的又一個里程碑，也折射出國產大模型產業正在從引數競賽轉向追求真實場景效率與商業閉環的成熟化趨勢。其“低算力成本、高任務產出”的路徑，為行業提供了在應用層實現規模化落地的另一種可能。

雲知聲釋出原生Agent大模型U2，評測躋身國產第一陣列

延伸閱讀

相關深度報道

相關每日新聞