云知声发布原生Agent大模型U2，评测跻身国产第一阵列

“港股AGI第一股”云知声在6月8日发布了其最新自研成果——通用大语言模型U2。这款模型并未沿袭行业盲目堆砌参数和Token的路径，而是基于MoE（混合专家）范式，融合了快思考与慢思考机制，旨在实现“小参数强能力、少Token高产出、低算力低成本”的目标。

从公布的基准测试成绩来看，U2已展现出跻身国产大模型第一阵列的实力。在衡量长上下文能力的AA-LCR评测中，U2以70分位居对比模型首位，领先第二名0.5分。知识与推理能力方面，U2以87.9分的成绩领跑。指令遵循能力上，其IFBench得分为77.3分，同样位列第一。在备受关注的智能体能力上，U2在SWE-Bench Verified评测中获得75分，排名第三；在Claw-Eval评测中得分76.9分，仅次于MiniMax的相关模型。此外，在面向真实办公场景的GDPval评测中，U2也取得了72.5分，显示出扎实的专业任务交付能力。

U2的核心差异化在于其“原生智能体”的定位。它并非一个主要面向聊天场景的对话模型，而是一个拥有近3000亿参数、面向任务执行的系统。通过内置的长程工作编排与自主纠错能力，U2可以像一位高级工程师那样，将复杂任务拆解、排序、执行，并在过程中自我校验和修正。例如，它能够独立完成从后端逻辑到前端页面排布的全流程编程任务，甚至可以根据简单指令自动搜索规则、生成可玩的俄罗斯方块游戏。在处理如大宗商品市场分析这类需要跨行业数据检索、多源信息清洗和深度结构化分析的复杂知识工作时，U2也能在短时间内整合零散信息，生成带有数据表格和逻辑判断的详细报告。

支撑这种高效任务执行能力的是U2在技术架构上的多项创新。为提升“智能密度”，云知声对高质量知识数据进行了深度提纯和结构化编码，让小参数模型承载了更大的知识量。模型采用高效稀疏架构，激活参数仅占总量的约十分之一，显著降低了推理成本。同时，通过优化语义表征和压缩推理路径，U2的单个Token能承载更丰富的语义信息，从而用更少的Token完成更复杂的任务。在复杂推理层面，U2引入了独特的“混合思考机制”，借鉴人脑解题方式，在隐空间进行高效探索，并在不确定性升高时切换回显式思维链，这套机制在保留多路径探索能力的同时，节省了约25%的思考Token消耗。此外，通过Agent-Harness协同训练范式，模型的智能体能力与任务执行链路在训练闭环中相互促进、持续优化。

云知声的技术布局不止于模型层。自2012年成立以来，公司已构建起“芯片+算力+模型+应用”的全栈AI能力，其自研“蜂鸟”系列芯片出货量已超亿颗，这为其在端侧部署大模型提供了独特优势。在商业化层面，云知声的产品已深度落地于智慧医疗、智慧交通、智慧生活及物联网等多个领域。例如，其医疗解决方案已在近450家医院部署，交通方案服务于深圳、广州等多地地铁系统。这种在高价值B端场景的深耕，使其成为国产大模型公司中变现能力突出的玩家。财报数据显示，云知声2025年营收达12.1亿元，同比增长29%，其中大模型相关收入达6.1亿元，同比暴涨1076%，已撑起半壁江山。公司亏损显著收窄，下半年已几近盈亏平衡。

U2的发布，不仅是云知声自身从语音技术公司向AGI公司跨越的又一个里程碑，也折射出国产大模型产业正在从参数竞赛转向追求真实场景效率与商业闭环的成熟化趋势。其“低算力成本、高任务产出”的路径，为行业提供了在应用层实现规模化落地的另一种可能。

云知声发布原生Agent大模型U2，评测跻身国产第一阵列

延伸阅读

相关深度报道

相关每日新闻