在6月12日开幕的智源大会2026上,智源研究院集中展示了近一年在基座大模型、智能体和基础软硬件生态三方面的研究进展,释放出AI技术加速向实体领域渗透的信号。

基座大模型方面,智源分享了原生多模态大模型悟界Emu3.5的最新动态。该模型于去年10月开源,今年1月登上《Nature》正刊,成为国内多模态大模型方向的首篇顶刊论文。Emu3.5通过Next-Token Prediction统一了文本、图像和视频的理解与生成。智源还将这一技术路线拓展至神经科学领域,正式发布悟界·Brainμ 1.0,该模型能够实现脑信号与文字、图像、声音之间的双向转化。伴随模型亮相的,还有全球最大最全的AI-Ready神经科学数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken。这些基础设施有望加速脑科学与AI的交叉研究。

在AI药物发现领域,智源发布了悟界·OpenComplex 2.5,这是一款可泛化物理支持的下一代AI驱动药物发现模型。它通过单一流程覆盖口袋识别、反向筛选、结构预测和形成力预测四大关键步骤,在多个基准测试上的核心指标超越了传统物理方法和现有AI模型。

智能体成为本次大会的另一大焦点。智源进一步介绍了其具身大脑悟界·RoboBrain Orca v0,该模型以“下一个物理状态预测”为核心,融合多模态交互数据,已与50余家企业合作。现场发布的四款智能体产品分别瞄准垂直场景:与安贞医院共同研发的心脏疾病辅助诊断智能体,其诊断精度达到该院顶尖心血管医生水平;面向科学发现的自主研究智能体AREX,覆盖信息调研、方案设计、实验探究和报告撰写全流程,背后基座模型在权威基准测试中可媲美万亿参数旗舰模型;本届大会专属的听会智能体SoulAgent,提供一站式参会体验和专家AI问答;以及通过红队实验验证的有害蛋白识别智能体,相关测试报告将在近期公布。

基础软硬件生态方面,智源联合开源社区将众智FlagOS升级至2.1版本。该系统已适配18家芯片厂商的32款芯片,成为全球适配芯片品类最多的计算系统。FlagOS内置超600个算子,为厂商提供统一AI编译器和通用技术支持,可支撑90%以上主流开源模型部署,近期已完成DeepSeek、千问、MiniMax等多款热门模型的无缝适配。

大会的开幕演讲和圆桌对话也引发广泛讨论。2015年图灵奖得主Whitfield Diffie围绕AI安全提出,当前依赖反馈控制的方法效果不佳,主张形式化方法才是未来,即先明确形式化规范、再编写程序、最后用数学证明程序符合规范。他乐观认为,未来AI将成为完成这些证明的工具,大幅提升系统可靠性。演讲尾声,Diffie给出惊人预测:到2050年,机器智能将超越人类,成为世界运行的主宰。

另一位图灵奖得主Andrew Barto则将强化学习归结为“控制、搜索与联想记忆”的三位一体,指出机器学习最初就是强化学习,并警示奖励信号设计可能带来“反常实例化”风险。他强调深度强化学习与大脑奖励系统最新成果的结合将指引下一轮方向。

在播客环节,中国工程院院士、阿里云创始人王坚与智源研究院理事长黄铁军对话,探讨中国大模型如何从追赶验证转向路线选择与范式创新,突破互联网文本数据和算力短缺的极限。圆桌对话中,小米罗福莉、清华朱军、刘知远和南洋理工安波四位专家就Claude Fable 5的本质、Token消耗下降趋势、Anthropic在代码领域的成功路径以及AI自进化对开放环境的需求等话题进行了深入交流。

从本届大会可以看出,AI行业正走出单纯追逐模型参数规模的阶段,向脑科学、药物研发、心脏疾病诊断等实体应用领域纵深发展。同时,基础软硬件生态的加速落地,尤其是对多元芯片的广泛适配,为模型部署提供了更坚实的底层支撑。两位图灵奖得主与国内专家的共识也表明,随着技术持续演进,技术路线规划、安全体系搭建和人机协同关系等核心议题,已成为全行业必须正视的挑战。