在6月12日開幕的智源大會2026上,智源研究院集中展示了近一年在基座大模型、智能體和基礎軟硬件生態三方面的研究進展,釋放出AI技術加速向實體領域滲透的信號。
基座大模型方面,智源分享了原生多模態大模型悟界Emu3.5的最新動態。該模型於去年10月開源,今年1月登上《Nature》正刊,成為國內多模態大模型方向的首篇頂刊論文。Emu3.5通過Next-Token Prediction統一了文本、圖像和視頻的理解與生成。智源還將這一技術路線拓展至神經科學領域,正式發佈悟界·Brainμ 1.0,該模型能夠實現腦信號與文字、圖像、聲音之間的雙向轉化。伴隨模型亮相的,還有全球最大最全的AI-Ready神經科學數據集,以及全球最大的AI-Ready神經科學數據平臺BrainToken。這些基礎設施有望加速腦科學與AI的交叉研究。
在AI藥物發現領域,智源發佈了悟界·OpenComplex 2.5,這是一款可泛化物理支持的下一代AI驅動藥物發現模型。它通過單一流程覆蓋口袋識別、反向篩選、結構預測和形成力預測四大關鍵步驟,在多個基準測試上的核心指標超越了傳統物理方法和現有AI模型。
智能體成為本次大會的另一大焦點。智源進一步介紹了其具身大腦悟界·RoboBrain Orca v0,該模型以“下一個物理狀態預測”為核心,融合多模態交互數據,已與50餘家企業合作。現場發佈的四款智能體產品分別瞄準垂直場景:與安貞醫院共同研發的心臟疾病輔助診斷智能體,其診斷精度達到該院頂尖心血管醫生水平;面向科學發現的自主研究智能體AREX,覆蓋信息調研、方案設計、實驗探究和報告撰寫全流程,背後基座模型在權威基準測試中可媲美萬億參數旗艦模型;本屆大會專屬的聽會智能體SoulAgent,提供一站式參會體驗和專家AI問答;以及通過紅隊實驗驗證的有害蛋白識別智能體,相關測試報告將在近期公佈。
基礎軟硬件生態方面,智源聯合開源社區將眾智FlagOS升級至2.1版本。該系統已適配18家芯片廠商的32款芯片,成為全球適配芯片品類最多的計算系統。FlagOS內置超600個算子,為廠商提供統一AI編譯器和通用技術支持,可支撐90%以上主流開源模型部署,近期已完成DeepSeek、千問、MiniMax等多款熱門模型的無縫適配。
大會的開幕演講和圓桌對話也引發廣泛討論。2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出,當前依賴反饋控制的方法效果不佳,主張形式化方法才是未來,即先明確形式化規範、再編寫程序、最後用數學證明程序符合規範。他樂觀認為,未來AI將成為完成這些證明的工具,大幅提升系統可靠性。演講尾聲,Diffie給出驚人預測:到2050年,機器智能將超越人類,成為世界運行的主宰。
另一位圖靈獎得主Andrew Barto則將強化學習歸結為“控制、搜索與聯想記憶”的三位一體,指出機器學習最初就是強化學習,並警示獎勵信號設計可能帶來“反常實例化”風險。他強調深度強化學習與大腦獎勵系統最新成果的結合將指引下一輪方向。
在播客環節,中國工程院院士、阿里雲創始人王堅與智源研究院理事長黃鐵軍對話,探討中國大模型如何從追趕驗證轉向路線選擇與範式創新,突破互聯網文本數據和算力短缺的極限。圓桌對話中,小米羅福莉、清華朱軍、劉知遠和南洋理工安波四位專家就Claude Fable 5的本質、Token消耗下降趨勢、Anthropic在代碼領域的成功路徑以及AI自進化對開放環境的需求等話題進行了深入交流。
從本屆大會可以看出,AI行業正走出單純追逐模型參數規模的階段,向腦科學、藥物研發、心臟疾病診斷等實體應用領域縱深發展。同時,基礎軟硬件生態的加速落地,尤其是對多元芯片的廣泛適配,為模型部署提供了更堅實的底層支撐。兩位圖靈獎得主與國內專家的共識也表明,隨著技術持續演進,技術路線規劃、安全體系搭建和人機協同關係等核心議題,已成為全行業必須正視的挑戰。