6月29日,一場聚焦機器人學習範式變革的大會在北京首鋼園舉行。由他山科技與OpenMind Global Research共同發起、北京具身智能研究院聯合主辦的“機器人幼兒園啟幕大會”上,他山科技與2024年圖靈獎得主理查德·薩頓教授團隊聯合共建的“機器人幼兒園”正式揭牌。這是強化學習理論在具身智能領域的首個實體落點,試圖將機器人從依賴被動模仿的“數據時代”,推向通過交互試錯自主進化的“經驗時代”。
他山科技董事長孫滕諶在歡迎辭中指出,全球人工智能產業正向“實體生產力”轉型,行業亟需一套全新的技術範式。“機器人幼兒園”以觸覺感知為核心突破口,目標是打通強化學習實踐全流程能力閉環,讓機器人在自主觸碰、持續試錯中積累經驗、迭代進化。
被譽為“強化學習之父”的薩頓教授系統闡述了項目核心理念。他援引艾倫·圖靈在1950年論文中的洞見,認為與其模擬成年人思維,不如開發一個能像兒童一樣不斷成長、學會思考的程序。薩頓指出,過去受限於脆弱的硬件,機器人難以獲得紮根現實的廣泛經驗;如今硬件取得巨大進步且成本降低,機器人必須通過交互學習,在整個部署生命週期中像嬰兒一樣從經驗積累中逐步學習。他強調,與他山科技共建的機器人幼兒園,正是基於這一理念,讓機器人在沒有人類示例的情況下實現在線學習。
他山科技CEO馬揚從產業角度剖析了建設“幼兒園”的必要性。他認為,機器人需要的不是孤立的數據,而是在交互中持續產生並不斷更新的經驗。觸覺是人類和機器人與客觀世界產生交互的唯一通道。他山科技自2017年成立起便聚焦於此,目前已有數十萬個觸覺指尖應用於全球不同的人形機器人。馬揚表示,他山科技將為機器人幼兒園提供四個核心條件:允許犯錯的機會、安全的探索環境、持續的真實交互、及時而明確的反饋。他同時發出倡議,歡迎所有具身智能從業者共同參與機器人的啟蒙。
揭牌儀式後,“機器人幼兒園首批聯合共建生態夥伴”啟動儀式舉行。加速進化、雲跡科技、因時機器人、節卡機器人、紫東太初等企業與機構代表同臺,共同啟動生態共建計劃,合力打造一個開放、安全、鼓勵試錯與自主進化的創新生態。
在技術縱深層面,他山科技研發副總裁侯廣東指出,公司與薩頓教授正在探索“真實系統上長程持續學習”的新範式,計劃利用觸覺定義機器人“疼痛”機制,並驅動機器人內在探索動機。OpenMind研究員Dr. Kris De Asis則提出“為學習而設計”的理念,認為機器人磨損和故障並非實時學習的障礙,反而是其必須經歷的環境,機器人會根據這些情況學習執行任務。
隨後的圓桌討論中,薩頓教授分享合作淵源時表示,選擇他山科技是因為其對觸覺的專注以及雙方共同相信經驗學習的力量。他山科技董事長孫滕諶闡釋了觸覺與強化學習的深度融合:電容式觸覺的接近覺能力讓機器人在碰撞前即可預警規避,大幅降低試錯成本;動態觸覺技術將時間分辨率提升至微秒級,疊加類腦芯片對算法的天然支持,為自主學習築牢硬件基礎。北京人形機器人創新中心CEO熊友軍強調,開放的生態比單點突破更重要,需要產學研用分層協同。軟銀中國管理合夥人宋安瀾從投資視角判斷,這一全球首創的學習範式將在幾年內產生顯著經濟效應。
另一場圓桌則聚焦機器人如何從幼兒園走向真實世界。中信證券投資黃耀庭直言,產業重心應迴歸學習方法與能力的持續進化。Dr. Kris De Asis倡導硬件與模型同步開源以加速創新共享。首鋼基金總經理張檬指出,機器人企業需從解決小問題開始,才能真正理解工業流程的串聯。節卡機器人副總裁許雄強調,安全與交互性是讓機器人走出物理圍欄的關鍵。因時機器人聯合創始人陳希描繪了靈巧手作為多模態感知數據收集器的未來。雲跡科技首席發展官謝雲鵬則分享了通過深耕配送場景、在邊用邊學中讓非剛需成為剛需的商業化方法論。
大會期間,薩頓教授還受邀面向國內具身智能行業進行了一整天的閉門授課,從理念框架、工程範式、核心挑戰到算法引擎,系統性闡述了從數據驅動走向經驗驅動的強化學習思想體系。他特別強調了“堅韌”這一價值觀——保持謙遜、善良、樂觀,這與他山科技長期堅持的企業精神不謀而合。在他山科技的推動下,此類高密度、重交流的學術活動,有望成為具身智能啟蒙的重要思想策源地。