6月29日,一场聚焦机器人学习范式变革的大会在北京首钢园举行。由他山科技OpenMind Global Research共同发起、北京具身智能研究院联合主办的“机器人幼儿园启幕大会”上,他山科技与2024年图灵奖得主理查德·萨顿教授团队联合共建的“机器人幼儿园”正式揭牌。这是强化学习理论在具身智能领域的首个实体落点,试图将机器人从依赖被动模仿的“数据时代”,推向通过交互试错自主进化的“经验时代”。

他山科技董事长孙滕谌在欢迎辞中指出,全球人工智能产业正向“实体生产力”转型,行业亟需一套全新的技术范式。“机器人幼儿园”以触觉感知为核心突破口,目标是打通强化学习实践全流程能力闭环,让机器人在自主触碰、持续试错中积累经验、迭代进化。

被誉为“强化学习之父”的萨顿教授系统阐述了项目核心理念。他援引艾伦·图灵在1950年论文中的洞见,认为与其模拟成年人思维,不如开发一个能像儿童一样不断成长、学会思考的程序。萨顿指出,过去受限于脆弱的硬件,机器人难以获得扎根现实的广泛经验;如今硬件取得巨大进步且成本降低,机器人必须通过交互学习,在整个部署生命周期中像婴儿一样从经验积累中逐步学习。他强调,与他山科技共建的机器人幼儿园,正是基于这一理念,让机器人在没有人类示例的情况下实现在线学习。

他山科技CEO马扬从产业角度剖析了建设“幼儿园”的必要性。他认为,机器人需要的不是孤立的数据,而是在交互中持续产生并不断更新的经验。触觉是人类和机器人与客观世界产生交互的唯一通道。他山科技自2017年成立起便聚焦于此,目前已有数十万个触觉指尖应用于全球不同的人形机器人。马扬表示,他山科技将为机器人幼儿园提供四个核心条件:允许犯错的机会、安全的探索环境、持续的真实交互、及时而明确的反馈。他同时发出倡议,欢迎所有具身智能从业者共同参与机器人的启蒙。

揭牌仪式后,“机器人幼儿园首批联合共建生态伙伴”启动仪式举行。加速进化、云迹科技、因时机器人、节卡机器人、紫东太初等企业与机构代表同台,共同启动生态共建计划,合力打造一个开放、安全、鼓励试错与自主进化的创新生态。

在技术纵深层面,他山科技研发副总裁侯广东指出,公司与萨顿教授正在探索“真实系统上长程持续学习”的新范式,计划利用触觉定义机器人“疼痛”机制,并驱动机器人内在探索动机。OpenMind研究员Dr. Kris De Asis则提出“为学习而设计”的理念,认为机器人磨损和故障并非实时学习的障碍,反而是其必须经历的环境,机器人会根据这些情况学习执行任务。

随后的圆桌讨论中,萨顿教授分享合作渊源时表示,选择他山科技是因为其对触觉的专注以及双方共同相信经验学习的力量。他山科技董事长孙滕谌阐释了触觉与强化学习的深度融合:电容式触觉的接近觉能力让机器人在碰撞前即可预警规避,大幅降低试错成本;动态触觉技术将时间分辨率提升至微秒级,叠加类脑芯片对算法的天然支持,为自主学习筑牢硬件基础。北京人形机器人创新中心CEO熊友军强调,开放的生态比单点突破更重要,需要产学研用分层协同。软银中国管理合伙人宋安澜从投资视角判断,这一全球首创的学习范式将在几年内产生显著经济效应。

另一场圆桌则聚焦机器人如何从幼儿园走向真实世界。中信证券投资黄耀庭直言,产业重心应回归学习方法与能力的持续进化。Dr. Kris De Asis倡导硬件与模型同步开源以加速创新共享。首钢基金总经理张檬指出,机器人企业需从解决小问题开始,才能真正理解工业流程的串联。节卡机器人副总裁许雄强调,安全与交互性是让机器人走出物理围栏的关键。因时机器人联合创始人陈希描绘了灵巧手作为多模态感知数据收集器的未来。云迹科技首席发展官谢云鹏则分享了通过深耕配送场景、在边用边学中让非刚需成为刚需的商业化方法论。

大会期间,萨顿教授还受邀面向国内具身智能行业进行了一整天的闭门授课,从理念框架、工程范式、核心挑战到算法引擎,系统性阐述了从数据驱动走向经验驱动的强化学习思想体系。他特别强调了“坚韧”这一价值观——保持谦逊、善良、乐观,这与他山科技长期坚持的企业精神不谋而合。在他山科技的推动下,此类高密度、重交流的学术活动,有望成为具身智能启蒙的重要思想策源地。