一個名為τ0-WM的開源具身世界模型近日正式亮相,其核心突破在於使用了17800小時的真實機器人操作數據進行預訓練,據稱為迄今最大規模的真機數據驅動具身模型。該模型的目標是讓機器人更好地理解物理環境,並在行動前模擬潛在後果,從而提升複雜任務中的決策水平。
所謂世界模型,相當於賦予機器人一種“想象力”——它能夠根據當前狀態和候選動作,預測未來可能的環境變化,從而在內部完成規劃,大幅減少現實試錯的成本。以往的具身世界模型大多基於仿真環境生成的數據訓練,但仿真與現實之間的鴻溝常常導致模型在真實場景中表現不佳。τ0-WM直接採用海量真機採集的操縱數據,且完全開源,這意味著更多研究者可以直接在真實數據驅動的模型基礎上進行二次開發和領域適配。
從產業視角看,這一進展同時觸動了“五層蛋糕”中的模型層與應用層。在模型層,開源的大規模預訓練世界模型為具身智能提供了類似大語言模型的基礎設施,下游企業可在此基礎上微調以解決特定任務,顯著降低研發門檻。在應用層,更準確的環境理解與動作規劃能力有望加速機器人在倉儲、柔性製造、家庭服務等領域的滲透。此外,17800小時的真實數據採集與模型訓練對算力提出了更高要求,未來隨著更多企業跟進此類路線,對GPU等基礎設施的需求可能進一步擴大。不過,目前該模型的實際泛化效果仍需在多樣化的下游任務中得到驗證,投資者宜關注後續是否有配套的硬件合作或商業化試點項目推出。