6月17日,阿里巴巴正式發佈了開放式世界模型產品HappyOyster 1.0(快樂生蠔1.0),為用戶提供了一種全新的AI數字世界構建與交互方式。與傳統的文生視頻模型不同,HappyOyster 1.0並非簡單地將文本轉化為單向播放的視頻,而是深度學習物理世界中從動作到反饋的因果轉移規律,能夠實時推演人物與環境的動態演變,並保持長程一致性。這意味著用戶不再是被動的觀看者,而是可以主動探索、實時導演甚至重塑數字世界的參與者。

HappyOyster 1.0的核心能力分為兩大模式:世界探索(Adventure)和實時導演(Directing)。在世界探索模式下,用戶只需輸入一句話或上傳一張圖片,系統就能生成一個可深度交互的數字環境。該版本在交互功能上進行了顯著升級,新增了前衝、下蹲、跳躍、攻擊等操控按鍵,甚至支持載具駕駛與武器戰鬥等複雜物理交互,豐富了人物的運動軌跡。實時導演模式則賦予了用戶“上帝視角”,通過新增的暫停、回溯與分支敘事能力,用戶可以在體驗過程中的任意節點暫停,並跳回劇情中的關鍵節點,輸入新的提示詞來改變故事走向。這種設計讓同一個初始設定能夠以極低的成本衍生出無限可能,將傳統的線性敘事轉化為用戶掌握主動權的互動體驗。

從技術路徑來看,HappyOyster 1.0的突破源於其學習目標的根本差異。文生視頻模型追求的是文本到視頻的單向映射,而世界模型的學習目標是從“當前狀態與動作”到“下一狀態與動作”的轉移規律。該模型從海量自然視頻中學習現實世界的人物、事物和環境演變,自主推演因果鏈,從而能夠泛化到未見過的場景,並根據用戶指令推理出新的因果關係,維持數字世界的長程穩定以及音視頻的長時協同。目前,世界探索模式支持長達1分鐘的連續實時位移與鏡頭控制,實時導演模式則可生成3分鐘以上的480p或720p實時畫面,且生成內容均支持一鍵分享。

在應用前景上,HappyOyster 1.0瞄準了多個行業。在交互式遊戲領域,開發者無需耗費數週時間編寫代碼和測試,通過上傳圖片和輸入提示詞,就能快速生成符合物理規律的開放世界原型、角色交互和戰鬥場景。在互動短劇、虛擬陪伴或直播場景中,用戶可以通過自然語言指令構建人物和劇情,並在任意節點改寫畫面、角色或劇情走向。文旅行業同樣能從中受益,該產品可以為遊客提供沉浸式的探索體驗,生成具備穩定一致性的數字人IP,並允許遊客自主決定遊覽路線,甚至步入深海、月球等奇幻場景。

值得注意的是,世界模型作為一個新興賽道,目前仍處於發展早期,業界缺乏可量化的測評標準。為此,HappyOyster團隊已聯合南京大學,著手打造首個覆蓋過程交互、跨模態對齊、長程一致性與物理仿真驗證的行業基準,試圖填補這一空白。據悉,HappyOyster 1.0近期還將全面開放API接口,以吸引更多行業夥伴共建生態。官網現已開放用戶註冊體驗,每日登錄可免費領取積分,用於探索這一實時交互的數字世界。

對於AI產業投資者和從業者而言,HappyOyster 1.0的發佈不僅展示了阿里在多模態模型領域的前沿探索,更揭示了世界模型從理論走向產品化的加速趨勢。它可能重新定義互動內容的生產方式,降低遊戲開發、虛擬體驗等場景的創作門檻,並對算力基礎設施提出新的需求。隨著API的開放和行業基準的建立,這一賽道或將吸引更多資本與人才湧入,推動應用層創新進入實時交互的新階段。