美國AI獨角獸Odyssey近日完成了一輪規模達3.1億美元的新融資,投後估值攀升至14.5億美元。這家成立於2023年的初創公司,專注於訓練基於物理規則與物體交互邏輯的世界模型,試圖突破當前純語言模型的侷限。本輪融資的投資方陣容相當豪華,涵蓋了產業鏈上多個關鍵環節:亞馬遜、英偉達、AMD旗下的風投部門,以及谷歌DeepMind首席科學家Jeff Dean、硅谷知名投資人Elad Gil等。甚至連美國中央情報局出資成立的風險投資機構In-Q-Tel也出現在名單中,反映出世界模型在國防等敏感領域的潛在應用前景。
除了資金注入,Odyssey還與亞馬遜雲服務AWS達成了深度綁定。AWS將成為其首選雲服務商,而Odyssey則承諾針對AWS自研的Trainium芯片優化自身模型,並部署亞馬遜最新的芯片產品。這一安排直指世界模型訓練與持續推理所面臨的巨大算力成本。對於一家初創公司而言,獨自承擔硬件與雲服務開銷壓力沉重,通過與芯片廠商和雲平臺建立合作,Odyssey得以將部分成本分攤到產業夥伴身上,從而更專注於模型研發。
Odyssey目前已推出多款面向不同場景的世界模型。其中,Odyssey-2 Max是其迄今為止最強大的通用世界模型,主打單人長時序交互式視頻仿真,能夠根據文本提示詞生成細節豐富、可交互的視頻內容,對物體在真實世界中的物理運動做出高精度預判。Starchild-1則是全球首個實時多模態世界模型,能以自迴歸方式同步生成音畫內容,並持續響應用戶的流式輸入。Agora-1更像一套通過學習訓練而成的遊戲引擎,最多支持四名玩家在同一生成式虛擬世界中實時互動,根據每位玩家的動作推演交互行為,並統一維護全局共享的世界狀態。
世界模型在像素細節和物理模擬層面仍存在瑕疵,難以始終嚴格按照輸入動作完成推演。為此,Odyssey研發了一套名為PROWL的算法,這是一套基於強化學習的對抗性測試框架。PROWL通過讓智能體主動挖掘世界模型中的系統性缺陷,將發現的缺陷樣本用於訓練模型,優化後的模型再反哺智能體提升尋錯效率,形成閉環反饋,持續迭代模型精度。
從產業應用角度看,影視與遊戲行業長期面臨傳統CG三維場景和多人交互關卡製作週期漫長、人力成本高昂的難題。Odyssey的世界模型可以幫助客戶一鍵生成可交互虛擬場景,在保證質量的同時縮短內容生產週期、降低成本。隨著模型規模擴大和模擬質量提升,其落地場景有望覆蓋科學研究、機器人、國防及醫療等更多領域。例如,在工業實操培訓中,可以利用這類模型搭建交互式虛擬實訓場景;在機器人領域,世界模型通過學習人類操控行為,使機器人在實際操作前對複雜任務進行模擬預演,涵蓋抓取、導航和操控等動作。
Odyssey的兩位聯合創始人均來自自動駕駛行業。Oliver Cameron曾聯合創辦自動駕駛企業Voyage,後出任通用汽車旗下Cruise的產品副總裁;Jeff Hawke則是自動駕駛公司Wayve的前技術副總裁。Cameron曾展示過一項演示案例:僅依靠像素、動作與音效作為輸入提示,Odyssey的模型就能復刻出1997年任天堂遊戲《GoldenEye》的多人聯機版,且無需針對該遊戲專屬物理規則做專項訓練。他透露,Odyssey的開發工具運行在英偉達H200和B200芯片之上,每人每小時的使用成本約為2至4美元,不過這一費用並不包含模型訓練成本。
Odyssey現有55名員工,分佈於倫敦、蘇黎世與帕洛阿爾託三地,團隊成員多數來自DeepMind、Meta、蘋果、Waymo以及特斯拉等大型AI實驗室與自動駕駛企業。
本輪融資的豪華陣容,一定程度上反映出當下AI資本正集體看好物理仿真世界模型這條技術路線。除了補充研發與商業化落地資金外,AWS等廠商提供的底層算力基礎設施,也將幫助Odyssey緩解承擔高額模型訓練成本的壓力。隨著模型訓練和推理成本持續攀升,模型公司與雲計算、芯片廠商之間的協同正在變得更加緊密。對於世界模型賽道而言,未來的競爭或許不僅取決於模型能力本身,也將取決於產業生態的構建速度。