AI初創公司Decart本週三正式發佈其新一代交互式世界模型Oasis 3,該模型能夠實時生成照片級逼真的駕駛環境,並已通過API向開發者開放。TechCrunch獨家獲悉了這一消息。

Oasis 3的核心能力在於其無限生成特性。與僅提供有限演示或研究預覽的競品不同,Decart允許開發者根據文本提示,持續生成包含前向和雙側向的多攝像頭駕駛場景。這種能力對於需要測試海量邊緣案例的自動駕駛公司來說,具有直接的實用價值。公司聯合創始人兼CEO Dean Leitersdorf表示,這是首個真正可供開發者在其上進行編程構建的可用世界模型,他預計將圍繞該模型湧現出一個完整的開發者社區。

Decart此前已憑藉其實時視頻模型Lucy積累了超過10萬名開發者,這些開發者主要在電商和直播領域構建產品。Oasis 3正是基於這一基礎模型,標誌著公司向物理AI領域的進軍。API定價為每秒0.02美元,企業定價則根據具體用例而定。

此次發佈距離Decart完成3億美元融資僅數週。Leitersdorf稱,融資源於電商、直播和物理AI領域對其模型需求的激增。該輪融資使公司估值達到近40億美元,並引入了豐田、Adobe和eBay等戰略投資者,現有投資者英偉達也參與了本輪。Leitersdorf指出,這些投資方本身都是潛在客戶。

Oasis 3在照片級真實感和運行效率上的優勢,源自Decart的另一項核心技術——DOS(Decart優化堆棧)。這套軟件能讓模型在英偉達、亞馬遜和谷歌的硬件上高效運行,Leitersdorf聲稱,通過垂直整合優化至硬件層,其運行成本比行業其他公司低一個數量級以上。公司成立至今的總消耗資金“遠低於”1億美元。

然而,TechCrunch在實測中也發現了Oasis 3的明顯侷限。儘管模型能根據提示生成出色的初始場景,例如一個清晨的紐約街道,但隨著駕駛進行,環境的主題一致性會迅速退化,逐漸變成任何西方城市的通用街景。當嘗試返回初始路口時,該場景已完全消失,被全新環境取代。整體體驗更像一場支離破碎的意識流夢境,而非連貫的模擬。

此外,控制響應不夠靈敏,車輛時常失去控制,且模型未能正確模擬物理碰撞——車輛會直接穿過其他汽車。Leitersdorf將此歸因於“關於良好駕駛的數據遠多於事故數據”,並稱之為團隊正在攻克的主要研究難題。

這些物理一致性難題與Oasis 3的自迴歸架構密切相關。模型逐幀生成畫面,並回顧之前生成的內容來決定下一步,這導致上下文窗口迅速被填滿。Leitersdorf透露,團隊正研究如何實現更長的上下文記憶,以存儲數百萬個token並壓縮信息,從而維持更長時間的場景連貫性。

在世界模型賽道上,Decart並非孤軍奮戰。谷歌去年在研究預覽中發佈了Genie 3,李飛飛旗下的World Labs推出了面向商業用例的Marble,Luma和Runway等視頻生成初創公司也在將物理感知視頻模型轉化為世界模型。Oasis 3的開放API策略,能否像OpenAI當年以語言模型構建開發者生態那樣,在世界模型領域開闢新局,仍有待市場驗證。