Decart釋出Oasis 3世界模型，可即時生成逼真駕駛環境

Decart釋出Oasis 3世界模型，用於自動駕駛測試，現通過API開放給開發者。

AI初創公司Decart本週三正式釋出其新一代互動式世界模型Oasis 3，該模型能夠即時生成照片級逼真的駕駛環境，並已通過API向開發者開放。TechCrunch獨家獲悉了這一訊息。

Oasis 3的核心能力在於其無限生成特性。與僅提供有限演示或研究預覽的競品不同，Decart允許開發者根據文本提示，持續生成包含前向和雙側向的多攝像頭駕駛場景。這種能力對於需要測試海量邊緣案例的自動駕駛公司來說，具有直接的實用價值。公司聯合創始人兼CEO Dean Leitersdorf表示，這是首個真正可供開發者在其上進行程式設計構建的可用世界模型，他預計將圍繞該模型湧現出一個完整的開發者社群。

Decart此前已憑藉其即時影片模型Lucy積累了超過10萬名開發者，這些開發者主要在電商和直播領域構建產品。Oasis 3正是基於這一基礎模型，標誌著公司向物理AI領域的進軍。API定價為每秒0.02美元，企業定價則根據具體用例而定。

此次釋出距離Decart完成3億美元融資僅數週。Leitersdorf稱，融資源於電商、直播和物理AI領域對其模型需求的激增。該輪融資使公司估值達到近40億美元，並引入了豐田、Adobe和eBay等戰略投資者，現有投資者輝達也參與了本輪。Leitersdorf指出，這些投資方本身都是潛在客戶。

Oasis 3在照片級真實感和執行效率上的優勢，源自Decart的另一項核心技術——DOS（Decart最佳化堆疊）。這套軟體能讓模型在輝達、亞馬遜和谷歌的硬體上高效執行，Leitersdorf聲稱，通過垂直整合最佳化至硬體層，其執行成本比行業其他公司低一個數量級以上。公司成立至今的總消耗資金“遠低於”1億美元。

然而，TechCrunch在實測中也發現了Oasis 3的明顯侷限。儘管模型能根據提示生成出色的初始場景，例如一個清晨的紐約街道，但隨著駕駛進行，環境的主題一致性會迅速退化，逐漸變成任何西方城市的通用街景。當嘗試返回初始路口時，該場景已完全消失，被全新環境取代。整體體驗更像一場支離破碎的意識流夢境，而非連貫的模擬。

此外，控制響應不夠靈敏，車輛時常失去控制，且模型未能正確模擬物理碰撞——車輛會直接穿過其他汽車。Leitersdorf將此歸因於“關於良好駕駛的資料遠多於事故資料”，並稱之為團隊正在攻克的主要研究難題。

這些物理一致性難題與Oasis 3的自迴歸架構密切相關。模型逐幀生成畫面，並回顧之前生成的內容來決定下一步，這導致上下文視窗迅速被填滿。Leitersdorf透露，團隊正研究如何實現更長的上下文記憶，以儲存數百萬個token並壓縮資訊，從而維持更長時間的場景連貫性。

在世界模型賽道上，Decart並非孤軍奮戰。谷歌去年在研究預覽中釋出了Genie 3，李飛飛旗下的World Labs推出了面向商業用例的Marble，Luma和Runway等影片生成初創公司也在將物理感知影片模型轉化為世界模型。Oasis 3的開放API策略，能否像OpenAI當年以語言模型構建開發者生態那樣，在世界模型領域開闢新局，仍有待市場驗證。

Decart釋出Oasis 3世界模型，可即時生成逼真駕駛環境

延伸閱讀

相關深度報道

相關每日新聞