英偉達正式揭曉了其最新研發成果——NVIDIA Cosmos 3,一個被定義為全球首款完全開放的全模態物理AI模型。這款模型並非傳統意義上的語言或圖像生成工具,而是專為理解和模擬物理世界設計。其核心突破在於採用了一種全新的混合Transformer架構,將視覺推理、世界生成和動作預測三大關鍵能力融為一體。這意味著,模型不僅能“看懂”物理環境,還能預測物體如何運動、交互,並生成符合物理規律的未來場景。
從技術細節看,Cosmos 3的“全模態”特性使其能處理視覺、文本等多種輸入,並輸出對物理世界的連貫理解。這與英偉達此前在Omniverse平臺上的積累一脈相承,但更強調模型的開放性與基礎性。公司同時宣佈牽頭成立全球開發者協作聯盟,意圖圍繞該模型構建一個龐大的開發者社區,加速其在機器人、自動駕駛、工業數字孿生等領域的應用落地。
這一動作的背景是AI產業正從純數字領域向物理世界加速滲透。在黃仁勳提出的“五層蛋糕”框架中,Cosmos 3直接錨定在第四層“模型”與第五層“應用”的交匯點。它不僅是算法創新,更是對下游應用生態的戰略性卡位。通過完全開放模型,英偉達試圖複製其在GPU領域的平臺化策略:提供底層工具,吸引開發者,進而拉動對其上層基礎設施和底層芯片的長期需求。
從產業視角看,此舉有多重含義。首先,它加劇了物理AI賽道的競爭,與特斯拉的Optimus、谷歌的RT系列模型形成對標,但開放策略可能更快積累生態優勢。其次,對算力敘事構成支撐——模擬物理世界所需的計算量遠超語言模型,這或進一步推高對英偉達自家GPU的依賴。最後,開發者聯盟的成立標誌著競爭從單點技術轉向生態體系,能否吸引足夠多的合作伙伴將決定該模型的最終影響力。市場正密切關注後續開發者反饋及實際應用案例的湧現。