英偉達今天正式推出 Cosmos 3 模型,定位為物理智能領域的開放世界基礎模型。這一新模型最引人注目之處在於其混合 Transformer 架構,將以往需要分別實現的視覺推理、世界生成與動作預測統一在一個系統內,可接收視頻或圖像輸入,理解場景動態,生成未來可能的環境演變,並直接為機器人、自動駕駛車輛等物理實體規劃動作序列。

Cosmos 3 並非英偉達首次涉足物理 AI。早在 2023 年 CES 期間,該公司就曾展示 Cosmos 平臺,旨在為機器人和自動駕駛開發者提供高保真的仿真環境。此次發佈的 3 代版本進一步強化了“世界模型”的能力,且採用全面開放策略,開發者可自由獲取、微調並部署,這與英偉達在軟件生態上的開源傾向一脈相承。該模型訓練數據涵蓋大量合成與真實場景,能夠模擬多樣化的物理交互,從而幫助開發者擺脫對昂貴真機數據採集的過度依賴。

從產業鏈視角看,Cosmos 3 精準落在黃仁勳五層蛋糕”的模型層。它並非孤立的發佈,而是與英偉達已有的 Omniverse 數字孿生平臺、Isaac Sim 機器人仿真工具形成閉環:Omniverse 提供可微物理渲染的虛擬世界,Cosmos 3 利用這些環境生成海量訓練樣本,再驅動各種機器人與自動駕駛模型的訓練。這種一體化方案讓英偉達在物理 AI 領域建立起軟硬件協同的護城河。

對投資者而言,Cosmos 3 的意義不止於技術突破。它進一步鞏固了英偉達在物理 AI 開發者生態中的主導地位,讓大量初創公司與工業企業更容易上手開發具身智能,從而鎖定對英偉達訓練與推理芯片的持續需求。隨著人形機器人賽道升溫以及自動駕駛從 L2+ 向 L4 推進,此類世界模型有望成為產業基礎設施,帶動數據中心 GPU 的用量增長。同時,開源策略也意味著英偉達正在複製 Meta 在語言模型領域的路線——以免費建立標準,最終通過硬件和配套服務變現。當然,模型層競爭也在白熱化,OpenAI 等對手同樣在佈局多模態與具身智能,但英偉達憑藉硬件—平臺—模型的垂直整合,短期內的優勢仍然顯著。