輝達推出物理AI開源模型 Cosmos 3

輝達推出Cosmos 3，基於混合Transformer架構整合視覺推理與動作預測

來源:NVIDIA Newsroom · 2026-06-01 00:42 ET · #模型

字號

輝達今天正式推出 Cosmos 3 模型，定位為物理智慧領域的開放世界基礎模型。這一新模型最引人注目之處在於其混合 Transformer 架構，將以往需要分別實現的視覺推理、世界生成與動作預測統一在一個系統內，可接收影片或影像輸入，理解場景動態，生成未來可能的環境演變，並直接為機器人、自動駕駛車輛等物理實體規劃動作序列。

Cosmos 3 並非輝達首次涉足物理 AI。早在 2023 年 CES 期間，該公司就曾展示 Cosmos 平台，旨在為機器人和自動駕駛開發者提供高保真的模擬環境。此次釋出的 3 代版本進一步強化了“世界模型”的能力，且採用全面開放策略，開發者可自由獲取、微調並部署，這與輝達在軟體生態上的開源傾向一脈相承。該模型訓練資料涵蓋大量合成與真實場景，能夠模擬多樣化的物理互動，從而幫助開發者擺脫對昂貴真機資料採集的過度依賴。

從產業鏈視角看，Cosmos 3 精準落在黃仁勳“五層蛋糕”的模型層。它並非孤立的釋出，而是與輝達已有的 Omniverse 數字孿生平台、Isaac Sim 機器人模擬工具形成閉環：Omniverse 提供可微物理渲染的虛擬世界，Cosmos 3 利用這些環境生成海量訓練樣本，再驅動各種機器人與自動駕駛模型的訓練。這種一體化方案讓輝達在物理 AI 領域建立起軟硬體協同的護城河。

對投資者而言，Cosmos 3 的意義不止於技術突破。它進一步鞏固了輝達在物理 AI 開發者生態中的主導地位，讓大量初創公司與工業企業更容易上手開發具身智慧，從而鎖定對輝達訓練與推理晶片的持續需求。隨著人形機器人賽道升溫以及自動駕駛從 L2+ 向 L4 推進，此類世界模型有望成為產業基礎設施，帶動資料中心 GPU 的用量增長。同時，開源策略也意味著輝達正在複製 Meta 在語言模型領域的路線——以免費建立標準，最終通過硬體和配套服務變現。當然，模型層競爭也在白熱化，OpenAI 等對手同樣在佈局多模態與具身智慧，但輝達憑藉硬體—平台—模型的垂直整合，短期內的優勢仍然顯著。

輝達推出物理AI開源模型 Cosmos 3

延伸閱讀

相關深度報道

相關每日新聞