洛斯阿拉莫斯國家實驗室(LANL)近日披露了其下一代超級計算機群的建設計劃,將引入 NVIDIA Vera CPU 作為核心計算引擎,標誌著英偉達的 CPU 架構首次大規模進入美國國家級尖端超算的核心層。該計劃包含三臺新系統——MissionVisionVeritas,均與 HPE 合作建造,採用 HPE Cray Supercomputing GX5000 架構,並基於 NVIDIA Vera Rubin 平臺,融合了 Vera CPU、Rubin GPU 以及 Quantum-X800 InfiniBand 網絡互聯。

根據規劃,Mission 將配備 NVIDIA Vera Rubin GPU 節點,並額外部署 2,300 顆獨立 NVIDIA Vera CPU,使用 HPE Cray Supercomputing GX240 刀片服務器。Veritas 則將配置約 1,150 顆獨立 Vera CPU,與 Vera Rubin 節點協同工作。Veritas 將與 Mission 和 Vision 同期抵達,服務於實驗室的指導性研發項目,重點加速面向科學發現的 智能體 AI。該系統將作為技術驗證平臺,為 LANL 後續更大規模系統的建設鋪路。

此次部署的核心亮點在於 AI 驅動的科研範式轉變。LANL 正在公開推進 URSA(通用科研智能體)項目,這是一個模塊化、反饋驅動的 AI 框架,旨在幫助科學家完成假設構思、實驗規劃、模擬運行和結果分析的全流程。早期測試結果令人矚目:在 URSA 工作負載上,Vera CPU 的性能達到了 Crossroads x86 超算所用 CPU 的 7 倍。在另一項名為 Branson 的開源蒙特卡洛熱傳導模擬工具測試中,Vera 的性能也超過 Crossroads x86 超算 CPU 的 3 倍。這些增益得益於 Vera 的定製 Olympus 核心LPDDR5 內存和高速片上互聯結構。具體而言,單顆 Vera CPU 的性能是單路 x86 CPU 的 3 倍以上,每核心內存帶寬高出 4 倍,每節點內存容量高出 6 倍。

從系統定位看,Mission 預計於 2027 年 投入運行,將成為美國國家核安全局高級模擬與計算項目下的第五臺先進技術系統,接替 Crossroads 承擔機密國家安全工作負載。Vision 同樣計劃在 2027 年上線,將作為基礎科學資源,覆蓋材料與核科學、能源建模、生物醫學研究和 AI 等領域,讓更多科學家在進入高安全等級工作前測試方法、訓練模型和探索想法。

這一合作延續了 LANL 與英偉達在 CPU 領域超過十年的深度協同設計傳統,從 Grace 到 Vera,雙方始終以極端協同設計方式針對實驗室的真實模擬負載優化硬件。三臺新超算將建立在 Venado 的基礎上——這臺 HPE Cray EX 超算於 2024 年安裝在洛斯阿拉莫斯,配備了 NVIDIA GH200 Grace Hopper 超級芯片和 Grace CPU 超級芯片。

從產業視角看,此次部署的意義超越了單筆訂單。它首次將英偉達的 Vera CPU 置於與 x86 架構正面競爭的國家級超算場景中,並通過早期性能數據展示了其在內存帶寬和 AI 工作負載上的顯著優勢。這不僅強化了英偉達在 基礎設施層 的縱向整合能力——從 CPU、GPU 到網絡互聯的全棧覆蓋,也為科學計算領域引入智能體 AI 提供了硬件基座。隨著全球科研機構對 AI 驅動的模擬和自主實驗設計需求增長,這種從芯片到系統再到 AI 框架的協同設計模式,可能重塑高性能計算的採購邏輯和技術路線。