洛斯阿拉莫斯国家实验室(LANL)近日披露了其下一代超级计算机群的建设计划,将引入 NVIDIA Vera CPU 作为核心计算引擎,标志着英伟达的 CPU 架构首次大规模进入美国国家级尖端超算的核心层。该计划包含三台新系统——MissionVisionVeritas,均与 HPE 合作建造,采用 HPE Cray Supercomputing GX5000 架构,并基于 NVIDIA Vera Rubin 平台,融合了 Vera CPU、Rubin GPU 以及 Quantum-X800 InfiniBand 网络互联。

根据规划,Mission 将配备 NVIDIA Vera Rubin GPU 节点,并额外部署 2,300 颗独立 NVIDIA Vera CPU,使用 HPE Cray Supercomputing GX240 刀片服务器。Veritas 则将配置约 1,150 颗独立 Vera CPU,与 Vera Rubin 节点协同工作。Veritas 将与 Mission 和 Vision 同期抵达,服务于实验室的指导性研发项目,重点加速面向科学发现的 智能体 AI。该系统将作为技术验证平台,为 LANL 后续更大规模系统的建设铺路。

此次部署的核心亮点在于 AI 驱动的科研范式转变。LANL 正在公开推进 URSA(通用科研智能体)项目,这是一个模块化、反馈驱动的 AI 框架,旨在帮助科学家完成假设构思、实验规划、模拟运行和结果分析的全流程。早期测试结果令人瞩目:在 URSA 工作负载上,Vera CPU 的性能达到了 Crossroads x86 超算所用 CPU 的 7 倍。在另一项名为 Branson 的开源蒙特卡洛热传导模拟工具测试中,Vera 的性能也超过 Crossroads x86 超算 CPU 的 3 倍。这些增益得益于 Vera 的定制 Olympus 核心LPDDR5 内存和高速片上互联结构。具体而言,单颗 Vera CPU 的性能是单路 x86 CPU 的 3 倍以上,每核心内存带宽高出 4 倍,每节点内存容量高出 6 倍。

从系统定位看,Mission 预计于 2027 年 投入运行,将成为美国国家核安全局高级模拟与计算项目下的第五台先进技术系统,接替 Crossroads 承担机密国家安全工作负载。Vision 同样计划在 2027 年上线,将作为基础科学资源,覆盖材料与核科学、能源建模、生物医学研究和 AI 等领域,让更多科学家在进入高安全等级工作前测试方法、训练模型和探索想法。

这一合作延续了 LANL 与英伟达在 CPU 领域超过十年的深度协同设计传统,从 Grace 到 Vera,双方始终以极端协同设计方式针对实验室的真实模拟负载优化硬件。三台新超算将建立在 Venado 的基础上——这台 HPE Cray EX 超算于 2024 年安装在洛斯阿拉莫斯,配备了 NVIDIA GH200 Grace Hopper 超级芯片和 Grace CPU 超级芯片。

从产业视角看,此次部署的意义超越了单笔订单。它首次将英伟达的 Vera CPU 置于与 x86 架构正面竞争的国家级超算场景中,并通过早期性能数据展示了其在内存带宽和 AI 工作负载上的显著优势。这不仅强化了英伟达在 基础设施层 的纵向整合能力——从 CPU、GPU 到网络互联的全栈覆盖,也为科学计算领域引入智能体 AI 提供了硬件基座。随着全球科研机构对 AI 驱动的模拟和自主实验设计需求增长,这种从芯片到系统再到 AI 框架的协同设计模式,可能重塑高性能计算的采购逻辑和技术路线。