英伟达为其新一代Rubin平台AI基础设施引入了一项关键冷却技术突破:系统冷却液运行温度可高达45摄氏度,远超传统数据中心的低温标准。这一设计看似反直觉,却正是提升能效的核心所在。

在传统认知中,数据中心应当保持低温环境,但英伟达指出,芯片本身能够承受远高于此的工作温度。Rubin架构是全球首个实现100%全液冷的AI计算平台,所有芯片和网络组件均通过封闭液冷回路散热,系统内完全取消了风扇。冷却液由75%的水和25%的丙二醇组成,通过直接贴合处理器的冷板带走热量。

英伟达数据中心冷却与基础设施总监Ali Heydari表示,基于干冷器设计的封闭回路系统在绝大多数时间内无需蒸发水冷,仅在约1%的极端气候条件下才可能启用辅助冷机。这意味着在适宜地理环境中,设施冷却水消耗可从传统冷却塔系统的每兆瓦每年约260万加仑降至近乎零,实现最高100%的节水

从能耗角度看,冷却环节历来占数据中心总用电量的高达40%。行业估算显示,冷冻水温度每提高1摄氏度,冷却能耗成本可降低约4%。在超大规模部署场景下,这一节省效应极为可观:一个50兆瓦的超大规模设施转向液冷基础设施后,每年可节省超过400万美元的冷却相关能源和水成本。

该液冷方案已被纳入英伟达DSX AI工厂参考设计,为整个AI工厂基础设施堆栈的设计、建设和运营提供最佳实践指引。由于Rubin平台强制要求全液冷环境,所有基于该平台构建的云服务商和数据中心运营商都将同步转向液冷架构。

生态系统的配套也在加速推进。施耐德电气旗下高级冷却部门Motivair与英伟达已合作近十年。其总裁兼首席执行官Richard Whitmore指出,当单芯片功耗突破空气冷却的可行阈值后,液冷就成为必选项。随着AI芯片功率密度持续攀升,这一趋势已不可逆转。

从更宏观的产业视角看,这项技术突破不仅关乎单一产品的散热效率。它重新定义了AI工厂的物理形态:无需冷热通道隔离、无需高噪音风扇、无需大量冷水消耗。在电力供应日益紧张的背景下,降低冷却环节的能源和水资源消耗,直接影响到AI算力大规模部署的经济可行性和环境可持续性。对于正在竞相建设AI基础设施的云厂商和企业而言,每节省一个百分点的运营成本,都可能转化为显著的资本回报优势。