英偉達為其新一代Rubin平臺AI基礎設施引入了一項關鍵冷卻技術突破:系統冷卻液運行溫度可高達45攝氏度,遠超傳統數據中心的低溫標準。這一設計看似反直覺,卻正是提升能效的核心所在。

在傳統認知中,數據中心應當保持低溫環境,但英偉達指出,芯片本身能夠承受遠高於此的工作溫度。Rubin架構是全球首個實現100%全液冷的AI計算平臺,所有芯片和網絡組件均通過封閉液冷迴路散熱,系統內完全取消了風扇。冷卻液由75%的水和25%的丙二醇組成,通過直接貼合處理器的冷板帶走熱量。

英偉達數據中心冷卻與基礎設施總監Ali Heydari表示,基於乾冷器設計的封閉迴路系統在絕大多數時間內無需蒸發水冷,僅在約1%的極端氣候條件下才可能啟用輔助冷機。這意味著在適宜地理環境中,設施冷卻水消耗可從傳統冷卻塔系統的每兆瓦每年約260萬加侖降至近乎零,實現最高100%的節水

從能耗角度看,冷卻環節歷來佔數據中心總用電量的高達40%。行業估算顯示,冷凍水溫度每提高1攝氏度,冷卻能耗成本可降低約4%。在超大規模部署場景下,這一節省效應極為可觀:一個50兆瓦的超大規模設施轉向液冷基礎設施後,每年可節省超過400萬美元的冷卻相關能源和水成本。

該液冷方案已被納入英偉達DSX AI工廠參考設計,為整個AI工廠基礎設施堆棧的設計、建設和運營提供最佳實踐指引。由於Rubin平臺強制要求全液冷環境,所有基於該平臺構建的雲服務商和數據中心運營商都將同步轉向液冷架構。

生態系統的配套也在加速推進。施耐德電氣旗下高級冷卻部門Motivair與英偉達已合作近十年。其總裁兼首席執行官Richard Whitmore指出,當單芯片功耗突破空氣冷卻的可行閾值後,液冷就成為必選項。隨著AI芯片功率密度持續攀升,這一趨勢已不可逆轉。

從更宏觀的產業視角看,這項技術突破不僅關乎單一產品的散熱效率。它重新定義了AI工廠的物理形態:無需冷熱通道隔離、無需高噪音風扇、無需大量冷水消耗。在電力供應日益緊張的背景下,降低冷卻環節的能源和水資源消耗,直接影響到AI算力大規模部署的經濟可行性和環境可持續性。對於正在競相建設AI基礎設施的雲廠商和企業而言,每節省一個百分點的運營成本,都可能轉化為顯著的資本回報優勢。