英偉達正式宣佈其 Spectrum-X 以太網硅光技術已開啟全面量產,新一代交換機基於光電一體封裝(CPO)架構,直接將硅光引擎與交換芯片共封裝在同一基板上,跳過傳統可插拔光收發器環節。該方案專為下一代 Vera Rubin 計算平臺設計,目標場景是橫向擴展至數十萬 GPU 節點、乃至跨區域部署的 AI 工廠,試圖解決超大規模集群中長期困擾運營團隊的功耗與互聯可靠性問題。
根據官方披露的數據,與傳統使用分立收發器的網絡相比,新平臺在能效端實現了 5 倍 的改善,AI 集群的正常運行時間提高 5 倍,部署時間則縮短為原來的 1.3 倍。這些指標直接對應著萬卡級訓練集群的運營穩定性與總體擁有成本。Spectrum-X 並非單純的交換芯片迭代,而是英偉達網絡部門拉通計算、網絡、光器件、連接器和系統設計的全棧協同成果,此次量產意味著 CPO 方案從概念驗證真正進入商業數據中心的大規模部署通道。
這一技術路線切換的背景是,AI 訓練集群規模正從數千卡向十萬卡乃至百萬卡躍進,傳統可插拔光模塊的功耗密度和故障率已成顯性瓶頸。業界此前已在 800G、1.6T 光模塊上嘗試 LPO(線性直驅)等方案降功耗,但英偉達選擇直接跳過中間路線,以 CPO 將光學連接逼近交換芯片,不僅壓低了每比特能耗,還在設計層面整合了故障檢測與冗餘機制,才使得“正常運行時間 5 倍提升”成為量化表述。需要留意的是,此番量產主要圍繞 Vera Rubin 平臺的橫向擴展網絡,而非適配廣泛第三方 GPU 的通用網絡設備,這延續了英偉達“端到端封鎖”的風格。
站在產業視角,此次量產對 AI 五層蛋糕中的 基礎設施層 產生直接衝擊,同時也向上拉動 芯片層 與 應用層 的效率天花板。對雲服務商和企業自建集群而言,更低的功耗意味著相同電力配額下可部署更多算力,正常運行時間的提升則減少大規模訓練中斷帶來的沉沒成本和排隊延遲。但同時,CPO 的供應鏈結構與傳統光模塊完全異質,將壓縮可插拔光模塊廠商的生存空間,加速光通信產業從模塊級創新向晶圓級封裝集成傾斜。這一轉變的核心看點在於,它將“網絡互連”這一曾經相對標準化的部件,更深地鎖定在單個計算平臺的架構護城河內。