AMD 的下一代 AI 機架級系統 Helios MI455X 近日首次揭開面紗。據 Tom's Hardware 報道,該平臺被定位為英偉達 NVL72 VR200 的直接競品,計劃在 2025 年下半年推向市場。Helios 將搭載 AMD 最新的 MI455X 加速器,並採用機架級設計以支持大規模 AI 訓練與推理任務。
值得關注的是其互聯方案。AMD 原本是 UALink(Ultra Accelerator Link)開放互聯標準的主要推動者之一,該標準旨在為 AI 加速器提供高帶寬、低延遲的芯片間通信。然而,Helios 的初期出貨版本並不會配備真正的 UALink 物理層,而是通過以太網來承載 UALink 協議。這意味著系統在邏輯上使用 UALink 通信,但實際數據跑在標準以太網硬件上。Tom's Hardware 分析認為,這種過渡性設計可能在需要極高通信帶寬和超低延遲的 workloads(如千億參數大模型的張量並行訓練)中暴露出性能短板,因為以太網的原生開銷和擁塞控制機制會引入額外延遲。
從產業背景看,AMD 此舉反映出 AI 基礎設施領域競爭的急劇升溫。英偉達憑藉 NVLink 和 NVSwitch 構建了封閉但性能強悍的機架級系統生態,從 Grace Hopper 到 Vera Rubin 平臺,持續拉高算力密度與互聯帶寬的標杆。AMD 則試圖通過 UALink 聯盟(成員包括博通、英特爾、微軟、Meta 等)打造開放標準,以降低客戶對英偉達專有互聯的依賴。但開放標準的落地往往慢於預期,Helios 先用以太網“過渡”的策略,既是搶佔上市時間的務實之舉,也暴露出 UALink 物理層就緒度不足的現實。
對 AI 產業投資者而言,Helios 的亮相傳遞了多重信號。在芯片層,AMD 正加速從單卡競爭轉向系統級對抗,其 MI455X 若能配合成熟的互聯方案,有望在雲廠商自研芯片和英偉達之外切出一塊市場。在基礎設施層,互聯技術正成為算力集群性能的“勝負手”——無論是以太網、InfiniBand 還是 UALink,誰能在帶寬、延遲和生態採納度之間取得平衡,誰就能影響下一代數據中心的設計方向。不過,初期以太網方案的性能折損可能讓部分潛在客戶持觀望態度,尤其是在訓練超大模型時,互聯瓶頸會直接拖累 GPU 利用率。市場將密切關注 Helios 的實際基準測試結果,以及真正原生 UALink 系統的落地時間表。