在 Computex 2026 上,一家由前英特爾和 Barefoot Networks 高管創立的初創公司 Delos Data 展示了一套模塊化服務器平臺,試圖為 AI 芯片初創企業掃清通往機架級系統的主要障礙。當前,與英偉達和 AMD 在芯片設計上競爭已屬不易,而機架級架構的興起進一步抬高了門檻——企業不僅要設計芯片,還需攻克將六七十個 AI 加速器集成進單一機架所需的機械、散熱與供電工程,讓整個機架如同一塊巨型 GPU 般工作。

Delos Data 的方案從外觀上更像一臺交換機而非 GPU 服務器,其核心思路是將複雜的內部互聯網絡標準化、模塊化。該機箱配備了 36 個 OSFP 端口,系統中央的四個 OAM 插槽各分配 9 個端口。OAM 是一種開放插槽標準,常見於需要超越標準 PCIe 卡所能提供的互聯帶寬與供電能力的高性能加速器。以 200 Gbps SerDes 計算,每個芯片可獲得 3.6 TB/s 的互聯帶寬,與英偉達最新的 Rubin GPU 持平。

採用 OSFP 接口意味著客戶可以使用標準的直連銅纜或可插拔光模塊,並根據所需的擴展域規模選擇交換機。儘管 OSFP 通常與以太坊關聯,但實際上用戶可以通過它運行幾乎任何協議,包括 UALink、Ultra Ethernet、PCIe 或其他定製協議。從部署角度看,這些系統會像其他超大規模數據中心系統一樣佈線,只是密度要高得多。

對於尋求機架級參考設計的 AI 芯片初創公司而言,Delos 並非唯一選擇。例如,亞馬遜雲科技似乎正在將英偉達的 MGX 形態改造用於其 Trainium 3 機架系統,而 AMD 的 Helios 機架已成為 OCP 標準。理論上,這兩種設計更易於維護,但 Delos 認為其模塊化設計提供了更大的靈活性。公司首席技術官 Dan Daly 在展會期間表示,用戶可以根據需要插入的線纜數量,靈活構建從單一加速器到上百個加速器的擴展域,甚至可以接入不同類型交換機,包括更簡單的交換機甚至光電路交換機。

利用博通或 Marvell 的現有數據包交換機,這種設計在單層網絡結構下即可支持 512 至 1024 個加速器,具體取決於使用 200 Gbps 還是 100 Gbps SerDes。若採用多層網絡結構、光電路交換機或二維/三維環面拓撲,計算域還能進一步擴展,且全程使用現成組件。不過,OSFP 雖簡化了連接,但在更大規模計算域中若需使用可插拔光學器件,功耗可能成為問題。這正是英偉達遲遲未擁抱光學擴展的原因之一——銅纜雖傳輸距離有限,但功耗僅為光學方案的一小部分。Delos 首席執行官 Ed Doe 透露,公司已在探索採用近封裝或共封裝光學器件、通過 MPO 型連接器替代 OSFP 的系統版本。

Delos 的野心不止於硬件。任何從事大規模網絡部署的人都清楚,物理拓撲與邏輯拓撲——即設備在網絡中的實際通信方式——會因工作負載不同而差異巨大。為此,Delos 開發了一套軟件編排平臺,用於促進這些交換網絡或網狀網絡的配置與監控,能夠在鏈路故障時動態重新路由流量。在 Computex 現場,這套被命名為 Nonstop AI 網絡的軟件平臺進行了演示,參觀者可以隨機拔掉鏈路,觀察網絡自動檢測並自我修復的過程。據稱,該公司還有更多產品正在研發中,外界猜測一款基於商用芯片設計的高基數交換機可能會與其 Nonstop AI 系統形成互補。

對於 AI 產業而言,Delos 的出現折射出一個重要趨勢:隨著機架級系統成為大模型訓練與推理的主流形態,基礎設施層的創新正從單一的芯片性能競賽,向系統級工程與網絡架構延伸。如果這類模塊化平臺能夠成熟落地,將顯著降低新玩家進入高性能 AI 算力市場的資金與技術門檻,可能催生更多基於非英偉達或非 AMD 芯片的機架級方案,從而豐富整個 AI 基礎設施的供給結構。不過,這一路徑仍面臨功耗、生態兼容性以及大規模部署驗證等現實挑戰,其實際影響力有待市場檢驗。