面對 DDR5 內存價格持續攀升與供應緊張的局面,Meta 沒有選擇單純擴大采購,而是轉向內部工程方案來消化成本壓力。該公司開發了一款名為 Vistara 的定製 ASIC 芯片,這是一顆符合 CXL 2.0 規範的內存擴展器,專門用來將上一代 DDR4-2400 內存條接入僅支持 DDR5 的新款服務器。
Vistara 通過 PCIe 5.0 x16 接口與主機處理器通信,扮演 CXL Type-3 內存擴展器的角色。每顆 ASIC 擁有兩個獨立的 72 位 DDR4 內存通道,理論上可支持最高 256GB 容量。目前,Meta 在實際部署中為每顆 Vistara 搭配從退役服務器拆下的 32GB DDR4 模塊,提供 128GB 擴展內存。
這套方案被集成在 Meta 的 MemServer 平臺上。每臺服務器搭載一顆 158 核的 AMD EPYC Turin 處理器,通過 PCIe 5.0 x8 鏈路連接兩顆 Vistara 芯片。整機配置 768GB 的 DDR5-6400 本地內存,再加上 256GB 的 CXL 連接 DDR4-2400 內存,使總內存容量達到 1TB。
在軟件層面,Meta 的 Linux 系統將 CXL 連接的內存暴露為一個獨立的 NUMA 節點。通過頁面遷移機制,系統自動將訪問頻率較低的“冷”數據移至帶寬為 76 GB/s 的 DDR4 層,而將高頻訪問數據保留在帶寬高達 614 GB/s 的本地 DDR5 中。這種分層內存架構在不大幅犧牲性能的前提下,顯著提升了每臺服務器的內存總量。
Vistara 芯片本身基於三顆 RISC-V 處理器核心構建,負責安全啟動、設備初始化、固件管理與健康監控。Meta 聲稱已對 CXL 控制器與內存流水線進行了深度優化,將協議開銷與排隊延遲降至最低,空閒往返延遲約 50 納秒。芯片還集成了 Reed-Solomon 雙符號糾錯與 x4 chip-kill 等高級可靠性特性,以滿足數據中心級運行要求。
值得注意的是,Meta 並非唯一試圖通過 CXL 技術複用舊內存的廠商。韓國初創公司 Panmnesia 也開發了商用的 CXL 控制器與交換芯片方案,旨在讓服務器連接更大規模的內存池,同時控制延遲。該公司首席執行官 Myoungsoo Jung 指出,早期 CXL 實現因沿用 PCIe 架構特性而引入額外延遲,但這並非 CXL 協議本身的固有侷限。Panmnesia 重新設計了數據路徑,用共享緩衝區取代逐層獨立緩衝區,消除了大量同步開銷,並在協議棧全鏈路進行延遲優化。
其配套的 CXL 交換芯片引入了基於端口的路由,打破了傳統 PCIe 樹狀拓撲的限制,使系統拓撲更靈活、流量路由更高效。Panmnesia 聲稱,其架構可擴展至最多 64 個節點,這對於運行成千上萬臺服務器、急需合理化昂貴 DRAM 使用的超大規模雲商而言,意味著更大的部署彈性。該公司已擁有 PCIe 6.4/CXL 3.2 融合交換芯片的預發佈硅片,並完成了 PCIe 7.0/CXL 4.0 組合 IP 的開發。
從產業視角看,Meta 的 Vistara 與 Panmnesia 的方案共同指向一個趨勢:在 AI 算力需求爆發、新一代內存成本高企的背景下,超大規模數據中心運營商正通過內存分層與舊件複用來優化資本支出。這不僅是成本控制手段,更可能重塑服務器內存子系統的設計思路——未來,CXL 互聯有望讓不同代際、不同速度的內存顆粒在統一架構下協同工作,從而在性能與總擁有成本之間取得更精細的平衡。