在AI引發的內存短缺似乎看不到盡頭之際,AMD給出了一個頗具反諷意味的答案:用AI來緩解AI造成的困境。本週,這家芯片巨頭宣佈收購預測性內存初創公司Mext,交易金額未對外披露。Mext的核心技術在於利用機器學習,智能判斷哪些數據該留在昂貴的DRAM中,哪些可以暫時“冷藏”到成本低得多的閃存裡,從而在不顯著犧牲性能的前提下,大幅擴展系統的有效內存容量。

Mext成立於2023年,其主動式內存平臺通過運行一個名為Mextd的後臺守護進程,將閃存空間直接暴露給操作系統,如同常規內存一般使用。該平臺並非依賴單一模型進行決策,而是混合運用了多種技術——包括一系列啟發式規則、長短期記憶網絡以及現代Transformer架構——根據實際效果動態選擇最優組合。Mext聲稱,這套方案能將系統的有效內存擴展2到4倍,而按每GB成本計算,閃存仍遠低於DRAM。

內存分層並非全新概念,多年來業界已有多種嘗試,包括純軟件方案以及英特爾與美光聯合開發的3D XPoint傲騰持久內存等專用硬件。但Mext的差異化在於其對機器學習的深度應用:它幾乎像CPU中的分支預測器一樣,預測數據的訪問模式,提前將“冷”數據遷移到閃存,並在系統需要之前將其恢復。AMD在分支預測領域積累深厚,這或許也是其看中Mext的原因之一。

AMD計算與企業AI業務高級副總裁Dan McNamara在一篇博文中表示,這種方法有潛力降低基礎設施成本、改善資源利用率,並幫助客戶更有效地擴展通用和AI工作負載。這直接回應了當前AI產業的一大痛點:隨著大模型參數規模膨脹,對HBM等高帶寬內存的需求激增,導致內存成本在AI服務器總成本中佔比不斷攀升。通過軟件智能減少對昂貴內存的依賴,無疑為控制AI基礎設施總擁有成本提供了一條新路徑。

除了企業級應用,這項技術對AI推理環節可能具有更深遠的影響。現代混合專家模型由多個子模型組成,在生成每個token時,只會激活其中一部分專家。實踐中,某些專家被頻繁調用,而另一些則很少被使用。有分析推測,AMD未來可能利用Mext的預測算法,將那些不常用的專家模塊從昂貴的HBM卸載到速度較慢但容量更大的系統內存中,使企業能夠以更少的硬件資源運行更大、能力更強的模型。當然,這目前仍屬業界猜測,AMD尚未就此置評。

從產業格局看,這筆收購反映了芯片廠商競爭維度的擴展。在製程工藝逼近物理極限、單純堆疊晶體管越來越不經濟的背景下,通過系統級軟件優化來提升硬件利用效率,正成為差異化競爭的新戰場。AMD此舉不僅是對自身產品線的補充,也可能對整個數據中心內存架構的演進方向產生影響。如果基於AI預測的內存分層技術走向成熟,或將重新定義服務器中DRAM與閃存的配比邏輯,進而影響內存產業鏈上下游的需求結構。