在AI引发的内存短缺似乎看不到尽头之际,AMD给出了一个颇具反讽意味的答案:用AI来缓解AI造成的困境。本周,这家芯片巨头宣布收购预测性内存初创公司Mext,交易金额未对外披露。Mext的核心技术在于利用机器学习,智能判断哪些数据该留在昂贵的DRAM中,哪些可以暂时“冷藏”到成本低得多的闪存里,从而在不显著牺牲性能的前提下,大幅扩展系统的有效内存容量。
Mext成立于2023年,其主动式内存平台通过运行一个名为Mextd的后台守护进程,将闪存空间直接暴露给操作系统,如同常规内存一般使用。该平台并非依赖单一模型进行决策,而是混合运用了多种技术——包括一系列启发式规则、长短期记忆网络以及现代Transformer架构——根据实际效果动态选择最优组合。Mext声称,这套方案能将系统的有效内存扩展2到4倍,而按每GB成本计算,闪存仍远低于DRAM。
内存分层并非全新概念,多年来业界已有多种尝试,包括纯软件方案以及英特尔与美光联合开发的3D XPoint傲腾持久内存等专用硬件。但Mext的差异化在于其对机器学习的深度应用:它几乎像CPU中的分支预测器一样,预测数据的访问模式,提前将“冷”数据迁移到闪存,并在系统需要之前将其恢复。AMD在分支预测领域积累深厚,这或许也是其看中Mext的原因之一。
AMD计算与企业AI业务高级副总裁Dan McNamara在一篇博文中表示,这种方法有潜力降低基础设施成本、改善资源利用率,并帮助客户更有效地扩展通用和AI工作负载。这直接回应了当前AI产业的一大痛点:随着大模型参数规模膨胀,对HBM等高带宽内存的需求激增,导致内存成本在AI服务器总成本中占比不断攀升。通过软件智能减少对昂贵内存的依赖,无疑为控制AI基础设施总拥有成本提供了一条新路径。
除了企业级应用,这项技术对AI推理环节可能具有更深远的影响。现代混合专家模型由多个子模型组成,在生成每个token时,只会激活其中一部分专家。实践中,某些专家被频繁调用,而另一些则很少被使用。有分析推测,AMD未来可能利用Mext的预测算法,将那些不常用的专家模块从昂贵的HBM卸载到速度较慢但容量更大的系统内存中,使企业能够以更少的硬件资源运行更大、能力更强的模型。当然,这目前仍属业界猜测,AMD尚未就此置评。
从产业格局看,这笔收购反映了芯片厂商竞争维度的扩展。在制程工艺逼近物理极限、单纯堆叠晶体管越来越不经济的背景下,通过系统级软件优化来提升硬件利用效率,正成为差异化竞争的新战场。AMD此举不仅是对自身产品线的补充,也可能对整个数据中心内存架构的演进方向产生影响。如果基于AI预测的内存分层技术走向成熟,或将重新定义服务器中DRAM与闪存的配比逻辑,进而影响内存产业链上下游的需求结构。