AMD收购Mext：用AI预测算法缓解自身造成的RAM短缺

AMD收购闪存扩展公司Mext，以AI方案解决AI大模型带来的内存瓶颈

在AI引发的内存短缺似乎看不到尽头之际，AMD给出了一个颇具反讽意味的答案：用AI来缓解AI造成的困境。本周，这家芯片巨头宣布收购预测性内存初创公司Mext，交易金额未对外披露。Mext的核心技术在于利用机器学习，智能判断哪些数据该留在昂贵的DRAM中，哪些可以暂时“冷藏”到成本低得多的闪存里，从而在不显著牺牲性能的前提下，大幅扩展系统的有效内存容量。

Mext成立于2023年，其主动式内存平台通过运行一个名为Mextd的后台守护进程，将闪存空间直接暴露给操作系统，如同常规内存一般使用。该平台并非依赖单一模型进行决策，而是混合运用了多种技术——包括一系列启发式规则、长短期记忆网络以及现代Transformer架构——根据实际效果动态选择最优组合。Mext声称，这套方案能将系统的有效内存扩展2到4倍，而按每GB成本计算，闪存仍远低于DRAM。

内存分层并非全新概念，多年来业界已有多种尝试，包括纯软件方案以及英特尔与美光联合开发的3D XPoint傲腾持久内存等专用硬件。但Mext的差异化在于其对机器学习的深度应用：它几乎像CPU中的分支预测器一样，预测数据的访问模式，提前将“冷”数据迁移到闪存，并在系统需要之前将其恢复。AMD在分支预测领域积累深厚，这或许也是其看中Mext的原因之一。

AMD计算与企业AI业务高级副总裁Dan McNamara在一篇博文中表示，这种方法有潜力降低基础设施成本、改善资源利用率，并帮助客户更有效地扩展通用和AI工作负载。这直接回应了当前AI产业的一大痛点：随着大模型参数规模膨胀，对HBM等高带宽内存的需求激增，导致内存成本在AI服务器总成本中占比不断攀升。通过软件智能减少对昂贵内存的依赖，无疑为控制AI基础设施总拥有成本提供了一条新路径。

除了企业级应用，这项技术对AI推理环节可能具有更深远的影响。现代混合专家模型由多个子模型组成，在生成每个token时，只会激活其中一部分专家。实践中，某些专家被频繁调用，而另一些则很少被使用。有分析推测，AMD未来可能利用Mext的预测算法，将那些不常用的专家模块从昂贵的HBM卸载到速度较慢但容量更大的系统内存中，使企业能够以更少的硬件资源运行更大、能力更强的模型。当然，这目前仍属业界猜测，AMD尚未就此置评。

从产业格局看，这笔收购反映了芯片厂商竞争维度的扩展。在制程工艺逼近物理极限、单纯堆叠晶体管越来越不经济的背景下，通过系统级软件优化来提升硬件利用效率，正成为差异化竞争的新战场。AMD此举不仅是对自身产品线的补充，也可能对整个数据中心内存架构的演进方向产生影响。如果基于AI预测的内存分层技术走向成熟，或将重新定义服务器中DRAM与闪存的配比逻辑，进而影响内存产业链上下游的需求结构。

AMD收购Mext：用AI预测算法缓解自身造成的RAM短缺

延伸阅读

相关深度报道

相关每日新闻