在 ISC 2026 大会上,高性能存储厂商 DDN 发布了一系列面向 AI 负载的存储新品,核心是 AI400X3M 设备与一套全新的 KV 缓存解决方案。这些产品旨在提前应对英伟达 Vera Rubin 平台预计将引发的海量数据存取需求。
AI400X3M 是 DDN 旗下 EXAScaler 平台的最新迭代,性能跃升相当显著。据公司产品高级副总裁 James Coomer 介绍,通过优化数据路径、减少不必要的数据拷贝,其写入吞吐量从约 140 Gbps 提升至约 190 Gbps,增幅达 35%;随机读取吞吐则提升至 800 万 IOPS,是前代的四倍。在密度方面,单机架已可支撑 30PB 的数据容量。为应对 NAND 闪存的供应链波动,该设备还支持混合阵列,可同时搭配 NVMe 固态盘与传统机械硬盘。
与硬件同步推出的 KV 缓存方案,则直指当前 AI 推理的核心痛点。在推理的预填充阶段,系统会生成大量中间结果并存入 KV 缓存;进入解码阶段时,模型需快速从缓存中调取这些数据,以避免重复计算、加快响应速度。然而,靠近处理器的 HBM 与 DDR 内存极易被 KV 缓存占满,数据必然溢出到外部存储。DDN 的方案在 EXAScaler 和 Infinia 两条产品线中均集成了对英伟达 Dynamo 与 Nixl 等 KV 缓存软件的支持,打造分布式共享缓存架构。公司宣称,与 Dynamo、vLLM 等框架配合,可将 KV 缓存加载速度提升最高 55 倍,从而减少 GPU 空闲等待时间,降低每个 token 的生成成本。
此外,DDN 还在研发另一套基于英伟达 DMX 参考架构的 KV 缓存方案,该架构将利用 BlueField-4 DPU 与 SpectrumX SuperNIC,预计在相关硬件下半年出货后交付。
Coomer 在访谈中指出,为 AI 请求提供足够长的上下文窗口是当前最大的技术挑战,这正推动整个行业重新思考分布式 KV 缓存的处理方式。他提到,模型的“记忆”无论如何都会持续膨胀,即便有各种优化手段出现。例如,Anthropic 在 5 月推出了 Claude Dreams API,试图在模型空闲时压缩和提炼关键信息;DeepSeek 也在 4 月发布了一种可将 KV 缓存体积缩小 10 到 100 倍的压缩机制。但 Coomer 认为,需求增长总会超越优化速度,上下文容量——即模型能“关注”多少信息——可能已成为行业公认的最大瓶颈。
除了性能与缓存,DDN 还强化了多租户环境下的安全与运维能力。公司为 EXAScaler 和 Infinia 存储方案新增了裸金属多租户支持、基于 KMIP 的加密与密钥管理、VictoriaLogs 集成以实现运维可观测性、多租户 API,以及利用 NAND 闪存加速“热池”进行数据分层等特性。Coomer 表示,随着安全审查日趋严格,以及新一批云服务商对租户隔离提出更高要求,这些功能正成为客户刚需。
整体来看,DDN 此次发布既是对英伟达下一代计算平台的前置布局,也反映出 AI 基础设施竞争正从算力芯片向数据存取效率延伸。当模型参数与上下文窗口持续膨胀,存储系统的吞吐、延迟与缓存管理能力,将直接影响推理成本与用户体验,成为产业链中不可忽视的一环。