DDN 发布高速存储设备与 KV 缓存方案，迎接英伟达 Vera Rubin 平台

DDN发布AI400X3M存储设备及支持英伟达中间件的KV缓存方案，应对AI数据需求。

在 ISC 2026 大会上，高性能存储厂商 DDN 发布了一系列面向 AI 负载的存储新品，核心是 AI400X3M 设备与一套全新的 KV 缓存解决方案。这些产品旨在提前应对英伟达 Vera Rubin 平台预计将引发的海量数据存取需求。

AI400X3M 是 DDN 旗下 EXAScaler 平台的最新迭代，性能跃升相当显著。据公司产品高级副总裁 James Coomer 介绍，通过优化数据路径、减少不必要的数据拷贝，其写入吞吐量从约 140 Gbps 提升至约 190 Gbps，增幅达 35%；随机读取吞吐则提升至 800 万 IOPS，是前代的四倍。在密度方面，单机架已可支撑 30PB 的数据容量。为应对 NAND 闪存的供应链波动，该设备还支持混合阵列，可同时搭配 NVMe 固态盘与传统机械硬盘。

与硬件同步推出的 KV 缓存方案，则直指当前 AI 推理的核心痛点。在推理的预填充阶段，系统会生成大量中间结果并存入 KV 缓存；进入解码阶段时，模型需快速从缓存中调取这些数据，以避免重复计算、加快响应速度。然而，靠近处理器的 HBM 与 DDR 内存极易被 KV 缓存占满，数据必然溢出到外部存储。DDN 的方案在 EXAScaler 和 Infinia 两条产品线中均集成了对英伟达 Dynamo 与 Nixl 等 KV 缓存软件的支持，打造分布式共享缓存架构。公司宣称，与 Dynamo、vLLM 等框架配合，可将 KV 缓存加载速度提升最高 55 倍，从而减少 GPU 空闲等待时间，降低每个 token 的生成成本。

此外，DDN 还在研发另一套基于英伟达 DMX 参考架构的 KV 缓存方案，该架构将利用 BlueField-4 DPU 与 SpectrumX SuperNIC，预计在相关硬件下半年出货后交付。

Coomer 在访谈中指出，为 AI 请求提供足够长的上下文窗口是当前最大的技术挑战，这正推动整个行业重新思考分布式 KV 缓存的处理方式。他提到，模型的“记忆”无论如何都会持续膨胀，即便有各种优化手段出现。例如，Anthropic 在 5 月推出了 Claude Dreams API，试图在模型空闲时压缩和提炼关键信息；DeepSeek 也在 4 月发布了一种可将 KV 缓存体积缩小 10 到 100 倍的压缩机制。但 Coomer 认为，需求增长总会超越优化速度，上下文容量——即模型能“关注”多少信息——可能已成为行业公认的最大瓶颈。

除了性能与缓存，DDN 还强化了多租户环境下的安全与运维能力。公司为 EXAScaler 和 Infinia 存储方案新增了裸金属多租户支持、基于 KMIP 的加密与密钥管理、VictoriaLogs 集成以实现运维可观测性、多租户 API，以及利用 NAND 闪存加速“热池”进行数据分层等特性。Coomer 表示，随着安全审查日趋严格，以及新一批云服务商对租户隔离提出更高要求，这些功能正成为客户刚需。

整体来看，DDN 此次发布既是对英伟达下一代计算平台的前置布局，也反映出 AI 基础设施竞争正从算力芯片向数据存取效率延伸。当模型参数与上下文窗口持续膨胀，存储系统的吞吐、延迟与缓存管理能力，将直接影响推理成本与用户体验，成为产业链中不可忽视的一环。

DDN 发布高速存储设备与 KV 缓存方案，迎接英伟达 Vera Rubin 平台

延伸阅读

相关深度报道

相关每日新闻