DDN 發佈高速存儲設備與 KV 緩存方案，迎接英偉達 Vera Rubin 平臺

DDN發佈AI400X3M存儲設備及支持英偉達中間件的KV緩存方案，應對AI數據需求。

在 ISC 2026 大會上，高性能存儲廠商 DDN 發佈了一系列面向 AI 負載的存儲新品，核心是 AI400X3M 設備與一套全新的 KV 緩存解決方案。這些產品旨在提前應對英偉達 Vera Rubin 平臺預計將引發的海量數據存取需求。

AI400X3M 是 DDN 旗下 EXAScaler 平臺的最新迭代，性能躍升相當顯著。據公司產品高級副總裁 James Coomer 介紹，通過優化數據路徑、減少不必要的數據拷貝，其寫入吞吐量從約 140 Gbps 提升至約 190 Gbps，增幅達 35%；隨機讀取吞吐則提升至 800 萬 IOPS，是前代的四倍。在密度方面，單機架已可支撐 30PB 的數據容量。為應對 NAND 閃存的供應鏈波動，該設備還支持混合陣列，可同時搭配 NVMe 固態盤與傳統機械硬盤。

與硬件同步推出的 KV 緩存方案，則直指當前 AI 推理的核心痛點。在推理的預填充階段，系統會生成大量中間結果並存入 KV 緩存；進入解碼階段時，模型需快速從緩存中調取這些數據，以避免重複計算、加快響應速度。然而，靠近處理器的 HBM 與 DDR 內存極易被 KV 緩存佔滿，數據必然溢出到外部存儲。DDN 的方案在 EXAScaler 和 Infinia 兩條產品線中均集成了對英偉達 Dynamo 與 Nixl 等 KV 緩存軟件的支持，打造分佈式共享緩存架構。公司宣稱，與 Dynamo、vLLM 等框架配合，可將 KV 緩存加載速度提升最高 55 倍，從而減少 GPU 空閒等待時間，降低每個 token 的生成成本。

此外，DDN 還在研發另一套基於英偉達 DMX 參考架構的 KV 緩存方案，該架構將利用 BlueField-4 DPU 與 SpectrumX SuperNIC，預計在相關硬件下半年出貨後交付。

Coomer 在訪談中指出，為 AI 請求提供足夠長的上下文窗口是當前最大的技術挑戰，這正推動整個行業重新思考分佈式 KV 緩存的處理方式。他提到，模型的“記憶”無論如何都會持續膨脹，即便有各種優化手段出現。例如，Anthropic 在 5 月推出了 Claude Dreams API，試圖在模型空閒時壓縮和提煉關鍵信息；DeepSeek 也在 4 月發佈了一種可將 KV 緩存體積縮小 10 到 100 倍的壓縮機制。但 Coomer 認為，需求增長總會超越優化速度，上下文容量——即模型能“關注”多少信息——可能已成為行業公認的最大瓶頸。

除了性能與緩存，DDN 還強化了多租戶環境下的安全與運維能力。公司為 EXAScaler 和 Infinia 存儲方案新增了裸金屬多租戶支持、基於 KMIP 的加密與密鑰管理、VictoriaLogs 集成以實現運維可觀測性、多租戶 API，以及利用 NAND 閃存加速“熱池”進行數據分層等特性。Coomer 表示，隨著安全審查日趨嚴格，以及新一批雲服務商對租戶隔離提出更高要求，這些功能正成為客戶剛需。

整體來看，DDN 此次發佈既是對英偉達下一代計算平臺的前置佈局，也反映出 AI 基礎設施競爭正從算力芯片向數據存取效率延伸。當模型參數與上下文窗口持續膨脹，存儲系統的吞吐、延遲與緩存管理能力，將直接影響推理成本與用戶體驗，成為產業鏈中不可忽視的一環。

DDN 發佈高速存儲設備與 KV 緩存方案，迎接英偉達 Vera Rubin 平臺

延伸閱讀

相關深度報道

相關每日新聞