在 ISC 2026 大會上,高性能存儲廠商 DDN 發佈了一系列面向 AI 負載的存儲新品,核心是 AI400X3M 設備與一套全新的 KV 緩存解決方案。這些產品旨在提前應對英偉達 Vera Rubin 平臺預計將引發的海量數據存取需求。

AI400X3M 是 DDN 旗下 EXAScaler 平臺的最新迭代,性能躍升相當顯著。據公司產品高級副總裁 James Coomer 介紹,通過優化數據路徑、減少不必要的數據拷貝,其寫入吞吐量從約 140 Gbps 提升至約 190 Gbps,增幅達 35%;隨機讀取吞吐則提升至 800 萬 IOPS,是前代的四倍。在密度方面,單機架已可支撐 30PB 的數據容量。為應對 NAND 閃存的供應鏈波動,該設備還支持混合陣列,可同時搭配 NVMe 固態盤與傳統機械硬盤。

與硬件同步推出的 KV 緩存方案,則直指當前 AI 推理的核心痛點。在推理的預填充階段,系統會生成大量中間結果並存入 KV 緩存;進入解碼階段時,模型需快速從緩存中調取這些數據,以避免重複計算、加快響應速度。然而,靠近處理器的 HBM 與 DDR 內存極易被 KV 緩存佔滿,數據必然溢出到外部存儲。DDN 的方案在 EXAScaler 和 Infinia 兩條產品線中均集成了對英偉達 DynamoNixl 等 KV 緩存軟件的支持,打造分佈式共享緩存架構。公司宣稱,與 Dynamo、vLLM 等框架配合,可將 KV 緩存加載速度提升最高 55 倍,從而減少 GPU 空閒等待時間,降低每個 token 的生成成本。

此外,DDN 還在研發另一套基於英偉達 DMX 參考架構的 KV 緩存方案,該架構將利用 BlueField-4 DPUSpectrumX SuperNIC,預計在相關硬件下半年出貨後交付。

Coomer 在訪談中指出,為 AI 請求提供足夠長的上下文窗口是當前最大的技術挑戰,這正推動整個行業重新思考分佈式 KV 緩存的處理方式。他提到,模型的“記憶”無論如何都會持續膨脹,即便有各種優化手段出現。例如,Anthropic 在 5 月推出了 Claude Dreams API,試圖在模型空閒時壓縮和提煉關鍵信息;DeepSeek 也在 4 月發佈了一種可將 KV 緩存體積縮小 10 到 100 倍的壓縮機制。但 Coomer 認為,需求增長總會超越優化速度,上下文容量——即模型能“關注”多少信息——可能已成為行業公認的最大瓶頸。

除了性能與緩存,DDN 還強化了多租戶環境下的安全與運維能力。公司為 EXAScaler 和 Infinia 存儲方案新增了裸金屬多租戶支持、基於 KMIP 的加密與密鑰管理、VictoriaLogs 集成以實現運維可觀測性、多租戶 API,以及利用 NAND 閃存加速“熱池”進行數據分層等特性。Coomer 表示,隨著安全審查日趨嚴格,以及新一批雲服務商對租戶隔離提出更高要求,這些功能正成為客戶剛需。

整體來看,DDN 此次發佈既是對英偉達下一代計算平臺的前置佈局,也反映出 AI 基礎設施競爭正從算力芯片向數據存取效率延伸。當模型參數與上下文窗口持續膨脹,存儲系統的吞吐、延遲與緩存管理能力,將直接影響推理成本與用戶體驗,成為產業鏈中不可忽視的一環。