在拉斯维加斯举行的年度Discover大会上,HPE宣布了一项对其私有云AI战略具有节点意义的更新:正式将基于英伟达Vera CPU的ProLiant DL394 Gen12服务器纳入HPE Private Cloud AI产品组合。这一动作呼应了当前AI产业从模型训练向推理运行转移的大趋势——当企业开始大规模部署AI应用时,拥有巨大可寻址内存空间的CPU正迅速成为紧俏资源。

DL394服务器是HPE本月早些时候在台北国际电脑展上首发的产品,其核心是英伟达在今年3月GTC大会上正式推出的Vera CPU。该处理器基于Arm架构,配备88个“Olympus”核心与176个线程,支持最高3TB的LPDDR5X内存,并能在2U风冷机箱内提供高达每秒1.2TB的内存带宽。这些参数使其特别适合处理大语言模型推理等对内存容量和带宽极度敏感的工作负载。

HPE Private Cloud AI是该公司两年前推出的统一解决方案栈,整合了HPE服务器、存储、网络与软件,并基于英伟达的参考架构构建,涵盖GPU、以太网平台、数据处理单元及网络接口卡。HPE执行副总裁兼首席技术官Fidelma Russo在大会上透露,该平台已将推理集群规模扩展至最多256个Blackwell级GPU,而DL394服务器的加入进一步强化了其CPU侧的推理能力。

除了Vera CPU的引入,HPE还公布了一系列配套升级。在安全层面,Private Cloud AI将集成HPE Zerto安全软件,提供针对恶意代理的防护、持续数据保护以及数据回滚功能,同时支持限制本地代理的行为。在数据网络结构方面,HPE Data Fabric软件获得更新,将模型上下文协议支持扩展到开源数据流工具Apache Airflow,旨在通过元数据丰富分布式数据。Russo表示,针对部分客户在部署数据网络结构软件时遇到的困难,HPE还将提供预集成的专用设备,以简化操作并加快部署速度。

存储性能的提升同样值得关注。HPE的Alletra Storage MP X10000存储阵列此前已在今年春季成为首款通过英伟达认证的对象存储设备,如今又新增了文件存储支持。当该存储与搭载8颗英伟达H200 GPU的DL380a Gen12服务器配合使用时,客户的令牌响应时间最多可降低20倍。Russo强调,HPE的架构设计允许对象存储与文件存储并行工作而无需在性能上做出取舍,内置的元数据管理、加速与KV缓存加速服务使其在私有云AI层面的性能较以往有了显著提升。

此外,HPE还宣布增强另外两个相关产品——HPE AI Factory at Scale与HPE Sovereign AI Factory。这两个方案将获得英伟达机密计算的支持,通过加密认证与加密技术建立“信任链”,并结合BlueField与DOCA技术,在本地或主权部署环境中保护模型与私有数据在运行时的安全。

从产业视角看,HPE此次密集发布传递出明确信号:企业级AI基础设施的竞争正从单纯的GPU算力比拼,转向涵盖CPU、存储、网络、安全与数据管理的全栈整合能力。随着推理需求逐步超越训练需求,能够提供高内存带宽、低延迟数据访问以及端到端安全防护的私有云方案,将成为大型企业与政府机构部署AI时的关键考量。对于英伟达而言,Vera CPU进入HPE的主流企业服务器产品线,也意味着其Arm架构处理器在数据中心市场的渗透正在加速,这将对传统x86阵营构成持续压力。