Supermicro联手Arm推新服务器，瞄准Agentic AI推理时代

Supermicro在Computex发布搭载Arm AGI CPU的新款服务器，面向AI推理与智能体工作负载。

在2026年台北国际电脑展（Computex）上，服务器大厂Supermicro公布了一系列全新服务器产品，明确瞄准正在兴起的Agentic AI（自主式人工智能）时代。这些系统全部基于Arm在2026年3月推出的AGI CPU构建，试图为下一代AI推理与自主工作负载提供更高效、更密集的计算底座。

此次发布的核心是Arm AGI CPU。该处理器最高可配置136个Arm Neoverse V3核心，支持12通道DDR5内存（速率达8800 MT/s）与PCIe Gen6连接，整体功耗控制在300瓦以内。Arm方面给出的估算显示，与同等x86方案相比，基于AGI CPU的平台可实现每机架高达2倍的性能提升，在计算密度与能效上具备明显优势。

Supermicro围绕这颗CPU构建了覆盖云、企业与边缘场景的完整产品组合。在超大规模与新型云基础设施层面，公司推出了液冷Open Rack Wide（ORW）平台ARS-142TP-QNR-LCC，单个满配机架可容纳336颗AGI CPU，为云级Agentic AI推理提供极高的计算密度。针对采用Open Rack V3（ORV3）环境的数据中心，Supermicro还推出了液冷2U4N服务器ARS-242TP-QNR-LCC，每机架可支持168颗AGI CPU，兼顾部署灵活性。这两款液冷系统计划于2027年第一季度送样，第二季度进入量产。

在风冷与边缘场景，Supermicro同样做了布局。单路短深度服务器ARS-212HE-FNR专为空间与供电受限的边缘环境设计，适合分布式AI推理，预计2026年第四季度送样、2027年第一季度量产。双路2U服务器ARS-222H-NR则面向通用计算，支持最多8块NVMe硬盘与额外加速器扩展，适用于Web服务、数据库分析、虚拟化与媒体处理等传统数据中心负载。此外，5U平台ARS-522GP-NR可搭载8块加速卡与双AGI CPU，配合高密度NVMe存储，瞄准高性能AI推理部署。这两款平台预计2026年第三季度送样，2027年第一季度量产。

从产业视角看，这次发布背后反映出一个更深层的趋势转变。自2022年底ChatGPT引爆AI浪潮以来，数据中心扩张主要围绕GPU展开，焦点集中在模型训练上。但Agentic AI工作负载的特性截然不同——它们是持久化、分布式且以推理驱动的，需要系统持续进行编排、检索、推理与实时决策。这意味着CPU在整体AI系统性能中的角色正在被重新定义，不再只是GPU的配角，而是成为决定推理效率与扩展性的关键组件。

Arm基础设施业务线正是在这一背景下推出AGI CPU，试图在高能效通用计算与AI加速之间找到平衡点。Supermicro作为重要的服务器系统整合商，迅速将其转化为可部署的产品，从液冷整机柜到风冷边缘节点，覆盖了Agentic AI可能落地的多个物理场景。这种“CPU+加速器”的均衡架构思路，正在挑战过去几年由GPU主导的单一算力叙事。

值得注意的是，能效与数据中心可扩展性同样是此次发布的关键词。随着企业将AI部署推向更广泛的云、企业与边缘环境，基础设施必须在提升计算密度的同时控制功耗与散热需求。基于AGI CPU的平台在每瓦性能上的优势，或许能为那些试图规模化部署AI但又受限于电力与冷却条件的企业提供一条新路径。

总体而言，Supermicro与Arm的这次合作，不仅是两款产品的简单发布，更是AI基础设施从“训练为王”转向“推理优先”的一个标志性节点。当行业开始构建能够自主推理、协作与行动的AI系统时，高效CPU与加速计算基础设施的组合，将可能成为下一代数据中心的核心骨架。

Supermicro联手Arm推新服务器，瞄准Agentic AI推理时代

延伸阅读

相关深度报道

相关每日新闻