Supermicro聯手Arm推新伺服器，瞄準Agentic AI推理時代

Supermicro在Computex釋出搭載Arm AGI CPU的新款伺服器，面向AI推理與智慧體工作負載。

在2026年台北國際電腦展（Computex）上，伺服器大廠Supermicro公佈了一系列全新伺服器產品，明確瞄準正在興起的Agentic AI（自主式人工智慧）時代。這些系統全部基於Arm在2026年3月推出的AGI CPU構建，試圖為下一代AI推理與自主工作負載提供更高效、更密集的計算底座。

此次釋出的核心是Arm AGI CPU。該處理器最高可配置136個Arm Neoverse V3核心，支援12通道DDR5記憶體（速率達8800 MT/s）與PCIe Gen6連線，整體功耗控制在300瓦以內。Arm方面給出的估算顯示，與同等x86方案相比，基於AGI CPU的平台可實現每機架高達2倍的效能提升，在計算密度與能效上具備明顯優勢。

Supermicro圍繞這顆CPU構建了覆蓋雲、企業與邊緣場景的完整產品組合。在超大規模與新型雲基礎設施層面，公司推出了液冷Open Rack Wide（ORW）平台ARS-142TP-QNR-LCC，單個滿配機架可容納336顆AGI CPU，為雲級Agentic AI推理提供極高的計算密度。針對採用Open Rack V3（ORV3）環境的資料中心，Supermicro還推出了液冷2U4N伺服器ARS-242TP-QNR-LCC，每機架可支援168顆AGI CPU，兼顧部署靈活性。這兩款液冷系統計劃於2027年第一季度送樣，第二季度進入量產。

在風冷與邊緣場景，Supermicro同樣做了佈局。單路短深度伺服器ARS-212HE-FNR專為空間與供電受限的邊緣環境設計，適合分散式AI推理，預計2026年第四季度送樣、2027年第一季度量產。雙路2U伺服器ARS-222H-NR則面向通用計算，支援最多8塊NVMe硬碟與額外加速器擴充套件，適用於Web服務、資料庫分析、虛擬化與媒體處理等傳統資料中心負載。此外，5U平台ARS-522GP-NR可搭載8塊加速卡與雙AGI CPU，配合高密度NVMe儲存，瞄準高效能AI推理部署。這兩款平台預計2026年第三季度送樣，2027年第一季度量產。

從產業視角看，這次釋出背後反映出一個更深層的趨勢轉變。自2022年底ChatGPT引爆AI浪潮以來，資料中心擴張主要圍繞GPU展開，焦點集中在模型訓練上。但Agentic AI工作負載的特性截然不同——它們是持久化、分散式且以推理驅動的，需要系統持續進行編排、檢索、推理與即時決策。這意味著CPU在整體AI系統性能中的角色正在被重新定義，不再只是GPU的配角，而是成為決定推理效率與擴充套件性的關鍵元件。

Arm基礎設施業務線正是在這一背景下推出AGI CPU，試圖在高能效通用計算與AI加速之間找到平衡點。Supermicro作為重要的伺服器系統整合商，迅速將其轉化為可部署的產品，從液冷整機櫃到風冷邊緣節點，覆蓋了Agentic AI可能落地的多個物理場景。這種“CPU+加速器”的均衡架構思路，正在挑戰過去幾年由GPU主導的單一算力敘事。

值得注意的是，能效與資料中心可擴充套件性同樣是此次釋出的關鍵詞。隨著企業將AI部署推向更廣泛的雲、企業與邊緣環境，基礎設施必須在提升計算密度的同時控制功耗與散熱需求。基於AGI CPU的平台在每瓦效能上的優勢，或許能為那些試圖規模化部署AI但又受限於電力與冷卻條件的企業提供一條新路徑。

總體而言，Supermicro與Arm的這次合作，不僅是兩款產品的簡單釋出，更是AI基礎設施從“訓練為王”轉向“推理優先”的一個標誌性節點。當行業開始構建能夠自主推理、協作與行動的AI系統時，高效CPU與加速計算基礎設施的組合，將可能成為下一代資料中心的核心骨架。

Supermicro聯手Arm推新伺服器，瞄準Agentic AI推理時代

延伸閱讀

相關深度報道

相關每日新聞