在2026年臺北國際電腦展(Computex)上,服務器大廠Supermicro公佈了一系列全新服務器產品,明確瞄準正在興起的Agentic AI(自主式人工智能)時代。這些系統全部基於Arm在2026年3月推出的AGI CPU構建,試圖為下一代AI推理與自主工作負載提供更高效、更密集的計算底座。

此次發佈的核心是Arm AGI CPU。該處理器最高可配置136個Arm Neoverse V3核心,支持12通道DDR5內存(速率達8800 MT/s)與PCIe Gen6連接,整體功耗控制在300瓦以內。Arm方面給出的估算顯示,與同等x86方案相比,基於AGI CPU的平臺可實現每機架高達2倍的性能提升,在計算密度與能效上具備明顯優勢。

Supermicro圍繞這顆CPU構建了覆蓋雲、企業與邊緣場景的完整產品組合。在超大規模與新型雲基礎設施層面,公司推出了液冷Open Rack Wide(ORW)平臺ARS-142TP-QNR-LCC,單個滿配機架可容納336顆AGI CPU,為雲級Agentic AI推理提供極高的計算密度。針對採用Open Rack V3(ORV3)環境的數據中心,Supermicro還推出了液冷2U4N服務器ARS-242TP-QNR-LCC,每機架可支持168顆AGI CPU,兼顧部署靈活性。這兩款液冷系統計劃於2027年第一季度送樣,第二季度進入量產。

在風冷與邊緣場景,Supermicro同樣做了佈局。單路短深度服務器ARS-212HE-FNR專為空間與供電受限的邊緣環境設計,適合分佈式AI推理,預計2026年第四季度送樣、2027年第一季度量產。雙路2U服務器ARS-222H-NR則面向通用計算,支持最多8塊NVMe硬盤與額外加速器擴展,適用於Web服務、數據庫分析、虛擬化與媒體處理等傳統數據中心負載。此外,5U平臺ARS-522GP-NR可搭載8塊加速卡與雙AGI CPU,配合高密度NVMe存儲,瞄準高性能AI推理部署。這兩款平臺預計2026年第三季度送樣,2027年第一季度量產。

從產業視角看,這次發佈背後反映出一個更深層的趨勢轉變。自2022年底ChatGPT引爆AI浪潮以來,數據中心擴張主要圍繞GPU展開,焦點集中在模型訓練上。但Agentic AI工作負載的特性截然不同——它們是持久化、分佈式且以推理驅動的,需要系統持續進行編排、檢索、推理與實時決策。這意味著CPU在整體AI系統性能中的角色正在被重新定義,不再只是GPU的配角,而是成為決定推理效率與擴展性的關鍵組件。

Arm基礎設施業務線正是在這一背景下推出AGI CPU,試圖在高能效通用計算與AI加速之間找到平衡點。Supermicro作為重要的服務器系統整合商,迅速將其轉化為可部署的產品,從液冷整機櫃到風冷邊緣節點,覆蓋了Agentic AI可能落地的多個物理場景。這種“CPU+加速器”的均衡架構思路,正在挑戰過去幾年由GPU主導的單一算力敘事。

值得注意的是,能效與數據中心可擴展性同樣是此次發佈的關鍵詞。隨著企業將AI部署推向更廣泛的雲、企業與邊緣環境,基礎設施必須在提升計算密度的同時控制功耗與散熱需求。基於AGI CPU的平臺在每瓦性能上的優勢,或許能為那些試圖規模化部署AI但又受限於電力與冷卻條件的企業提供一條新路徑。

總體而言,Supermicro與Arm的這次合作,不僅是兩款產品的簡單發佈,更是AI基礎設施從“訓練為王”轉向“推理優先”的一個標誌性節點。當行業開始構建能夠自主推理、協作與行動的AI系統時,高效CPU與加速計算基礎設施的組合,將可能成為下一代數據中心的核心骨架。