英偉達在臺北宣佈,業界首款明確為AI代理工作負載定製的CPU——Vera正式進入全面量產,並已獲得多家大型科技企業的採用意向。根據公司披露的數據,Vera在處理AI代理相關任務時,完成速度比傳統x86 CPU快1.8倍。這項提升並非單純的頻率與核心數競賽,而是源於為代理型AI(Agentic AI)流水線中反覆出現的多步推理、工具調用與記憶檢索等模式所做的架構級優化。這一動作發生在英偉達鞏固其GPU霸主地位之後,向數據中心核心計算單元發起的又一次衝擊。
背景上看,英偉達的CPU路線圖已醞釀多年。從起初的Grace CPU開始,這家公司就試圖將Arm架構引入高性能計算和AI數據中心,以打破x86的長期壟斷。此次的Vera被描述為“新類別處理器”,意味著它可能並非Grace的簡單迭代,而是針對當下快速爆發的AI代理需求進行了重構。AI代理區別於傳統AI模型調用之處在於,它需要在高度動態的上下文中持續進行決策、規劃、糾錯並與外部API交互,對處理器的響應延遲、多線程協同和內存帶寬有著截然不同的要求。Vera的推出恰逢大型語言模型從對話接口轉向自主執行任務的關鍵轉折點。
從產業位置看,Vera落於英偉達“五層蛋糕”中的芯片層,卻能夠向上強力牽引基礎設施層和應用層。對於雲服務商和企業數據中心而言,若能將傳統CPU工作負載與AI代理工作負載統一到同一片Vera處理器上,可能簡化節點內異構調度的複雜性,並降低對額外加速卡的依賴,從而重塑服務器內部的價值分配。當然,x86陣營的英特爾和AMD不會坐以待斃,它們同樣在強化AI推理加速指令集與整合NPU,但英偉達憑藉其在AI軟件棧(CUDA、Triton等)的深厚積累,在代理開發框架的生態適配性上仍佔據先手。當前市場正密切關注首批部署Vera的系統和基準測試結果,這將實質性地驗證其對每瓦性能與代理吞吐量的增益,進而影響數據中心的採購決策與芯片競爭敘事。