輝達釋出Vera CPU，瞄準AI代理時代

NVIDIA推出首款專為AI代理設計的Vera CPU，已全面投產，任務完成速度比x86快1.8倍。

來源:HPCwire · 2026-06-01 03:01 ET · #晶片

字號

輝達在台北宣佈，業界首款明確為AI代理工作負載定製的CPU——Vera正式進入全面量產，並已獲得多家大型科技企業的採用意向。根據公司披露的資料，Vera在處理AI代理相關任務時，完成速度比傳統x86 CPU快1.8倍。這項提升並非單純的頻率與核心數競賽，而是源於為代理型AI（Agentic AI）流水線中反覆出現的多步推理、工具呼叫與記憶檢索等模式所做的架構級最佳化。這一動作發生在輝達鞏固其GPU霸主地位之後，向資料中心核心計算單元發起的又一次衝擊。

背景上看，輝達的CPU路線圖已醞釀多年。從起初的Grace CPU開始，這家公司就試圖將Arm架構引入高效能運算和AI資料中心，以打破x86的長期壟斷。此次的Vera被描述為“新類別處理器”，意味著它可能並非Grace的簡單迭代，而是針對當下快速爆發的AI代理需求進行了重構。AI代理區別於傳統AI模型呼叫之處在於，它需要在高度動態的上下文中持續進行決策、規劃、糾錯並與外部API互動，對處理器的響應延遲、多執行緒協同和記憶體頻寬有著截然不同的要求。Vera的推出恰逢大型語言模型從對話介面轉向自主執行任務的關鍵轉折點。

從產業位置看，Vera落於輝達“五層蛋糕”中的晶片層，卻能夠向上強力牽引基礎設施層和應用層。對於雲服務商和企業資料中心而言，若能將傳統CPU工作負載與AI代理工作負載統一到同一片Vera處理器上，可能簡化節點內異構排程的複雜性，並降低對額外加速卡的依賴，從而重塑伺服器內部的價值分配。當然，x86陣營的英特爾和AMD不會坐以待斃，它們同樣在強化AI推理加速指令集與整合NPU，但輝達憑藉其在AI軟體棧（CUDA、Triton等）的深厚積累，在代理開發框架的生態適配性上仍佔據先手。當前市場正密切關注首批部署Vera的系統和基準測試結果，這將實質性地驗證其對每瓦效能與代理吞吐量的增益，進而影響資料中心的採購決策與晶片競爭敘事。

輝達釋出Vera CPU，瞄準AI代理時代

延伸閱讀

相關深度報道

相關每日新聞