輝達 Vera Rubin 平台全面量產，賦能代理 AI 工廠

輝達宣佈Vera Rubin平台全面投產，台系伺服器廠商已啟動規模化製造。

來源:HPCwire · 2026-06-01 03:05 ET · #晶片

字號

輝達在台北宣佈，代號 Vera Rubin 的下一代 AI 平台已從樣品階段轉向全面量產，目標是服務正在全球湧現的“代理 AI 工廠”。這些工廠專為訓練和部署能自主規劃、使用工具、執行多步驟任務的智慧體而建，對晶片的視訊記憶體頻寬、互聯速度和能效提出了比大模型訓練更苛刻的要求。台灣主要伺服器製造商——包括鴻海、廣達、緯創等——以及全球儲存、網路和電源管理供應商已同步啟動大規模生產，首批 Rubin 系統將發往頭部雲服務商和新興的專用 AI 算力實驗室。

Vera Rubin 接替了 Blackwell 架構，採用全新的 GPU 和互聯設計，重點提升推理響應的即時性和可擴充套件性。此前輝達在 GTC 2026 上披露，Rubin 平台整合 HBM4 記憶體與 NVLink 6 交換系統，專為萬億引數級代理模型的高頻呼叫與多模態推理最佳化。全面量產訊息證實該平台良率與封裝產能已爬坡至商用要求，較大幅度緩解市場對下一代 GPU 交付延遲的擔憂。

從產業背景看，代理 AI 工廠概念興起於企業對客服、研發、金融分析等場景自主智慧體的需求爆發。與傳統資料中心不同，這些工廠需要全天候高併發、低延遲的推理管線，Rubin 的架構恰好圍繞多步驟決策流設計，將訓練與推理環節縱向打通。台灣供應鏈的深度參與也再次凸顯其在先進晶片封裝和系統整合上的不可替代性，地緣風險雖存，但短期內產能重心仍高度集中於亞洲。

在五層蛋糕框架下，Vera Rubin 的量產直接影響第二層“晶片”和第三層“基礎設施”。晶片層，新架構的出貨將重新劃分 GPU 市場的時間視窗，給競爭對手施加進度壓力，同時拉動 HBM 儲存器、先進封裝基板等上游需求。基礎設施層，雲廠商和託管服務商的機群迭代週期加速，部分資金正從通用算力轉向代理 AI 專用叢集，可能引發新一輪資本開支競賽。對應用和模型層而言，硬體就緒意味著企業級代理部署的算力成本有望在 2027 年顯著下降，加快從實驗到規模化落地的程序。能源層則面臨更大考驗，這類工廠的功率密度往往高於傳統訓練中心，電力配套和冷卻設計成為選址與運營的關鍵約束，也間接推升清潔能源與核能驅動的投資關注度。

輝達 Vera Rubin 平台全面量產，賦能代理 AI 工廠

延伸閱讀

相關深度報道

相關每日新聞