是什麼
GPU(Graphics Processing Unit,圖形處理器)最初是為渲染 3D 遊戲畫面而生的芯片。與擅長複雜串行任務的 CPU 不同,GPU 由成千上萬個相對簡單的核心組成,專長是「同一種運算同時算很多遍」的 大規模並行計算。神經網絡的訓練與推理,本質上是海量的矩陣乘加運算,正好落在 GPU 的強項上——這讓一類原本服務於遊戲玩家的芯片,意外成為 AI 時代最緊俏的算力。
為什麼重要
2012 年,多倫多大學團隊用兩塊英偉達顯卡訓練出深度神經網絡 AlexNet,引爆了這一輪深度學習浪潮,也驗證了 GPU 是訓練 AI 的最佳引擎。此後,英偉達 持續把 GPU 往 AI 方向強化(張量核心、高帶寬顯存、高速互連),並借 CUDA 軟件生態形成深厚護城河。到大模型時代,高端 GPU 成了「硬通貨」,其供給、價格與出口管制,直接牽動整個 AI 產業的算力供應。理解 GPU,是理解「AI 為什麼這麼燒錢、為什麼算力這麼關鍵」的起點。
與「五層蛋糕」的關係
GPU 處在「五層蛋糕」的 芯片 層,是這一層最核心的產品形態。它向下消耗 能源 與晶圓製造產能,向上被 基礎設施 層組裝成算力集群、再支撐 模型 層的訓練與推理。正因為幾乎每一個上層應用最終都要落到 GPU 上,它也成了整塊蛋糕裡被追逐得最兇的一層。