HBM之父金正浩：AI本質是內存，GPU利用率僅10%

華爾街見聞報道，HBM之父金正浩稱AI本質是內存，GPU僅10%時間真正工作。

韓國科學技術院（KAIST）電氣工程系教授金正浩在一次視頻專訪中，對當前AI算力格局拋出了一個顛覆性判斷：AI的本質是內存，而不是GPU。這位被業界稱為“HBM之父”的學者，早在2010年代初期便與SK海力士合作參與了HBM1的開發，此後主導了一系列底層架構研究。

金正浩用一個具體數字揭示了他眼中AI計算的結構性矛盾：GPU裝100萬臺，真正工作的時間只有10%。他解釋，每當像ChatGPT這樣的大模型輸出一個詞，系統就需要從HBM中讀取數據、完成計算、再將結果寫回內存。“讀和寫幾乎佔掉了全部時間，GPU就在旁邊乾等著。”即便通過算法優化，GPU利用率也很難突破30%。這構成了他核心論斷“AI等於內存”的現實依據。

金正浩對英偉達的現狀判斷措辭犀利。他認為，英偉達CEO黃仁勳近期頻繁訪問韓國、參與各類會面，背後反映出其“不安心”。他直言，GPU的技術性成長已經快停了，人工智能計算機的進化，掌握在內存手裡。他的邏輯是，GPU想提升性能只能擴大芯片面積、堆更多計算單元，但散熱問題使其無法像內存一樣垂直堆疊，陷入了“外通死局”。相比之下，從訓練時代轉向推理時代，內存的重要性正在被重新定價。金正浩主張，AI能力的競爭最終是內存能力的競爭，谷歌Gemini、OpenAI、Anthropic Claude等模型誰更強，是由內存決定的。

金正浩將HBM的價值歸結為容量和帶寬兩個維度。容量方面，隨著上下文工程、多模態輸入和智能體AI的到來，內存需求以每年翻倍的速度增長，10年就是1000倍。傳統靠縮小晶體管增容的方式已逼近量子力學邊界，必須“向上堆疊”。帶寬方面，他打比方說，傳統內存若是8車道高速公路，HBM就是1024車道，現在是2048車道，幾年後可能達到百萬車道，靠並行通道同時傳輸海量數據來匹配AI計算的速度需求。

在解決速度問題後，容量天花板依然存在。金正浩詳細闡述了下一技術路線——HBF，即將NAND閃存像HBM一樣垂直堆疊。NAND閃存容量大、可長期保存數據，速度雖慢於DRAM，但在推理場景中足以滿足“冷數據”的存儲需求。他預判，未來HBM和HBF將形成共存格局，而10年後，NAND閃存和HBF的市場需求將超過HBM。他點名目前正在開發HBF的公司包括SK海力士、閃迪、三星電子以及日本的鎧俠。

金正浩還提出了更超前的設想——HBS，即把整張12英寸晶圓全部做成SRAM再垂直堆疊12至16層，將容量從100GB擴展到1600GB。SRAM比DRAM快約1000倍，若容量足夠，將構成未來AI計算機的終極形態。他描述的圖景是一棟“100層3D大樓”：HBM、HBF、HBS各自構成多層建築，GPU放在頂層負責散熱冷卻。他坦言，這條路最大的工程挑戰不是計算，而是供電與散熱，要給GPU和堆疊內存供幾千安培的電，電力供應網絡的設計將成為企業間真正的核心競爭力。

金正浩還指出，從HBM4開始，供需結構將發生根本變化。過去內存是標準化產品，買家主導價格，庫存風險由內存廠商承擔。但定製HBM需要根據英偉達、谷歌、AMD等客戶的加速器架構量身設計，內存廠商必須在研發之初就拿到客戶的數量承諾才會啟動開發，形成“長期協議”。供應方開始決定價格，這是範式的轉變。他預期，未來HBM芯片內將集成通信功能，實現HBM之間相互通話，形成聯盟結構，進一步抬升內存廠商的系統性地位。

在全球競爭格局上，金正浩強調，能同時量產DRAM和NAND閃存的公司，目前只有三星電子和SK海力士。閃迪和鎧俠雖股價沖天，但只能做HBF，做不了HBM。當被問及三星與SK海力士今年合計營業利潤500萬億至600萬億韓元的預測是否現實，金正浩給出了肯定回答。

金正浩還將內存需求的敘事延伸至終端設備。他預測，未來AI PC要真正實現個人AI計算，所需內存規模將使一臺PC的價格達到1000萬韓元，內存價格決定PC價格。而AI智能手機售價300萬至500萬韓元中，200萬至300萬韓元將是內存的價格。隨著智能體AI和具身AI的到來，內存使用量將比現在高出約1000倍，AI代理24小時工作，工作量暴增，內存需求隨之爆炸，屆時將需要“超級HBM”的時代。

HBM之父金正浩：AI本質是內存，GPU利用率僅10%

延伸閱讀

相關深度報道

相關每日新聞