韓國科學技術院(KAIST)電氣工程系教授金正浩在一次視頻專訪中,對當前AI算力格局拋出了一個顛覆性判斷:AI的本質是內存,而不是GPU。這位被業界稱為“HBM之父”的學者,早在2010年代初期便與SK海力士合作參與了HBM1的開發,此後主導了一系列底層架構研究。

金正浩用一個具體數字揭示了他眼中AI計算的結構性矛盾:GPU裝100萬臺,真正工作的時間只有10%。他解釋,每當像ChatGPT這樣的大模型輸出一個詞,系統就需要從HBM中讀取數據、完成計算、再將結果寫回內存。“讀和寫幾乎佔掉了全部時間,GPU就在旁邊乾等著。”即便通過算法優化,GPU利用率也很難突破30%。這構成了他核心論斷“AI等於內存”的現實依據。

金正浩對英偉達的現狀判斷措辭犀利。他認為,英偉達CEO黃仁勳近期頻繁訪問韓國、參與各類會面,背後反映出其“不安心”。他直言,GPU的技術性成長已經快停了,人工智能計算機的進化,掌握在內存手裡。他的邏輯是,GPU想提升性能只能擴大芯片面積、堆更多計算單元,但散熱問題使其無法像內存一樣垂直堆疊,陷入了“外通死局”。相比之下,從訓練時代轉向推理時代,內存的重要性正在被重新定價。金正浩主張,AI能力的競爭最終是內存能力的競爭,谷歌Gemini、OpenAI、Anthropic Claude等模型誰更強,是由內存決定的。

金正浩將HBM的價值歸結為容量和帶寬兩個維度。容量方面,隨著上下文工程、多模態輸入和智能體AI的到來,內存需求以每年翻倍的速度增長,10年就是1000倍。傳統靠縮小晶體管增容的方式已逼近量子力學邊界,必須“向上堆疊”。帶寬方面,他打比方說,傳統內存若是8車道高速公路,HBM就是1024車道,現在是2048車道,幾年後可能達到百萬車道,靠並行通道同時傳輸海量數據來匹配AI計算的速度需求。

在解決速度問題後,容量天花板依然存在。金正浩詳細闡述了下一技術路線——HBF,即將NAND閃存像HBM一樣垂直堆疊。NAND閃存容量大、可長期保存數據,速度雖慢於DRAM,但在推理場景中足以滿足“冷數據”的存儲需求。他預判,未來HBM和HBF將形成共存格局,而10年後,NAND閃存和HBF的市場需求將超過HBM。他點名目前正在開發HBF的公司包括SK海力士、閃迪三星電子以及日本的鎧俠

金正浩還提出了更超前的設想——HBS,即把整張12英寸晶圓全部做成SRAM再垂直堆疊12至16層,將容量從100GB擴展到1600GB。SRAM比DRAM快約1000倍,若容量足夠,將構成未來AI計算機的終極形態。他描述的圖景是一棟“100層3D大樓”:HBM、HBF、HBS各自構成多層建築,GPU放在頂層負責散熱冷卻。他坦言,這條路最大的工程挑戰不是計算,而是供電與散熱,要給GPU和堆疊內存供幾千安培的電,電力供應網絡的設計將成為企業間真正的核心競爭力

金正浩還指出,從HBM4開始,供需結構將發生根本變化。過去內存是標準化產品,買家主導價格,庫存風險由內存廠商承擔。但定製HBM需要根據英偉達、谷歌、AMD等客戶的加速器架構量身設計,內存廠商必須在研發之初就拿到客戶的數量承諾才會啟動開發,形成“長期協議”。供應方開始決定價格,這是範式的轉變。他預期,未來HBM芯片內將集成通信功能,實現HBM之間相互通話,形成聯盟結構,進一步抬升內存廠商的系統性地位。

在全球競爭格局上,金正浩強調,能同時量產DRAMNAND閃存的公司,目前只有三星電子和SK海力士。閃迪和鎧俠雖股價沖天,但只能做HBF,做不了HBM。當被問及三星與SK海力士今年合計營業利潤500萬億至600萬億韓元的預測是否現實,金正浩給出了肯定回答。

金正浩還將內存需求的敘事延伸至終端設備。他預測,未來AI PC要真正實現個人AI計算,所需內存規模將使一臺PC的價格達到1000萬韓元,內存價格決定PC價格。而AI智能手機售價300萬至500萬韓元中,200萬至300萬韓元將是內存的價格。隨著智能體AI和具身AI的到來,內存使用量將比現在高出約1000倍,AI代理24小時工作,工作量暴增,內存需求隨之爆炸,屆時將需要“超級HBM”的時代。