韩国科学技术院(KAIST)电气工程系教授金正浩在一次视频专访中,对当前AI算力格局抛出了一个颠覆性判断:AI的本质是内存,而不是GPU。这位被业界称为“HBM之父”的学者,早在2010年代初期便与SK海力士合作参与了HBM1的开发,此后主导了一系列底层架构研究。
金正浩用一个具体数字揭示了他眼中AI计算的结构性矛盾:GPU装100万台,真正工作的时间只有10%。他解释,每当像ChatGPT这样的大模型输出一个词,系统就需要从HBM中读取数据、完成计算、再将结果写回内存。“读和写几乎占掉了全部时间,GPU就在旁边干等着。”即便通过算法优化,GPU利用率也很难突破30%。这构成了他核心论断“AI等于内存”的现实依据。
金正浩对英伟达的现状判断措辞犀利。他认为,英伟达CEO黄仁勋近期频繁访问韩国、参与各类会面,背后反映出其“不安心”。他直言,GPU的技术性成长已经快停了,人工智能计算机的进化,掌握在内存手里。他的逻辑是,GPU想提升性能只能扩大芯片面积、堆更多计算单元,但散热问题使其无法像内存一样垂直堆叠,陷入了“外通死局”。相比之下,从训练时代转向推理时代,内存的重要性正在被重新定价。金正浩主张,AI能力的竞争最终是内存能力的竞争,谷歌Gemini、OpenAI、Anthropic Claude等模型谁更强,是由内存决定的。
金正浩将HBM的价值归结为容量和带宽两个维度。容量方面,随着上下文工程、多模态输入和智能体AI的到来,内存需求以每年翻倍的速度增长,10年就是1000倍。传统靠缩小晶体管增容的方式已逼近量子力学边界,必须“向上堆叠”。带宽方面,他打比方说,传统内存若是8车道高速公路,HBM就是1024车道,现在是2048车道,几年后可能达到百万车道,靠并行通道同时传输海量数据来匹配AI计算的速度需求。
在解决速度问题后,容量天花板依然存在。金正浩详细阐述了下一技术路线——HBF,即将NAND闪存像HBM一样垂直堆叠。NAND闪存容量大、可长期保存数据,速度虽慢于DRAM,但在推理场景中足以满足“冷数据”的存储需求。他预判,未来HBM和HBF将形成共存格局,而10年后,NAND闪存和HBF的市场需求将超过HBM。他点名目前正在开发HBF的公司包括SK海力士、闪迪、三星电子以及日本的铠侠。
金正浩还提出了更超前的设想——HBS,即把整张12英寸晶圆全部做成SRAM再垂直堆叠12至16层,将容量从100GB扩展到1600GB。SRAM比DRAM快约1000倍,若容量足够,将构成未来AI计算机的终极形态。他描述的图景是一栋“100层3D大楼”:HBM、HBF、HBS各自构成多层建筑,GPU放在顶层负责散热冷却。他坦言,这条路最大的工程挑战不是计算,而是供电与散热,要给GPU和堆叠内存供几千安培的电,电力供应网络的设计将成为企业间真正的核心竞争力。
金正浩还指出,从HBM4开始,供需结构将发生根本变化。过去内存是标准化产品,买家主导价格,库存风险由内存厂商承担。但定制HBM需要根据英伟达、谷歌、AMD等客户的加速器架构量身设计,内存厂商必须在研发之初就拿到客户的数量承诺才会启动开发,形成“长期协议”。供应方开始决定价格,这是范式的转变。他预期,未来HBM芯片内将集成通信功能,实现HBM之间相互通话,形成联盟结构,进一步抬升内存厂商的系统性地位。
在全球竞争格局上,金正浩强调,能同时量产DRAM和NAND闪存的公司,目前只有三星电子和SK海力士。闪迪和铠侠虽股价冲天,但只能做HBF,做不了HBM。当被问及三星与SK海力士今年合计营业利润500万亿至600万亿韩元的预测是否现实,金正浩给出了肯定回答。
金正浩还将内存需求的叙事延伸至终端设备。他预测,未来AI PC要真正实现个人AI计算,所需内存规模将使一台PC的价格达到1000万韩元,内存价格决定PC价格。而AI智能手机售价300万至500万韩元中,200万至300万韩元将是内存的价格。随着智能体AI和具身AI的到来,内存使用量将比现在高出约1000倍,AI代理24小时工作,工作量暴增,内存需求随之爆炸,届时将需要“超级HBM”的时代。