知名半导体研究作者Vikram Sekar和Austin Lyon在6月30日的一档节目中提出,AI推理工作负载正经历结构性变化,数据中心硬件生态可能迎来重塑。
他们指出,随着推理任务被“解耦”为预填充和解码等更精细的环节,过去依赖单一通用GPU的“一刀切”模式不再是最优解。这种技术趋势为各类芯片厂商打开了机会之门。
具体而言,像高通这样的大型半导体公司,或专注于AI的初创企业,可以针对解码等特定任务研发专用硬件。这些芯片无需替代英伟达GPU,而是可以在同一数据中心内与GPU混合搭配、协同工作,各自处理最擅长的负载部分。
这一观点若成立,意味着英伟达在AI推理领域“通吃一切”的局面可能被打破。市场将从单一供应商主导,转向一个更多元、更异构的算力架构。对于产业链而言,这既可能分散采购集中度,也为专用芯片设计公司提供了切入高增长市场的路径。
不过,该讨论目前属于行业观察者的前瞻性判断,而非已落地的市场现实。推理工作负载的解耦程度、专用芯片的生态成熟度,以及数据中心客户对混合架构的接受意愿,仍是决定这一趋势能否兑现的关键变量。