数据中心采购市场正出现一个值得关注的变化:CPU开始缺货了。在近期英特尔于北京举办的数据中心创新日活动上,英特尔市场营销集团副总裁、中国区总经理郭威披露了一组数据:2026年一季度,中国AI算力需求同比暴涨417%。与此同时,CPU与GPU的配比已从此前常见的1:8,逐步演变至1:4、1:2,部分场景甚至达到1:1。英特尔数据中心集团副总裁、中国区总经理陈葆立进一步透露,某国内头部大模型厂商从去年到今年,CPU需求增长了5倍。

需求激增的背后推手是AI Agent的兴起。与传统大模型推理不同,Agent并非完成单次问答即结束,而是持续执行任务——调度工具、查询数据库、管理记忆、创建子Agent。这些工作绝大多数落在CPU而非GPU身上。Agent部署越多,CPU承载的压力越大,缺货现象也就不难理解。

面对这一趋势,英特尔发布了首款基于Intel 18A制程的数据中心处理器至强6+。陈葆立给出的一个关键数字是:单颗至强6+可支持超过1000个智能体的稳定部署。这一密度得益于至强6+最高288个能效核的架构,通过软件调度,每个物理核心可同时运行3到4个Agent实例。对于调度、路由、工具调用这类典型的小步工作负载,高核密度配置恰好契合需求。

但陈葆立也指出,仅靠大量轻量核并不足够。Agent本体可在能效核上运行,但当其真正执行任务时,触发的工作负载可能完全不同。例如Agent调用数据库,数据库本身极度消耗单核性能,需要高性能核心支撑。这正是英特尔同时提供能效核(至强6+)和性能核(至强6)两条产品线的底层逻辑——Agent工作负载是异构的,单一架构难以全面覆盖。

在技术层面,英特尔中国区技术部总经理高宇强调,至强6系列内置的QAT(数据压缩加速引擎)和IAA(内存分析加速器)成为Agent时代的关键能力。当前主流大模型支持百万上下文,单个用户的KV Cache可占10GB以上,GPU显存很快被占满,必须将KV Cache卸载到内存甚至SSD上,带来显著成本压力。QAT通过硬件级压缩,可将KV Cache在存盘前至少压缩50%,阿里云实测数据显示,使用QAT后压缩带宽提升400%,通用CPU核数占用减少75%。IAA则对内存中数据做实时压缩,解压由硬件完成,不增加重新加载延迟,可将沙箱场景的snapshot延迟降低最高60%,冷启动时间提升30%。这两项技术并非为应对当前内存紧缺而专门研发,而是多代产品中已有的能力,只是在Agent时代才被充分激活其价值。

产业落地方面,多家云厂商给出了具体数据。腾讯云作为至强6+ AP平台的全球独占合作伙伴,已将新一代实例广泛应用于微信、腾讯广告检索、腾讯会议等业务场景。金山云基于至强6+的第十代云服务器SE10,AI Agent应用部署密度提升80%以上,Nginx高并发场景吞吐提升最高33%,MySQL CPU性能提升52%,Redis时延降低约20%。火山引擎则依托至强处理器和TDX技术,在AICC机密计算平台实现多租户环境中AI数据与计算资源的全生命周期隔离。新华三存储产品线首席产品经理王其勇分享,X20000存储平台借助至强6+,在推理场景中TTFT和TPOT性能提升最高达10倍以上,存储成本下降60%,数据准备时间减少35%。

从产业叙事角度看,过去几年AI行业的主流论调是GPU主导一切。但Agent的出现正在让产业重新发现CPU的价值。腾讯云计算产品运营总监周驰观察到一个破圈现象:以往开发者活动来的大多是程序员,如今有律师、农民、老人和儿童参与,他们都能表达想用AI做什么。他认为,CPU与GPU比例变化不应只看数据中心内部,而要看全球业务量——大量原本ROI不合算、开发商不屑于做的业务,正因AI被自动化搬上云和各类计算平台,这些工作不需要很多GPU,需要的是调度能力和持续高并发执行大量小脚本。

英特尔在Agent时代的竞争力并非来自押注风口,而是多代技术积累的适时兑现。IAA和QAT早年客户兴趣有限,因应用场景不匹配,如今Agent时代来临,这些技术突然变成稀缺能力。这种积累仍在延续,据了解,英特尔下一代至强CPU代号Diamond Rapids,将基于Intel 18A P工艺,计划2027年发布,并与至强6+保持完整的Socket兼容性,客户升级无需重构整套基础设施。高宇将当今AI数据中心比喻为三台机器:GPU集群、CPU集群、高性能存储集群,而驱动这三台机器的都是至强处理器。腾讯云、金山云、阿里云等中国伙伴给出的落地数字,正在将这一判断转化为可量化的生产力事实。