Agent时代CPU需求激增，英特尔至强6+如何接招

英特尔称中国AI算力需求同比增417%，CPU与GPU配比趋近1:1，Agent应用推高CPU需求。

数据中心采购市场正出现一个值得关注的变化：CPU开始缺货了。在近期英特尔于北京举办的数据中心创新日活动上，英特尔市场营销集团副总裁、中国区总经理郭威披露了一组数据：2026年一季度，中国AI算力需求同比暴涨417%。与此同时，CPU与GPU的配比已从此前常见的1:8，逐步演变至1:4、1:2，部分场景甚至达到1:1。英特尔数据中心集团副总裁、中国区总经理陈葆立进一步透露，某国内头部大模型厂商从去年到今年，CPU需求增长了5倍。

需求激增的背后推手是AI Agent的兴起。与传统大模型推理不同，Agent并非完成单次问答即结束，而是持续执行任务——调度工具、查询数据库、管理记忆、创建子Agent。这些工作绝大多数落在CPU而非GPU身上。Agent部署越多，CPU承载的压力越大，缺货现象也就不难理解。

面对这一趋势，英特尔发布了首款基于Intel 18A制程的数据中心处理器至强6+。陈葆立给出的一个关键数字是：单颗至强6+可支持超过1000个智能体的稳定部署。这一密度得益于至强6+最高288个能效核的架构，通过软件调度，每个物理核心可同时运行3到4个Agent实例。对于调度、路由、工具调用这类典型的小步工作负载，高核密度配置恰好契合需求。

但陈葆立也指出，仅靠大量轻量核并不足够。Agent本体可在能效核上运行，但当其真正执行任务时，触发的工作负载可能完全不同。例如Agent调用数据库，数据库本身极度消耗单核性能，需要高性能核心支撑。这正是英特尔同时提供能效核（至强6+）和性能核（至强6）两条产品线的底层逻辑——Agent工作负载是异构的，单一架构难以全面覆盖。

在技术层面，英特尔中国区技术部总经理高宇强调，至强6系列内置的QAT（数据压缩加速引擎）和IAA（内存分析加速器）成为Agent时代的关键能力。当前主流大模型支持百万上下文，单个用户的KV Cache可占10GB以上，GPU显存很快被占满，必须将KV Cache卸载到内存甚至SSD上，带来显著成本压力。QAT通过硬件级压缩，可将KV Cache在存盘前至少压缩50%，阿里云实测数据显示，使用QAT后压缩带宽提升400%，通用CPU核数占用减少75%。IAA则对内存中数据做实时压缩，解压由硬件完成，不增加重新加载延迟，可将沙箱场景的snapshot延迟降低最高60%，冷启动时间提升30%。这两项技术并非为应对当前内存紧缺而专门研发，而是多代产品中已有的能力，只是在Agent时代才被充分激活其价值。

产业落地方面，多家云厂商给出了具体数据。腾讯云作为至强6+ AP平台的全球独占合作伙伴，已将新一代实例广泛应用于微信、腾讯广告检索、腾讯会议等业务场景。金山云基于至强6+的第十代云服务器SE10，AI Agent应用部署密度提升80%以上，Nginx高并发场景吞吐提升最高33%，MySQL CPU性能提升52%，Redis时延降低约20%。火山引擎则依托至强处理器和TDX技术，在AICC机密计算平台实现多租户环境中AI数据与计算资源的全生命周期隔离。新华三存储产品线首席产品经理王其勇分享，X20000存储平台借助至强6+，在推理场景中TTFT和TPOT性能提升最高达10倍以上，存储成本下降60%，数据准备时间减少35%。

从产业叙事角度看，过去几年AI行业的主流论调是GPU主导一切。但Agent的出现正在让产业重新发现CPU的价值。腾讯云计算产品运营总监周驰观察到一个破圈现象：以往开发者活动来的大多是程序员，如今有律师、农民、老人和儿童参与，他们都能表达想用AI做什么。他认为，CPU与GPU比例变化不应只看数据中心内部，而要看全球业务量——大量原本ROI不合算、开发商不屑于做的业务，正因AI被自动化搬上云和各类计算平台，这些工作不需要很多GPU，需要的是调度能力和持续高并发执行大量小脚本。

英特尔在Agent时代的竞争力并非来自押注风口，而是多代技术积累的适时兑现。IAA和QAT早年客户兴趣有限，因应用场景不匹配，如今Agent时代来临，这些技术突然变成稀缺能力。这种积累仍在延续，据了解，英特尔下一代至强CPU代号Diamond Rapids，将基于Intel 18A P工艺，计划2027年发布，并与至强6+保持完整的Socket兼容性，客户升级无需重构整套基础设施。高宇将当今AI数据中心比喻为三台机器：GPU集群、CPU集群、高性能存储集群，而驱动这三台机器的都是至强处理器。腾讯云、金山云、阿里云等中国伙伴给出的落地数字，正在将这一判断转化为可量化的生产力事实。

Agent时代CPU需求激增，英特尔至强6+如何接招

延伸阅读

相关深度报道

相关每日新闻