數據中心採購市場正出現一個值得關注的變化:CPU開始缺貨了。在近期英特爾於北京舉辦的數據中心創新日活動上,英特爾市場營銷集團副總裁、中國區總經理郭威披露了一組數據:2026年一季度,中國AI算力需求同比暴漲417%。與此同時,CPU與GPU的配比已從此前常見的1:8,逐步演變至1:4、1:2,部分場景甚至達到1:1。英特爾數據中心集團副總裁、中國區總經理陳葆立進一步透露,某國內頭部大模型廠商從去年到今年,CPU需求增長了5倍。

需求激增的背後推手是AI Agent的興起。與傳統大模型推理不同,Agent並非完成單次問答即結束,而是持續執行任務——調度工具、查詢數據庫、管理記憶、創建子Agent。這些工作絕大多數落在CPU而非GPU身上。Agent部署越多,CPU承載的壓力越大,缺貨現象也就不難理解。

面對這一趨勢,英特爾發佈了首款基於Intel 18A製程的數據中心處理器至強6+。陳葆立給出的一個關鍵數字是:單顆至強6+可支持超過1000個智能體的穩定部署。這一密度得益於至強6+最高288個能效核的架構,通過軟件調度,每個物理核心可同時運行3到4個Agent實例。對於調度、路由、工具調用這類典型的小步工作負載,高核密度配置恰好契合需求。

但陳葆立也指出,僅靠大量輕量核並不足夠。Agent本體可在能效核上運行,但當其真正執行任務時,觸發的工作負載可能完全不同。例如Agent調用數據庫,數據庫本身極度消耗單核性能,需要高性能核心支撐。這正是英特爾同時提供能效核(至強6+)和性能核(至強6)兩條產品線的底層邏輯——Agent工作負載是異構的,單一架構難以全面覆蓋。

在技術層面,英特爾中國區技術部總經理高宇強調,至強6系列內置的QAT(數據壓縮加速引擎)和IAA(內存分析加速器)成為Agent時代的關鍵能力。當前主流大模型支持百萬上下文,單個用戶的KV Cache可佔10GB以上,GPU顯存很快被佔滿,必須將KV Cache卸載到內存甚至SSD上,帶來顯著成本壓力。QAT通過硬件級壓縮,可將KV Cache在存盤前至少壓縮50%,阿里雲實測數據顯示,使用QAT後壓縮帶寬提升400%,通用CPU核數佔用減少75%。IAA則對內存中數據做實時壓縮,解壓由硬件完成,不增加重新加載延遲,可將沙箱場景的snapshot延遲降低最高60%,冷啟動時間提升30%。這兩項技術並非為應對當前內存緊缺而專門研發,而是多代產品中已有的能力,只是在Agent時代才被充分激活其價值。

產業落地方面,多家雲廠商給出了具體數據。騰訊雲作為至強6+ AP平臺的全球獨佔合作伙伴,已將新一代實例廣泛應用於微信、騰訊廣告檢索、騰訊會議等業務場景。金山雲基於至強6+的第十代雲服務器SE10,AI Agent應用部署密度提升80%以上,Nginx高併發場景吞吐提升最高33%,MySQL CPU性能提升52%,Redis時延降低約20%。火山引擎則依託至強處理器和TDX技術,在AICC機密計算平臺實現多租戶環境中AI數據與計算資源的全生命週期隔離。新華三存儲產品線首席產品經理王其勇分享,X20000存儲平臺藉助至強6+,在推理場景中TTFT和TPOT性能提升最高達10倍以上,存儲成本下降60%,數據準備時間減少35%。

從產業敘事角度看,過去幾年AI行業的主流論調是GPU主導一切。但Agent的出現正在讓產業重新發現CPU的價值。騰訊雲計算產品運營總監周馳觀察到一個破圈現象:以往開發者活動來的大多是程序員,如今有律師、農民、老人和兒童參與,他們都能表達想用AI做什麼。他認為,CPU與GPU比例變化不應只看數據中心內部,而要看全球業務量——大量原本ROI不合算、開發商不屑於做的業務,正因AI被自動化搬上雲和各類計算平臺,這些工作不需要很多GPU,需要的是調度能力和持續高併發執行大量小腳本。

英特爾在Agent時代的競爭力並非來自押注風口,而是多代技術積累的適時兌現。IAA和QAT早年客戶興趣有限,因應用場景不匹配,如今Agent時代來臨,這些技術突然變成稀缺能力。這種積累仍在延續,據瞭解,英特爾下一代至強CPU代號Diamond Rapids,將基於Intel 18A P工藝,計劃2027年發佈,並與至強6+保持完整的Socket兼容性,客戶升級無需重構整套基礎設施。高宇將當今AI數據中心比喻為三臺機器:GPU集群、CPU集群、高性能存儲集群,而驅動這三臺機器的都是至強處理器。騰訊雲、金山雲、阿里雲等中國夥伴給出的落地數字,正在將這一判斷轉化為可量化的生產力事實。