Agent時代CPU需求激增，英特爾至強6+如何接招

英特爾稱中國AI算力需求同比增417%，CPU與GPU配比趨近1:1，Agent應用推高CPU需求。

資料中心採購市場正出現一個值得關注的變化：CPU開始缺貨了。在近期英特爾於北京舉辦的資料中心創新日活動上，英特爾市場營銷集團副總裁、中國區總經理郭威披露了一組資料：2026年一季度，中國AI算力需求同比暴漲417%。與此同時，CPU與GPU的配比已從此前常見的1:8，逐步演變至1:4、1:2，部分場景甚至達到1:1。英特爾資料中心集團副總裁、中國區總經理陳葆立進一步透露，某國內頭部大模型廠商從去年到今年，CPU需求增長了5倍。

需求激增的背後推手是AI Agent的興起。與傳統大模型推理不同，Agent並非完成單次問答即結束，而是持續執行任務——排程工具、查詢資料庫、管理記憶、建立子Agent。這些工作絕大多數落在CPU而非GPU身上。Agent部署越多，CPU承載的壓力越大，缺貨現象也就不難理解。

面對這一趨勢，英特爾釋出了首款基於Intel 18A製程的資料中心處理器至強6+。陳葆立給出的一個關鍵數字是：單顆至強6+可支援超過1000個智慧體的穩定部署。這一密度得益於至強6+最高288個能效核的架構，通過軟體排程，每個物理核心可同時執行3到4個Agent例項。對於排程、路由、工具呼叫這類典型的小步工作負載，高核密度配置恰好契合需求。

但陳葆立也指出，僅靠大量輕量核並不足夠。Agent本體可在能效核上執行，但當其真正執行任務時，觸發的工作負載可能完全不同。例如Agent呼叫資料庫，資料庫本身極度消耗單核效能，需要高效能核心支撐。這正是英特爾同時提供能效核（至強6+）和效能核（至強6）兩條產品線的底層邏輯——Agent工作負載是異構的，單一架構難以全面覆蓋。

在技術層面，英特爾中國區技術部總經理高宇強調，至強6系列內建的QAT（資料壓縮加速引擎）和IAA（記憶體分析加速器）成為Agent時代的關鍵能力。當前主流大模型支援百萬上下文，單個使用者的KV Cache可佔10GB以上，GPU視訊記憶體很快被佔滿，必須將KV Cache解除安裝到記憶體甚至SSD上，帶來顯著成本壓力。QAT通過硬體級壓縮，可將KV Cache在存檔前至少壓縮50%，阿里雲實測資料顯示，使用QAT後壓縮頻寬提升400%，通用CPU核數佔用減少75%。IAA則對記憶體中資料做即時壓縮，解壓由硬體完成，不增加重新載入延遲，可將沙箱場景的snapshot延遲降低最高60%，冷啟動時間提升30%。這兩項技術並非為應對當前記憶體緊缺而專門研發，而是多代產品中已有的能力，只是在Agent時代才被充分啟用其價值。

產業落地方面，多家雲廠商給出了具體資料。騰訊雲作為至強6+ AP平台的全球獨佔合作伙伴，已將新一代例項廣泛應用於微信、騰訊廣告檢索、騰訊會議等業務場景。金山雲基於至強6+的第十代雲伺服器SE10，AI Agent應用部署密度提升80%以上，Nginx高併發場景吞吐提升最高33%，MySQL CPU效能提升52%，Redis時延降低約20%。火山引擎則依託至強處理器和TDX技術，在AICC機密計算平台實現多租戶環境中AI資料與計算資源的全生命週期隔離。新華三儲存產品線首席產品經理王其勇分享，X20000儲存平台藉助至強6+，在推理場景中TTFT和TPOT效能提升最高達10倍以上，儲存成本下降60%，資料準備時間減少35%。

從產業敘事角度看，過去幾年AI行業的主流論調是GPU主導一切。但Agent的出現正在讓產業重新發現CPU的價值。騰訊雲端計算產品運營總監周馳觀察到一個破圈現象：以往開發者活動來的大多是程式設計師，如今有律師、農民、老人和兒童參與，他們都能表達想用AI做什麼。他認為，CPU與GPU比例變化不應只看資料中心內部，而要看全球業務量——大量原本ROI不合算、開發商不屑於做的業務，正因AI被自動化搬上雲和各類計算平台，這些工作不需要很多GPU，需要的是排程能力和持續高併發執行大量小指令碼。

英特爾在Agent時代的競爭力並非來自押注風口，而是多代技術積累的適時兌現。IAA和QAT早年客戶興趣有限，因應用場景不匹配，如今Agent時代來臨，這些技術突然變成稀缺能力。這種積累仍在延續，據瞭解，英特爾下一代至強CPU代號Diamond Rapids，將基於Intel 18A P工藝，計劃2027年釋出，並與至強6+保持完整的Socket相容性，客戶升級無需重構整套基礎設施。高宇將當今AI資料中心比喻為三台機器：GPU叢集、CPU叢集、高效能儲存叢集，而驅動這三台機器的都是至強處理器。騰訊雲、金山雲、阿里雲等中國夥伴給出的落地數字，正在將這一判斷轉化為可量化的生產力事實。

Agent時代CPU需求激增，英特爾至強6+如何接招

延伸閱讀

相關深度報道

相關每日新聞