AWS 已将搭载其最新自研 Graviton5 处理器的 Amazon EC2 C9g 和 C9gd 实例全面推向市场,明确传递出一个信号:在 AI 基础设施的下一阶段,CPU 依然扮演着不可替代的角色。
这两款计算优化型实例基于 Arm 架构,目标工作负载并非直接替代 GPU 进行大规模模型训练,而是聚焦于 AI 推理、高性能计算(HPC)、分布式分析以及其他 CPU 密集型任务。AWS 公布的数据显示,与上一代 C8g 家族相比,C9g 每 vCPU 的性能提升最高可达 25%。这一代际跃升得益于多项硬件升级:支持 DDR5-8800 内存、将 L3 缓存扩大至前代的 五倍、引入 PCIe Gen 6 连接标准,以及将数据包处理性能提升至原来的 三倍。
在性能提升之外,AWS 同步推进了平台级安全更新。通过最新的 Nitro 平台,该公司部署了 Nitro Isolation Engine——一项基于 Rust 语言构建的安全能力,运行在 Nitro Hypervisor 中。它负责仲裁虚拟机对内存、CPU 寄存器状态及 I/O 设备的访问,旨在进一步强化虚拟机之间的隔离性,降低侧信道攻击等风险。
此次发布的深层意义在于,它反映了 AI 工作负载结构的演变。当前,GPU 仍是模型训练和大规模推理的主力引擎,但整个 AI 技术栈正在向智能体系统演进——这些系统需要规划、调用工具并执行多步骤工作流。这种转变将更多责任放在了 CPU 肩上:任务编排、内存管理、调度与并发处理成为决定整体效率的关键环节。如果 CPU 能力不足,昂贵的加速器可能因等待数据或指令而无法充分利用。
对数据中心运营商和 AI 基础设施规划者而言,这意味着需要重新审视计算、内存、网络和存储之间的平衡。单纯堆砌 GPU 已不足以构建高效的 AI 平台,CPU 的选择与配置同样会影响总拥有成本和系统吞吐量。AWS 通过 Graviton5 及 C9g 实例的定位,实际上是在推动一种异构计算理念:让 GPU 专注于其擅长的并行矩阵运算,而将复杂的控制逻辑、数据预处理和后处理交给高性能 CPU。
从产业竞争角度看,AWS 持续迭代自研 Arm 处理器,也在强化其相对于传统 x86 阵营的差异化优势。Graviton5 在 AI 推理场景中的能效比和成本表现,可能吸引那些希望在云端构建端到端 AI 流水线的企业客户。随着 AI 应用从实验走向大规模部署,推理环节的算力成本和能耗正成为焦点,CPU 在这一环节的角色或将进一步凸显。