亚马逊云科技在 2026 年 6 月 19 日正式推出 Amazon EC2 G7 实例,成为全球首个在云端大规模部署 NVIDIA RTX PRO 4500 Blackwell 服务器版 GPU 的主流云服务商。这一发布将 Blackwell 架构从训练与高端数据中心场景,进一步推向 AI 推理、图形渲染和数据分析等更广泛的商业负载,对云上 GPU 算力的供给格局产生直接影响。
G7 实例的核心升级围绕 GPU、网络与存储三个维度展开。在 GPU 层面,每颗 NVIDIA RTX PRO 4500 Blackwell 服务器版 GPU 配备 32 GB 显存,单实例最多可搭载 8 颗 GPU,总显存达到 256 GB。与上一代 G6 实例相比,显存容量提升至 1.33 倍,显存带宽提升至 2.45 倍。结合第五代 Tensor Core 与第四代 RT Core,G7 在 AI 推理任务上的性能最高可达 G6 的 4.6 倍,图形性能最高提升 2.1 倍。这一代际跃升意味着,在相同成本或时间窗口内,用户可以处理更大规模的模型推理请求,或渲染更复杂的图形场景。
网络方面,G7 实例支持高达 700 Gbps 的 EFA 网络吞吐量,是 G6 的 7 倍。EFA 的低延迟、高带宽特性对于多 GPU 协同推理以及跨节点分布式任务至关重要。G7 还支持 NVIDIA GPUDirect P2P 和 GPUDirect RDMA,能够绕过 CPU 与系统内存,直接在 GPU 之间或 GPU 与存储之间搬运数据,大幅降低通信瓶颈。存储上,实例最高可配备 7.6 TB 本地 NVMe SSD,让大模型和数据集尽可能靠近计算单元,减少数据搬运开销。
在视频处理能力上,G7 集成了第九代 NVENC 编码器与第六代 NVDEC 解码器,支持 4:2:2 色彩采样,并发视频流处理能力较 G6 提升 1.5 倍。这对直播、云游戏、视频转码和空间计算等场景具有直接价值。实例提供 7 种规格,最高可选 192 vCPU、768 GiB 系统内存,并支持多种操作系统,包括 Amazon Linux、Ubuntu、RHEL 和 Windows Server,同时兼容 DirectX、Vulkan 和 OpenGL 等行业图形库。
从产业角度看,AWS 率先引入 RTX PRO 4500 Blackwell 服务器版 GPU,反映出云厂商在 AI 推理侧的竞争正在加剧。过去两年,AI 训练需求推动了高端 GPU 的紧缺,但随着模型部署进入规模化阶段,推理负载对性价比和低延迟的要求日益突出。Blackwell 架构在显存带宽和推理效率上的提升,使其成为云端推理节点的有力候选。AWS 此次将 G7 实例定位为覆盖 AI 推理、图形渲染、虚拟桌面和数据分析的通用加速平台,意在吸引那些既需要 AI 能力又依赖图形处理的企业客户。
目前 G7 实例已在美国东部和西部两个区域上线,未来区域扩展计划尚未公布。用户可通过 AWS Deep Learning AMI 或 NVIDIA Workstation AMI 快速启动实例,也可在 Amazon EKS 上构建自定义节点。对于关注 AI 基础设施的投资者和从业者而言,G7 的推出不仅意味着 Blackwell 生态的进一步落地,也可能对云端 GPU 实例的定价和供需关系产生连锁反应,值得持续跟踪。