亞馬遜雲科技在 2026 年 6 月 19 日正式推出 Amazon EC2 G7 實例,成為全球首個在雲端大規模部署 NVIDIA RTX PRO 4500 Blackwell 服務器版 GPU 的主流雲服務商。這一發布將 Blackwell 架構從訓練與高端數據中心場景,進一步推向 AI 推理、圖形渲染和數據分析等更廣泛的商業負載,對雲上 GPU 算力的供給格局產生直接影響。
G7 實例的核心升級圍繞 GPU、網絡與存儲三個維度展開。在 GPU 層面,每顆 NVIDIA RTX PRO 4500 Blackwell 服務器版 GPU 配備 32 GB 顯存,單實例最多可搭載 8 顆 GPU,總顯存達到 256 GB。與上一代 G6 實例相比,顯存容量提升至 1.33 倍,顯存帶寬提升至 2.45 倍。結合第五代 Tensor Core 與第四代 RT Core,G7 在 AI 推理任務上的性能最高可達 G6 的 4.6 倍,圖形性能最高提升 2.1 倍。這一代際躍升意味著,在相同成本或時間窗口內,用戶可以處理更大規模的模型推理請求,或渲染更復雜的圖形場景。
網絡方面,G7 實例支持高達 700 Gbps 的 EFA 網絡吞吐量,是 G6 的 7 倍。EFA 的低延遲、高帶寬特性對於多 GPU 協同推理以及跨節點分佈式任務至關重要。G7 還支持 NVIDIA GPUDirect P2P 和 GPUDirect RDMA,能夠繞過 CPU 與系統內存,直接在 GPU 之間或 GPU 與存儲之間搬運數據,大幅降低通信瓶頸。存儲上,實例最高可配備 7.6 TB 本地 NVMe SSD,讓大模型和數據集儘可能靠近計算單元,減少數據搬運開銷。
在視頻處理能力上,G7 集成了第九代 NVENC 編碼器與第六代 NVDEC 解碼器,支持 4:2:2 色彩採樣,併發視頻流處理能力較 G6 提升 1.5 倍。這對直播、雲遊戲、視頻轉碼和空間計算等場景具有直接價值。實例提供 7 種規格,最高可選 192 vCPU、768 GiB 系統內存,並支持多種操作系統,包括 Amazon Linux、Ubuntu、RHEL 和 Windows Server,同時兼容 DirectX、Vulkan 和 OpenGL 等行業圖形庫。
從產業角度看,AWS 率先引入 RTX PRO 4500 Blackwell 服務器版 GPU,反映出雲廠商在 AI 推理側的競爭正在加劇。過去兩年,AI 訓練需求推動了高端 GPU 的緊缺,但隨著模型部署進入規模化階段,推理負載對性價比和低延遲的要求日益突出。Blackwell 架構在顯存帶寬和推理效率上的提升,使其成為雲端推理節點的有力候選。AWS 此次將 G7 實例定位為覆蓋 AI 推理、圖形渲染、虛擬桌面和數據分析的通用加速平臺,意在吸引那些既需要 AI 能力又依賴圖形處理的企業客戶。
目前 G7 實例已在美國東部和西部兩個區域上線,未來區域擴展計劃尚未公佈。用戶可通過 AWS Deep Learning AMI 或 NVIDIA Workstation AMI 快速啟動實例,也可在 Amazon EKS 上構建自定義節點。對於關注 AI 基礎設施的投資者和從業者而言,G7 的推出不僅意味著 Blackwell 生態的進一步落地,也可能對雲端 GPU 實例的定價和供需關係產生連鎖反應,值得持續跟蹤。