英偉達與亞馬遜雲科技(AWS)正在將AI基礎設施的合作推向更務實的生產層面。雙方最新的聯合發佈覆蓋了從推理計算、向量檢索到大規模訓練的全鏈條,旨在為企業提供更低延遲、更高性價比且運維更簡單的AI部署路徑。
在計算實例層,AWS推出了全新的Amazon EC2 G7實例,搭載英偉達RTX PRO 4500 Blackwell服務器版GPU。這款GPU並非僅面向單一負載,而是針對AI推理、圖形渲染、空間計算、視頻處理以及GPU加速數據分析等多種工作負載進行了統一設計。與上一代G6實例相比,G7在AI推理性能上實現了最高4.6倍的提升,圖形性能提升最高2.1倍,同時在基於Apache Spark的數據分析任務中,藉助英偉達cuDF庫也獲得了顯著加速。
G7實例的硬件配置相當靈活:支持最多8顆GPU、總計256GB GPU顯存、700 Gbps的EFA網絡帶寬以及最高7.6TB的本地NVMe SSD存儲。用戶可按需選擇1卡、2卡、4卡或8卡的配置,甚至裸金屬形態也即將推出。這種彈性意味著企業不必為峰值負載過度配置資源,而是可以根據實際工作負載精確匹配算力,從而控制成本。G7實例已可通過AWS Deep Learning AMI、Amazon EMR、Amazon EKS等服務獲取,並即將登陸Amazon SageMaker AI。
在數據檢索層,雙方的合作同樣深入。新一代Amazon OpenSearch Serverless將英偉達cuVS庫驅動的GPU加速向量索引設為所有向量集合的默認計算選項。對於構建檢索增強生成(RAG)、語義搜索、推薦系統以及智能體AI應用的團隊而言,這一變化意義重大——它把原本需要專門優化項目的GPU向量搜索,變成了AWS的一項標準能力。實際效果是:向量索引速度最高提升10倍,而成本僅為純CPU方案的四分之一。這使得在一小時內構建十億級向量數據庫成為可能,大幅縮短了從原始數據到生產就緒AI檢索系統的路徑。
在訓練端,AWS還獲得了英偉達針對GB300訓練負載頒發的Exemplar Cloud認證。這意味著AWS在運行大規模AI訓練任務時,已達到英偉達參考架構所設定的嚴格性能基準。這一認證源於雙方團隊的深度聯合工程努力,讓開發者和AI決策者在評估雲服務商時,能更確信其基礎設施的一致性與高性能,從而更高效地將AI項目從規劃推向生產。
從產業視角看,這三項進展並非孤立的技術升級,而是共同指向一個趨勢:雲廠商正將GPU加速能力從“可選的高階功能”轉變為“默認的基礎能力”。當向量搜索、推理加速與訓練優化被深度集成進AWS的Serverless服務與主力實例家族後,企業採用AI的門檻被顯著壓低——既包括技術複雜度,也包括單位算力成本。對於關注AI基礎設施投資的觀察者而言,這種“隱形化”的集成恰恰是產業走向規模化的關鍵信號,它意味著算力不再只是少數前沿團隊的專屬工具,而開始真正滲透進更廣泛的企業IT架構中。