英偉達與AWS深化合作：GPU加速向量搜索與推理落地

英偉達與AWS合作，通過Amazon OpenSearch和EC2優化AI推理與基礎設施

英偉達與亞馬遜雲科技（AWS）正在將AI基礎設施的合作推向更務實的生產層面。雙方最新的聯合發佈覆蓋了從推理計算、向量檢索到大規模訓練的全鏈條，旨在為企業提供更低延遲、更高性價比且運維更簡單的AI部署路徑。

在計算實例層，AWS推出了全新的Amazon EC2 G7實例，搭載英偉達RTX PRO 4500 Blackwell服務器版GPU。這款GPU並非僅面向單一負載，而是針對AI推理、圖形渲染、空間計算、視頻處理以及GPU加速數據分析等多種工作負載進行了統一設計。與上一代G6實例相比，G7在AI推理性能上實現了最高4.6倍的提升，圖形性能提升最高2.1倍，同時在基於Apache Spark的數據分析任務中，藉助英偉達cuDF庫也獲得了顯著加速。

G7實例的硬件配置相當靈活：支持最多8顆GPU、總計256GB GPU顯存、700 Gbps的EFA網絡帶寬以及最高7.6TB的本地NVMe SSD存儲。用戶可按需選擇1卡、2卡、4卡或8卡的配置，甚至裸金屬形態也即將推出。這種彈性意味著企業不必為峰值負載過度配置資源，而是可以根據實際工作負載精確匹配算力，從而控制成本。G7實例已可通過AWS Deep Learning AMI、Amazon EMR、Amazon EKS等服務獲取，並即將登陸Amazon SageMaker AI。

在數據檢索層，雙方的合作同樣深入。新一代Amazon OpenSearch Serverless將英偉達cuVS庫驅動的GPU加速向量索引設為所有向量集合的默認計算選項。對於構建檢索增強生成（RAG）、語義搜索、推薦系統以及智能體AI應用的團隊而言，這一變化意義重大——它把原本需要專門優化項目的GPU向量搜索，變成了AWS的一項標準能力。實際效果是：向量索引速度最高提升10倍，而成本僅為純CPU方案的四分之一。這使得在一小時內構建十億級向量數據庫成為可能，大幅縮短了從原始數據到生產就緒AI檢索系統的路徑。

在訓練端，AWS還獲得了英偉達針對GB300訓練負載頒發的Exemplar Cloud認證。這意味著AWS在運行大規模AI訓練任務時，已達到英偉達參考架構所設定的嚴格性能基準。這一認證源於雙方團隊的深度聯合工程努力，讓開發者和AI決策者在評估雲服務商時，能更確信其基礎設施的一致性與高性能，從而更高效地將AI項目從規劃推向生產。

從產業視角看，這三項進展並非孤立的技術升級，而是共同指向一個趨勢：雲廠商正將GPU加速能力從“可選的高階功能”轉變為“默認的基礎能力”。當向量搜索、推理加速與訓練優化被深度集成進AWS的Serverless服務與主力實例家族後，企業採用AI的門檻被顯著壓低——既包括技術複雜度，也包括單位算力成本。對於關注AI基礎設施投資的觀察者而言，這種“隱形化”的集成恰恰是產業走向規模化的關鍵信號，它意味著算力不再只是少數前沿團隊的專屬工具，而開始真正滲透進更廣泛的企業IT架構中。

英偉達與AWS深化合作：GPU加速向量搜索與推理落地

延伸閱讀

相關深度報道

相關每日新聞