英偉達與AWS深化合作，推出G7實例與向量搜索加速方案

英偉達與AWS合作，通過GPU和基礎設施優化，降低AI部署複雜性。

英偉達與亞馬遜雲科技（AWS）的最新合作，正在為企業鋪平一條從AI實驗走向大規模生產部署的更高效路徑。雙方近日公佈了一系列覆蓋計算、檢索與訓練層面的基礎設施升級，旨在解決企業在構建規模化AI系統時面臨的低延遲推理、快速向量搜索、GPU性價比以及隨業務增長而倍增的運維複雜性等核心挑戰。

在計算層面，AWS正式推出了全新的Amazon EC2 G7實例，該實例搭載了英偉達RTX PRO 4500 Blackwell服務器版GPU。這款多工作負載GPU專為生產環境設計，旨在提供強大性能的同時，避免客戶自建GPU平臺帶來的運維負擔。與上一代G6實例相比，G7在AI推理性能上實現了最高4.6倍的提升，圖形性能提升最高2.1倍，並藉助英偉達cuDF庫顯著加速了Amazon EMR上的數據分析工作負載。

G7實例提供了極高的配置靈活性，支持從單GPU到八GPU的多種規格，並即將推出裸金屬版本。其最高配置可提供256GB的總GPU顯存、700 Gbps的EFA網絡帶寬以及高達7.6TB的本地NVMe SSD存儲。這種彈性配置允許企業根據實際工作負載精確匹配基礎設施，避免過度配置。無論是AI團隊的低延遲推理需求，媒體娛樂團隊的高分辨率視頻與渲染任務，還是數據團隊的分析管道與向量數據庫負載，G7實例都能通過統一的平臺滿足。該實例現已可通過AWS深度學習AMI、Amazon EMR、Amazon EKS等服務獲取，並即將登陸Amazon SageMaker AI。

在數據檢索這一關鍵環節，英偉達與AWS的合作同樣深入。新一代的Amazon OpenSearch Serverless服務，已將基於英偉達cuVS庫的GPU加速向量索引設為所有向量集合的默認計算選項。這一變化意義深遠，它將GPU驅動的向量搜索從一項需要專門優化的項目，轉變為AWS的一項標準能力。對於構建檢索增強生成（RAG）、語義搜索和推薦系統的團隊而言，其直接影響是顯著的：向量索引速度最高可提升10倍，而成本僅為純CPU方案的四分之一。這使得在不到一小時內構建十億級規模的向量數據庫變得切實可行，極大地縮短了從原始數據到生產就緒的AI檢索基礎設施的路徑。

此外，雙方在AI訓練基礎設施的深度合作也取得了里程碑式成果。AWS基於英偉達GB300的平臺已成功獲得英偉達模範雲（NVIDIA Exemplar Cloud）狀態認證。這意味著AWS的GB300實例在訓練工作負載上，滿足了英偉達針對其參考架構所設定的嚴格性能基準。這一成就源於雙方團隊的深度聯合工程努力，使得開發者和AI決策者能夠確信，他們正在使用一致且高性能的雲基礎設施進行大規模模型訓練，從而更有效地評估雲服務商、改善總體擁有成本，並加速AI項目從規劃到生產的轉化。

總體來看，英偉達與AWS的此番合作，從底層的GPU計算實例、中間的數據檢索加速，到頂層的訓練性能認證，系統性地加固了AWS上的AI基礎設施棧。其貫穿始終的邏輯是，在不增加運營團隊負擔的前提下，提供能夠規模化運行的生產級AI能力。這不僅為各類企業提供了更直接的AI部署工具，也進一步鞏固了英偉達在雲端AI算力領域的核心地位，同時展現了AWS在整合前沿AI硬件與軟件生態方面的持續投入。

英偉達與AWS深化合作，推出G7實例與向量搜索加速方案

延伸閱讀

相關深度報道

相關每日新聞