英偉達與亞馬遜雲科技(AWS)的最新合作,正在為企業鋪平一條從AI實驗走向大規模生產部署的更高效路徑。雙方近日公佈了一系列覆蓋計算、檢索與訓練層面的基礎設施升級,旨在解決企業在構建規模化AI系統時面臨的低延遲推理、快速向量搜索、GPU性價比以及隨業務增長而倍增的運維複雜性等核心挑戰。
在計算層面,AWS正式推出了全新的Amazon EC2 G7實例,該實例搭載了英偉達RTX PRO 4500 Blackwell服務器版GPU。這款多工作負載GPU專為生產環境設計,旨在提供強大性能的同時,避免客戶自建GPU平臺帶來的運維負擔。與上一代G6實例相比,G7在AI推理性能上實現了最高4.6倍的提升,圖形性能提升最高2.1倍,並藉助英偉達cuDF庫顯著加速了Amazon EMR上的數據分析工作負載。
G7實例提供了極高的配置靈活性,支持從單GPU到八GPU的多種規格,並即將推出裸金屬版本。其最高配置可提供256GB的總GPU顯存、700 Gbps的EFA網絡帶寬以及高達7.6TB的本地NVMe SSD存儲。這種彈性配置允許企業根據實際工作負載精確匹配基礎設施,避免過度配置。無論是AI團隊的低延遲推理需求,媒體娛樂團隊的高分辨率視頻與渲染任務,還是數據團隊的分析管道與向量數據庫負載,G7實例都能通過統一的平臺滿足。該實例現已可通過AWS深度學習AMI、Amazon EMR、Amazon EKS等服務獲取,並即將登陸Amazon SageMaker AI。
在數據檢索這一關鍵環節,英偉達與AWS的合作同樣深入。新一代的Amazon OpenSearch Serverless服務,已將基於英偉達cuVS庫的GPU加速向量索引設為所有向量集合的默認計算選項。這一變化意義深遠,它將GPU驅動的向量搜索從一項需要專門優化的項目,轉變為AWS的一項標準能力。對於構建檢索增強生成(RAG)、語義搜索和推薦系統的團隊而言,其直接影響是顯著的:向量索引速度最高可提升10倍,而成本僅為純CPU方案的四分之一。這使得在不到一小時內構建十億級規模的向量數據庫變得切實可行,極大地縮短了從原始數據到生產就緒的AI檢索基礎設施的路徑。
此外,雙方在AI訓練基礎設施的深度合作也取得了里程碑式成果。AWS基於英偉達GB300的平臺已成功獲得英偉達模範雲(NVIDIA Exemplar Cloud)狀態認證。這意味著AWS的GB300實例在訓練工作負載上,滿足了英偉達針對其參考架構所設定的嚴格性能基準。這一成就源於雙方團隊的深度聯合工程努力,使得開發者和AI決策者能夠確信,他們正在使用一致且高性能的雲基礎設施進行大規模模型訓練,從而更有效地評估雲服務商、改善總體擁有成本,並加速AI項目從規劃到生產的轉化。
總體來看,英偉達與AWS的此番合作,從底層的GPU計算實例、中間的數據檢索加速,到頂層的訓練性能認證,系統性地加固了AWS上的AI基礎設施棧。其貫穿始終的邏輯是,在不增加運營團隊負擔的前提下,提供能夠規模化運行的生產級AI能力。這不僅為各類企業提供了更直接的AI部署工具,也進一步鞏固了英偉達在雲端AI算力領域的核心地位,同時展現了AWS在整合前沿AI硬件與軟件生態方面的持續投入。