英伟达与亚马逊云科技(AWS)的最新合作,正在为企业铺平一条从AI实验走向大规模生产部署的更高效路径。双方近日公布了一系列覆盖计算、检索与训练层面的基础设施升级,旨在解决企业在构建规模化AI系统时面临的低延迟推理、快速向量搜索、GPU性价比以及随业务增长而倍增的运维复杂性等核心挑战。
在计算层面,AWS正式推出了全新的Amazon EC2 G7实例,该实例搭载了英伟达RTX PRO 4500 Blackwell服务器版GPU。这款多工作负载GPU专为生产环境设计,旨在提供强大性能的同时,避免客户自建GPU平台带来的运维负担。与上一代G6实例相比,G7在AI推理性能上实现了最高4.6倍的提升,图形性能提升最高2.1倍,并借助英伟达cuDF库显著加速了Amazon EMR上的数据分析工作负载。
G7实例提供了极高的配置灵活性,支持从单GPU到八GPU的多种规格,并即将推出裸金属版本。其最高配置可提供256GB的总GPU显存、700 Gbps的EFA网络带宽以及高达7.6TB的本地NVMe SSD存储。这种弹性配置允许企业根据实际工作负载精确匹配基础设施,避免过度配置。无论是AI团队的低延迟推理需求,媒体娱乐团队的高分辨率视频与渲染任务,还是数据团队的分析管道与向量数据库负载,G7实例都能通过统一的平台满足。该实例现已可通过AWS深度学习AMI、Amazon EMR、Amazon EKS等服务获取,并即将登陆Amazon SageMaker AI。
在数据检索这一关键环节,英伟达与AWS的合作同样深入。新一代的Amazon OpenSearch Serverless服务,已将基于英伟达cuVS库的GPU加速向量索引设为所有向量集合的默认计算选项。这一变化意义深远,它将GPU驱动的向量搜索从一项需要专门优化的项目,转变为AWS的一项标准能力。对于构建检索增强生成(RAG)、语义搜索和推荐系统的团队而言,其直接影响是显著的:向量索引速度最高可提升10倍,而成本仅为纯CPU方案的四分之一。这使得在不到一小时内构建十亿级规模的向量数据库变得切实可行,极大地缩短了从原始数据到生产就绪的AI检索基础设施的路径。
此外,双方在AI训练基础设施的深度合作也取得了里程碑式成果。AWS基于英伟达GB300的平台已成功获得英伟达模范云(NVIDIA Exemplar Cloud)状态认证。这意味着AWS的GB300实例在训练工作负载上,满足了英伟达针对其参考架构所设定的严格性能基准。这一成就源于双方团队的深度联合工程努力,使得开发者和AI决策者能够确信,他们正在使用一致且高性能的云基础设施进行大规模模型训练,从而更有效地评估云服务商、改善总体拥有成本,并加速AI项目从规划到生产的转化。
总体来看,英伟达与AWS的此番合作,从底层的GPU计算实例、中间的数据检索加速,到顶层的训练性能认证,系统性地加固了AWS上的AI基础设施栈。其贯穿始终的逻辑是,在不增加运营团队负担的前提下,提供能够规模化运行的生产级AI能力。这不仅为各类企业提供了更直接的AI部署工具,也进一步巩固了英伟达在云端AI算力领域的核心地位,同时展现了AWS在整合前沿AI硬件与软件生态方面的持续投入。