英伟达与亚马逊云科技(AWS)正在将AI基础设施的合作推向更务实的生产层面。双方最新的联合发布覆盖了从推理计算、向量检索到大规模训练的全链条,旨在为企业提供更低延迟、更高性价比且运维更简单的AI部署路径。

在计算实例层,AWS推出了全新的Amazon EC2 G7实例,搭载英伟达RTX PRO 4500 Blackwell服务器版GPU。这款GPU并非仅面向单一负载,而是针对AI推理、图形渲染、空间计算、视频处理以及GPU加速数据分析等多种工作负载进行了统一设计。与上一代G6实例相比,G7在AI推理性能上实现了最高4.6倍的提升,图形性能提升最高2.1倍,同时在基于Apache Spark的数据分析任务中,借助英伟达cuDF库也获得了显著加速。

G7实例的硬件配置相当灵活:支持最多8颗GPU、总计256GB GPU显存700 Gbps的EFA网络带宽以及最高7.6TB的本地NVMe SSD存储。用户可按需选择1卡、2卡、4卡或8卡的配置,甚至裸金属形态也即将推出。这种弹性意味着企业不必为峰值负载过度配置资源,而是可以根据实际工作负载精确匹配算力,从而控制成本。G7实例已可通过AWS Deep Learning AMI、Amazon EMR、Amazon EKS等服务获取,并即将登陆Amazon SageMaker AI

在数据检索层,双方的合作同样深入。新一代Amazon OpenSearch Serverless将英伟达cuVS库驱动的GPU加速向量索引设为所有向量集合的默认计算选项。对于构建检索增强生成(RAG)、语义搜索、推荐系统以及智能体AI应用的团队而言,这一变化意义重大——它把原本需要专门优化项目的GPU向量搜索,变成了AWS的一项标准能力。实际效果是:向量索引速度最高提升10倍,而成本仅为纯CPU方案的四分之一。这使得在一小时内构建十亿级向量数据库成为可能,大幅缩短了从原始数据到生产就绪AI检索系统的路径。

在训练端,AWS还获得了英伟达针对GB300训练负载颁发的Exemplar Cloud认证。这意味着AWS在运行大规模AI训练任务时,已达到英伟达参考架构所设定的严格性能基准。这一认证源于双方团队的深度联合工程努力,让开发者和AI决策者在评估云服务商时,能更确信其基础设施的一致性与高性能,从而更高效地将AI项目从规划推向生产。

从产业视角看,这三项进展并非孤立的技术升级,而是共同指向一个趋势:云厂商正将GPU加速能力从“可选的高阶功能”转变为“默认的基础能力”。当向量搜索、推理加速与训练优化被深度集成进AWS的Serverless服务与主力实例家族后,企业采用AI的门槛被显著压低——既包括技术复杂度,也包括单位算力成本。对于关注AI基础设施投资的观察者而言,这种“隐形化”的集成恰恰是产业走向规模化的关键信号,它意味着算力不再只是少数前沿团队的专属工具,而开始真正渗透进更广泛的企业IT架构中。