英伟达与AWS深化合作：GPU加速向量搜索与推理落地

英伟达与AWS合作，通过Amazon OpenSearch和EC2优化AI推理与基础设施

英伟达与亚马逊云科技（AWS）正在将AI基础设施的合作推向更务实的生产层面。双方最新的联合发布覆盖了从推理计算、向量检索到大规模训练的全链条，旨在为企业提供更低延迟、更高性价比且运维更简单的AI部署路径。

在计算实例层，AWS推出了全新的Amazon EC2 G7实例，搭载英伟达RTX PRO 4500 Blackwell服务器版GPU。这款GPU并非仅面向单一负载，而是针对AI推理、图形渲染、空间计算、视频处理以及GPU加速数据分析等多种工作负载进行了统一设计。与上一代G6实例相比，G7在AI推理性能上实现了最高4.6倍的提升，图形性能提升最高2.1倍，同时在基于Apache Spark的数据分析任务中，借助英伟达cuDF库也获得了显著加速。

G7实例的硬件配置相当灵活：支持最多8颗GPU、总计256GB GPU显存、700 Gbps的EFA网络带宽以及最高7.6TB的本地NVMe SSD存储。用户可按需选择1卡、2卡、4卡或8卡的配置，甚至裸金属形态也即将推出。这种弹性意味着企业不必为峰值负载过度配置资源，而是可以根据实际工作负载精确匹配算力，从而控制成本。G7实例已可通过AWS Deep Learning AMI、Amazon EMR、Amazon EKS等服务获取，并即将登陆Amazon SageMaker AI。

在数据检索层，双方的合作同样深入。新一代Amazon OpenSearch Serverless将英伟达cuVS库驱动的GPU加速向量索引设为所有向量集合的默认计算选项。对于构建检索增强生成（RAG）、语义搜索、推荐系统以及智能体AI应用的团队而言，这一变化意义重大——它把原本需要专门优化项目的GPU向量搜索，变成了AWS的一项标准能力。实际效果是：向量索引速度最高提升10倍，而成本仅为纯CPU方案的四分之一。这使得在一小时内构建十亿级向量数据库成为可能，大幅缩短了从原始数据到生产就绪AI检索系统的路径。

在训练端，AWS还获得了英伟达针对GB300训练负载颁发的Exemplar Cloud认证。这意味着AWS在运行大规模AI训练任务时，已达到英伟达参考架构所设定的严格性能基准。这一认证源于双方团队的深度联合工程努力，让开发者和AI决策者在评估云服务商时，能更确信其基础设施的一致性与高性能，从而更高效地将AI项目从规划推向生产。

从产业视角看，这三项进展并非孤立的技术升级，而是共同指向一个趋势：云厂商正将GPU加速能力从“可选的高阶功能”转变为“默认的基础能力”。当向量搜索、推理加速与训练优化被深度集成进AWS的Serverless服务与主力实例家族后，企业采用AI的门槛被显著压低——既包括技术复杂度，也包括单位算力成本。对于关注AI基础设施投资的观察者而言，这种“隐形化”的集成恰恰是产业走向规模化的关键信号，它意味着算力不再只是少数前沿团队的专属工具，而开始真正渗透进更广泛的企业IT架构中。

英伟达与AWS深化合作：GPU加速向量搜索与推理落地

延伸阅读

相关深度报道

相关每日新闻