英伟达与AWS深化合作，推出G7实例与向量搜索加速方案

英伟达与AWS合作，通过GPU和基础设施优化，降低AI部署复杂性。

英伟达与亚马逊云科技（AWS）的最新合作，正在为企业铺平一条从AI实验走向大规模生产部署的更高效路径。双方近日公布了一系列覆盖计算、检索与训练层面的基础设施升级，旨在解决企业在构建规模化AI系统时面临的低延迟推理、快速向量搜索、GPU性价比以及随业务增长而倍增的运维复杂性等核心挑战。

在计算层面，AWS正式推出了全新的Amazon EC2 G7实例，该实例搭载了英伟达RTX PRO 4500 Blackwell服务器版GPU。这款多工作负载GPU专为生产环境设计，旨在提供强大性能的同时，避免客户自建GPU平台带来的运维负担。与上一代G6实例相比，G7在AI推理性能上实现了最高4.6倍的提升，图形性能提升最高2.1倍，并借助英伟达cuDF库显著加速了Amazon EMR上的数据分析工作负载。

G7实例提供了极高的配置灵活性，支持从单GPU到八GPU的多种规格，并即将推出裸金属版本。其最高配置可提供256GB的总GPU显存、700 Gbps的EFA网络带宽以及高达7.6TB的本地NVMe SSD存储。这种弹性配置允许企业根据实际工作负载精确匹配基础设施，避免过度配置。无论是AI团队的低延迟推理需求，媒体娱乐团队的高分辨率视频与渲染任务，还是数据团队的分析管道与向量数据库负载，G7实例都能通过统一的平台满足。该实例现已可通过AWS深度学习AMI、Amazon EMR、Amazon EKS等服务获取，并即将登陆Amazon SageMaker AI。

在数据检索这一关键环节，英伟达与AWS的合作同样深入。新一代的Amazon OpenSearch Serverless服务，已将基于英伟达cuVS库的GPU加速向量索引设为所有向量集合的默认计算选项。这一变化意义深远，它将GPU驱动的向量搜索从一项需要专门优化的项目，转变为AWS的一项标准能力。对于构建检索增强生成（RAG）、语义搜索和推荐系统的团队而言，其直接影响是显著的：向量索引速度最高可提升10倍，而成本仅为纯CPU方案的四分之一。这使得在不到一小时内构建十亿级规模的向量数据库变得切实可行，极大地缩短了从原始数据到生产就绪的AI检索基础设施的路径。

此外，双方在AI训练基础设施的深度合作也取得了里程碑式成果。AWS基于英伟达GB300的平台已成功获得英伟达模范云（NVIDIA Exemplar Cloud）状态认证。这意味着AWS的GB300实例在训练工作负载上，满足了英伟达针对其参考架构所设定的严格性能基准。这一成就源于双方团队的深度联合工程努力，使得开发者和AI决策者能够确信，他们正在使用一致且高性能的云基础设施进行大规模模型训练，从而更有效地评估云服务商、改善总体拥有成本，并加速AI项目从规划到生产的转化。

总体来看，英伟达与AWS的此番合作，从底层的GPU计算实例、中间的数据检索加速，到顶层的训练性能认证，系统性地加固了AWS上的AI基础设施栈。其贯穿始终的逻辑是，在不增加运营团队负担的前提下，提供能够规模化运行的生产级AI能力。这不仅为各类企业提供了更直接的AI部署工具，也进一步巩固了英伟达在云端AI算力领域的核心地位，同时展现了AWS在整合前沿AI硬件与软件生态方面的持续投入。

英伟达与AWS深化合作，推出G7实例与向量搜索加速方案

延伸阅读

相关深度报道

相关每日新闻