AI基础设施成本正经历一轮剧烈震荡,英伟达GPU服务器的定价不可预测性已成为云服务商和AI开发者面临的核心挑战。据The Information报道,受内存芯片及其他关键组件供应紧张驱动,服务器机架所需组件的成本单周波动幅度最高可达40%,涉及台积电生产的输入晶圆、协同封装、网络、散热等环节,其中内存的影响最为显著。这一成本压力已沿供应链向下传导,迫使多家云服务商相继上调面向AI开发者的租用价格。
GPU云服务商Nebius于6月1日将按需算力租用价格上调约30%,亚马逊AWS随后宣布旗下EC2容量块价格自7月1日起上涨约20%。一位向云服务商销售英伟达服务器的人士透露,GPU服务器机架价格“波动得非常厉害”,一切可能在两三周内彻底改变,采购方只能在极短的窗口内锁定价格,无法进行更长周期的成本规划。一位GPU云服务商高管表示,其采购的服务器机架近期每周涨价约2%至3%。另一家竞争对手的高管则指出,英伟达Grace Blackwell 300机架中的NVMe存储驱动器是价格波动的主要来源,数月前波动“非常剧烈”,目前机架成本较其认定的基准价高出10%至15%,GB300机架的涨价势头目前似乎正趋于稳定,月涨幅约为1%。
价格波动的影响因绝对金额庞大而被急剧放大。仅一个装满Grace Blackwell 300芯片系统的机架,每套芯片系统售价即达7万美元,72套满配机架总价约为500万美元,部分客户一次性采购数量高达数千套。据一位正在采购Vera Rubin机架的客户高管透露,该型号机架预计售价约为700万美元。
定价权在供应链各环节高度集中。上述服务器销售人士表示,英伟达“几乎可以要求任何价格”。英伟达发言人回应称,价格取决于服务器机架组件成本,公司与服务器提供商协作定价,不同提供商之间价格可能存在差异。数据显示,英伟达过去数年间毛利率已提升15至20个百分点,印证了其强势的市场定价能力。与此同时,以美光为代表的内存芯片制造商正对英伟达及其他客户施加类似的定价压力,推动从苹果Mac到英伟达GPU的全线产品价格上涨。
价格数据提供商Silicon Data首席执行官Carmen Li表示,一旦芯片离开英伟达,云服务商向外出租的价格便开始呈现大宗商品市场的供需逻辑。其数据显示,Blackwell 200芯片的租用价格今年以来已上涨约20%;较旧款英伟达芯片的租用价格在过去一年累计涨幅超过20%后,近30天内基本趋于平稳。Carmen Li指出,云服务商向客户收取的GPU租用价格,已呈现出与石油等大宗商品市场相似的供需驱动特征。
在这轮价格上涨中,按需租用算力的中小型客户处于最脆弱的位置。云服务商正在试探当前GPU供应紧张环境下的定价上限,或将服务器资源向大客户倾斜,导致可供中小客户使用的算力资源减少。不过,价格走势并非单向。一位AI模型开发商高管表示,在此前一至两个月价格翻倍之后,近两周价格实际上有所回落。这一分歧折射出GPU云服务市场仍处于相对早期阶段,加之GPU云服务商数量激增,市场格局尚未固化。
定价透明度的缺失进一步加剧了买方的不确定性。GPU云服务商通常不公开披露实际价格,这使得定价权实际上掌握在服务商手中,而非客户。一位GPU云服务商的投资方对此表达了隐忧,认为存在一个临界点,一旦经济账算不过来,客户的业务就难以为继。这一表态揭示出,算力成本的持续攀升,最终将对AI应用层的商业可行性构成实质性约束。