全球智算基础设施的估值逻辑正在发生根本性转变。过去三年,资本市场对算力租赁和智算中心的判断高度依赖GPU持有量和芯片供应稀缺性,但这一粗放模式正面临边际报酬递减的压力。随着硬件供应链多元化、存量资产折旧压力加大,以及下游应用端对推理成本的极致敏感,行业被迫从“以资产负债表扩张为导向的硬件军备竞赛”转向“以资本回报率和每瓦Token生成效率为核心的精细化运营”。
英伟达CEO黄仁勋在GTC 2026大会上提出的Token工厂概念,正从理论走向实践。软通动力旗下“北京壹号词元工厂”已完成点亮,并与头部大模型公司签署智算服务协议,率先落地Token分润模式。这一模式不再简单按租赁时长或硬件规格收费,而是根据实际产出的Token数量进行分成,将算力提供方与模型使用方的利益更紧密绑定,也倒逼算力服务商优化能效与吞吐效率。
与此同时,定价机制也在发生变革。DeepSeek V4正式版计划于7月中旬上线,首次引入峰谷定价机制,高峰时段API调用价格将翻倍。这一动态调峰策略意在平滑算力负载、提升整体利用率,也反映出大模型服务商对成本结构的精细化管理需求。对下游应用开发者而言,这意味着需要更主动地规划推理任务的时序,以控制成本。
行业规模方面,算力租赁市场预计在2026年突破2600亿元。竞争焦点正从早期的“认证为王”——即谁能拿到英伟达等厂商的芯片授权——转向“货源为王”,即谁能稳定获取并高效运营大规模算力资源。这一转变背后,是算力供给端的逐步充裕与需求端对性价比的持续追求。
对AI产业链而言,这场变革牵动多层环节。上游芯片厂商面临客户采购逻辑从“囤货”转向“按需”的挑战;中游算力服务商必须证明自身的运营效率而非仅靠硬件库存;下游模型厂商和应用开发者则获得更灵活的算力成本选项。整个产业的估值叙事,正从稀缺性溢价转向效率溢价。