AI 产业的投资回报分配正在经历一轮深刻的结构性洗牌。据半导体研究机构 SemiAnalysis 最新发布的观点,过去两年由 英伟达、内存厂商和能源供应商主导的价值链格局,正被模型层利润的爆发式增长所打破,而掌握最核心算力资源的英伟达与 台积电,却尚未在定价上充分反映这一趋势。

Anthropic 成为这一转变最醒目的注脚。SemiAnalysis 数据显示,这家前沿模型公司的年化营收已从年初的 90 亿美元 激增至 440 亿美元 以上,其推理基础设施的毛利率同期从 38% 跃升至 逾 70%。驱动这一利润率飙升的核心力量,是代币经济学的双向剪刀差:一方面,智能体 AI 在企业工作流中的大规模落地,使代币所能替代的人力成本价值急剧放大;另一方面,硬件迭代与软件优化正以远超预期的速度压低代币生产成本。

SemiAnalysis 将 2025 年 12 月 视为 AI 商业化的真正拐点。彼时,智能体 AI 开始稳定运行并深入企业流程,从根本上改变了代币的经济价值。以该机构自身为例,其年化代币支出已相当于员工薪酬总额的约 30%,每名员工月均消耗代币量超过 50 亿个,是 Meta 内部人均水平的五倍以上。原本需要初级分析师数小时完成的财务建模、图表制作等工作,如今通过智能体以极低的代币成本即可完成,而同等的人力成本曾高达数百至数千美元。

与此同时,代币的生产成本正在急剧下降。在智能体任务场景下,运行 Opus 4.7 的实际混合价格约为每百万代币 0.99 美元,远低于官方标价——原因在于智能体工作负载具有极高的输入输出比和超过 90% 的缓存命中率,大量代币落入最低价格档位。硬件层面的加速同样显著:相较一年前的 H100Blackwell 系列在前沿工作负载下每秒可生成的代币数量提升约 30 倍,而最优化配置下的 GB300 NVL72 在 FP4 精度下吞吐量提升可达 32 倍,总拥有成本仅高出约 70%

面对模型厂商利润率快速扩张,市场最常见的质疑是竞争终将侵蚀定价。SemiAnalysis 对此持保留意见,理由有二。其一,前沿闭源模型在真实知识工作场景中的表现仍显著优于开源模型,定价权依然稳固。其二,算力约束意味着没有任何一家前沿实验室能够独自满足整个市场的需求。Anthropic 已开始通过将 Claude Code 锁定在每月 100 美元 以上订阅门槛、限制第三方接入等方式主动管理需求,代币供给在可预见的未来将持续偏紧。其产品线策略已兑现这一逻辑:Opus fast 定价是普通版本的四倍,即将推出的 Mythos 定价为 25 美元 / 125 美元,头部企业客户仍愿意为这些高价 SKU 买单。

然而,掌握最核心稀缺资源的英伟达与台积电,定价行为却呈现出明显的保守倾向。台积电的 N3 先进制程产能已成为整个 AI 算力扩张最紧张的瓶颈,英伟达、博通AMD 等巨头均在争夺有限的晶圆配额,N3 产能利用率预计将在 2026 年下半年突破 100%。DRAM 晶圆厂利用率也已超过 90%,内存供应整体偏紧。SemiAnalysis 认为,台积电完全有条件大幅提价,且部分客户甚至会欢迎此举——英伟达 CEO 黄仁勋 此前就曾公开表示台积电应该提高晶圆价格,因为若提价意味着竞争对手获得更少产能配额,反而有利于巩固英伟达的市场地位。

英伟达自身的定价框架仍锚定于“单位算力愿付价格随时间下降”的旧假设,但这一前提已不再成立。随着智能体工作负载爆发,算力需求正呈现复合加速态势。以即将于 2026 年下半年 发布的 Vera Rubin(VR NVL72) 为参照,SemiAnalysis 构建了一套定价分析框架。从成本端看,基于新兴云服务商内部收益率不低于 15.6% 的部署门槛,VR NVL72 每小时每 GPU 的最低租金需达约 4.92 美元;从价值端看,以 GB300 当前五年期合约租金为锚点,租金上限约为每 GPU 每小时 12.25 美元。目前 VR NVL72 系统定价使每单位算力成本降至约 0.28 美元,较 GB300 NVL72 降幅达 60%,远超历史趋势线,这意味着英伟达的服务器价格存在约 40% 的上调空间。

内存定价是另一个关键变量。VR NVL72 采用的插槽式 LPDDR5X 内存模组可与计算单元独立定价。SemiAnalysis 估算,英伟达在 2026 年一季度 支付的合同价约为每 GB 8 美元,预计至年底可能超过每 GB 13 美元。在此背景下,英伟达若在内存上实现较高毛利率,逻辑上具备合理性:一方面内存供应受限、英伟达掌握最大份额优势;另一方面,VR NVL72 在总拥有成本层面的性能领先地位使客户缺乏替代选择。

SemiAnalysis 的框架揭示出当前 AI 价值分配的核心矛盾:代币经济学的改善正迅速推高模型厂商与推理服务商的利润,但算力供给端最稀缺资源的掌控者,其定价行为与供给稀缺性之间存在明显错位。这一错位的持续,本质上是一种主动选择——英伟达正扮演类似“AI 中央银行”的角色,通过软件效率提升向下游输送价值,以维持生态系统的长期扩张动力,同时规避反垄断监管压力。台积电则延续了历史上“稳定生态、不吃尽上行红利”的定价哲学。然而,随着推理投资回报日益清晰、价值定价逻辑在市场普及,这两家公司向价值定价框架切换的压力将持续上升。一旦切换发生,AI 产业链的价值分配格局将再度重塑,算力供给端的议价权将在更大程度上向硬件层回归。