4.7 万亿美元的公司,那天只跌了 1.25%。

真正崩盘的是那些替它租卡的中间商——CoreWeave 一天蒸发约 14%,Nebius 跌掉约 17%[5]英伟达稳如泰山,可它脚下那条支撑起整个 AI 硬件链高估值的地基,在 7 月的头两天被人从两头同时撬动了一下。撬动它的不是财报,不是产能事故,而是两条各自看起来毫不相干的消息:一家公司说自己能用更少的卡干同样的活,另一家公司说自己的卡多到得往外租。

拼在一起,它们戳中的是同一样东西——一条从没被写进任何招股书、却被默认了三年的前提:算力是绝对稀缺品,供不应求,单位算力永远值钱。

那条没人明说的地基

这一周到底动摇了什么,答案藏在英伟达那份全球最高的市值里[13]——它含着一份从未被明说的假设。

黄仁勋在 GTC Taipei 2026 的主旨演讲里,把这份假设讲得比谁都透。他说每一家公司都在变成一座「Token 工厂」,数据中心不再是存储和计算的地方,而是生产智能的工厂,产出以 Token 计量[11]。他给出的数字是:到 2027 年,算力需求至少 1 万亿美元,「实际会远高于这个数」[12]。而这套叙事真正的引擎,是他反复强调的那句判断——需求是无限的,产能不是[11]

需求无限、产能有限,这八个字是所有 AI 硬件多头的定价锚。它意味着两件事:第一,谁手里有卡,谁的卡就永远租得出去、卖得掉;第二,用户每增加一个,服务商就得多买一批卡,需求和算力之间是一条向上的直线,没有拐点。

正是这条隐含假设,撑起了一整条食物链的估值。它让英伟达的芯片能维持高毛利,让台积电的先进封装排队排到明年,让 SK 海力士的 HBM 变成硬通货,也让 CoreWeave、Nebius 这些「租卡为生」的新云公司拿到了远超传统 IDC 的市销率——它们的整个商业模式,本质上是在替市场保管稀缺品。

稀缺是这条链条的血液。而这一周,有人往两根主动脉里各扎了一针。

第一针:软件把需求曲线拽弯了

7 月 1 日,The Information 报道,OpenAI 的工程师靠一次纯软件优化,把模型推理的成本削减了一半以上。最刺眼的细节是:支撑非登录 ChatGPT 访客所需的英伟达 GPU 数量,从此前业界估计的数万张,被压到了几百张[1][2]

没有新芯片,没有新数据中心,靠的是把现有服务器榨得更狠——外界推测是更聪明的批处理、缓存复用、量化,或是把简单查询分流给更便宜的模型,但 OpenAI 没有披露具体手法[1]

这一针扎在需求侧。推理是任何一家跑聊天机器人的公司真正的账单所在地——训练是一次性的资本开支,推理是每天都在烧的运营成本。如果单位推理的成本能靠软件砍半,那么「需求和算力之间是一条直线」这个假设,第一次出现了裂缝:用户还在涨,可每个用户要吃掉的卡在变少。

市场当天就给出了反应。费城半导体指数下跌超过 5%,Intel 跌超 7%,Micron 跌超 8%,ASML 跌超 6%[3]。逻辑很直白:如果 AI 公司能靠软件优化在每次查询上少用 GPU,那些最激进的硬件需求预测就得打折——而正是那些预测,撑着这些股票的估值[3]

这一针还没算致命。毕竟单点效率提升在半导体历史上不新鲜,摩尔定律本身就是一部单位成本长期下滑史,需求总能填上省下来的空间。真正让这一周变得不同的,是第二天扎下的另一针——它扎在了对侧。

第二针:连 Meta 都有卡要往外租

7 月 2 日,一则彭博的报道传开:Meta 正筹划一项云业务,要对外提供两类服务——托管模型的 API 访问,以及最原始的算力出租——把自己数据中心里闲置的 AI 算力,卖给外面的客户[4]

对 Meta 自己,这是笔好买卖。那些本被当作无底洞成本的数据中心,一旦能把闲置产能租给付费客户,账面上就从纯支出变成了能生近期高毛利收入的资产。市场立刻投票:Meta 当天大涨近 9%,市值一夜增加约 1270 亿美元[6][5]。TechCrunch 把这套逻辑类比成 SpaceX——把烧钱的重资产利用率做上去,变成现金流[14]

但对整条食物链,这一针扎得比前一天更深。它扎在供给侧,直击那句「产能永远追不上需求」的信条。三年来市场被反复告知,算力紧到一张卡都不能空转,谁囤到卡谁就握住了硬通货。可现在,全世界最重的 AI 买家之一站出来说:我手里的算力多到得往外卖。

「一张卡都不能空」和「我有闲卡要出租」,这两句话没法同时为真。

反应因此比前一天更凶,而且方向精准。英伟达当天几乎没动,只跌约 1.25%[5]——芯片的卖方地位没被撼动。真正被打穿的是那些把商业模式押在「算力绝对稀缺」上的环节:CoreWeave 跌约 14%,Nebius 跌约 17%,Micron 跌超 10%,闪迪、Intel、AMD 齐刷刷跌在 7% 到 11% 的区间[5]

市场惩罚谁、放过谁,把它想说的话说得清清楚楚。它没在惩罚造卡的人,它在惩罚以「替市场保管稀缺品」为生的人。一份来自 Reuters 的报道,把这一天的性质总结成一句话:Meta 的举动,把多年来被默认的「AI 算力稀缺」,翻转成了一记供给警报[5]

为什么最先倒下的偏偏是 CoreWeave、Nebius 这些名字?因为它们的商业模式,地基就浇筑在稀缺之上。这类「新云」靠巨额债务把 GPU 买进来,再拿与大客户签下的长期租约当作偿债的底气,本质是一场「借钱囤稀缺品、赚租金差价」的杠杆生意。这套模型只在一个前提下成立:卡永远租得出去、租金永远坚挺。可一旦连手握海量算力的巨头都开始对外供货,租金的天花板被摁低、二手算力涌入市场,杠杆的两端就同时收紧——债务是刚性的,租金却成了变量。它们当天的跌幅是英伟达的十倍有余,不是因为业务一夜蒸发,而是因为它们的估值里,稀缺溢价掺得最纯、稀释起来也最快。

亚太连锁:一句话打穿一条信念

这记警报没有停在美东收盘。

7 月 2 日的亚太时段,隔夜美国半导体的暴跌顺着 HBM 和代工这条最敏感的神经传导过来。韩国 KOSPI 一度触发熔断机制,SK 海力士与三星电子领跌——两家正是全球 HBM 高带宽内存的命脉供应商[7][8]。存储是这轮 AI 周期里稀缺假设最陡峭的地方:HBM 供不应求、价格连年上台阶,几乎成了「算力稀缺」这套叙事最实体、最可触摸的证据。

正因为它最实体,它挨的打也最实。当「算力绝对稀缺」这个信念本身松动,最先重新定价的,恰恰是那些把稀缺兑现成了真金白银订单的公司——它们的估值里含稀缺溢价含得最满。一句关于「卖算力」的传闻,就足以把整个亚太芯片板块推下悬崖。

传闻的杀伤力如此之大,本身就是证据:市场心里那条地基,原来比谁都以为的要脆。一条真正稳固的共识,不会被一家公司的一项业务计划一击就穿。会被一击就穿的,是那些从没被拿出来检验、只是被长期默认的东西。「算力永远稀缺」正是这样一条——它太顺理成章,以至于三年里没人真去问一句:如果它不成立呢?

这一周,市场被迫问了。

反过来想:稀缺没消失,是「永远」两个字被打了问号

把这一周读成「AI 泡沫破了」「算力过剩了」,会读错。华尔街的主流声音,恰恰在拦这个过度解读,而且拦得有道理。

UBS、摩根士丹利、伯恩斯坦在事发后都维持了对 Meta 的正面评级,把外租算力看作一道营收缓冲,而非行业见顶的信号[10]。他们的核心论点是:Meta 的局部闲置,证明不了全球 AI 建设已经转入过剩[9]。一个耐人寻味的画面是——Meta 一边仍在往基础设施里砸数千亿,一边却有外部企业主动溢价来抢购算力[9]。这两件事同时发生,说明整体市场的算力依旧偏紧。

于是这些分析师给出了一个更精确的读法:Meta 同时在对外找算力、又计划卖掉自己的一部分,与其说是「多到用不完」,不如说是一次跨越「不同代际、不同用途、不同时间窗口」的再分配[9]。新一代芯片到货、旧一代腾出手;训练高峰过去、推理集群闲下来;某个时区的夜间产能,正好卖给另一个时区的白天需求。这是把利用率做上去的务实之举,不是供给崩塌。

效率那一针,也有一个更古老的反驳等在前头。经济史上把它叫作杰文斯悖论:1865 年,人们发现蒸汽机烧煤的效率越高,全英国的耗煤量非但没降、反而猛增——单位成本一低,用得起的人和场景就爆发式增多,省下的每一分都被更庞大的需求量重新吞掉。推理成本被砍半,未必让英伟达少卖卡;它更可能让原本用不起大模型的应用一拥而上,把省下来的算力连本带利地重新吃满。带宽越便宜、视频流量越汹涌,是同一条定律的现代注脚。软件把单位消耗压下去,是不是就等于总需求萎缩——产业史给出的答案,恰恰相反。

所以两记重击各自都有解药:效率提升可能被更旺的需求反噬,闲置出租不过是利用率的再分配。这个反方站得住。它提醒人们:稀缺没有消失。真正被这一周挤压掉的,不是「稀缺」这个事实,而是「永远」这两个字——是那条把稀缺当成物理常量、假设它会线性延续到 2027 乃至更远的隐含前提。橘生淮南则为橘,生于淮北则为枳;同样一块 GPU,在需求线性无限的假设里是永不贬值的硬通货,在需求可被软件压弯、供给可被闲置盘活的世界里,就成了一件需要精细调度利用率的普通重资产。土壤换了,果子就换了。

被重新定价的,是一个形容词

所以这一周半导体股的暴跌,真正的坐标不在「情绪回调」那一栏。

情绪回调,指的是价格围着一个大家都认同的价值上下摆动。而这一周发生的是更深一步的事:那个「大家都认同的价值」本身,第一次被拿出来称重。称量它的不是某一份看空报告,而是两条来自产业内部、彼此独立的事实——软件能把需求曲线拽弯,巨头手里有闲置算力要出租。一条从需求侧、一条从供给侧,共同指向同一个此前无人质疑的形容词:绝对。

市场给英伟达和整条硬件链的溢价里,「稀缺」从来是「绝对稀缺」。这一周它被悄悄改写成了「相对稀缺」——依然稀缺,但会随代际更替、随效率提升、随利用率调度而波动,不再是那条只涨不跌的直线。一个形容词的降级,就足以让 4.7 万亿美元之下的整条链条重新排队定价:造卡的人地位最稳,租卡的人最先出局,把稀缺兑成订单的存储厂夹在中间。

黄仁勋的「Token 工厂」没有关门,需求无限的故事也远未讲完。改变的只是听众——他们第一次意识到,自己过去为之付溢价的,不只是那句「需求无限」,还有一句从没被明说、如今被两记重击敲出裂纹的潜台词:产能,永远追不上。

这一周之后,「永远」这两个字,得重新标价了。