4.7 萬億美元的公司,那天只跌了 1.25%。

真正崩盤的是那些替它租卡的中間商——CoreWeave 一天蒸發約 14%,Nebius 跌掉約 17%[5]英偉達穩如泰山,可它腳下那條支撐起整個 AI 硬件鏈高估值的地基,在 7 月的頭兩天被人從兩頭同時撬動了一下。撬動它的不是財報,不是產能事故,而是兩條各自看起來毫不相干的消息:一家公司說自己能用更少的卡幹同樣的活,另一家公司說自己的卡多到得往外租。

拼在一起,它們戳中的是同一樣東西——一條從沒被寫進任何招股書、卻被默認了三年的前提:算力是絕對稀缺品,供不應求,單位算力永遠值錢。

那條沒人明說的地基

這一週到底動搖了什麼,答案藏在英偉達那份全球最高的市值裡[13]——它含著一份從未被明說的假設。

黃仁勳在 GTC Taipei 2026 的主旨演講裡,把這份假設講得比誰都透。他說每一家公司都在變成一座「Token 工廠」,數據中心不再是存儲和計算的地方,而是生產智能的工廠,產出以 Token 計量[11]。他給出的數字是:到 2027 年,算力需求至少 1 萬億美元,「實際會遠高於這個數」[12]。而這套敘事真正的引擎,是他反覆強調的那句判斷——需求是無限的,產能不是[11]

需求無限、產能有限,這八個字是所有 AI 硬件多頭的定價錨。它意味著兩件事:第一,誰手裡有卡,誰的卡就永遠租得出去、賣得掉;第二,用戶每增加一個,服務商就得多買一批卡,需求和算力之間是一條向上的直線,沒有拐點。

正是這條隱含假設,撐起了一整條食物鏈的估值。它讓英偉達的芯片能維持高毛利,讓臺積電的先進封裝排隊排到明年,讓 SK 海力士的 HBM 變成硬通貨,也讓 CoreWeave、Nebius 這些「租卡為生」的新雲公司拿到了遠超傳統 IDC 的市銷率——它們的整個商業模式,本質上是在替市場保管稀缺品。

稀缺是這條鏈條的血液。而這一週,有人往兩根主動脈裡各紮了一針。

第一針:軟件把需求曲線拽彎了

7 月 1 日,The Information 報道,OpenAI 的工程師靠一次純軟件優化,把模型推理的成本削減了一半以上。最刺眼的細節是:支撐非登錄 ChatGPT 訪客所需的英偉達 GPU 數量,從此前業界估計的數萬張,被壓到了幾百張[1][2]

沒有新芯片,沒有新數據中心,靠的是把現有服務器榨得更狠——外界推測是更聰明的批處理、緩存複用、量化,或是把簡單查詢分流給更便宜的模型,但 OpenAI 沒有披露具體手法[1]

這一針紮在需求側。推理是任何一家跑聊天機器人的公司真正的賬單所在地——訓練是一次性的資本開支,推理是每天都在燒的運營成本。如果單位推理的成本能靠軟件砍半,那麼「需求和算力之間是一條直線」這個假設,第一次出現了裂縫:用戶還在漲,可每個用戶要吃掉的卡在變少。

市場當天就給出了反應。費城半導體指數下跌超過 5%,Intel 跌超 7%,Micron 跌超 8%,ASML 跌超 6%[3]。邏輯很直白:如果 AI 公司能靠軟件優化在每次查詢上少用 GPU,那些最激進的硬件需求預測就得打折——而正是那些預測,撐著這些股票的估值[3]

這一針還沒算致命。畢竟單點效率提升在半導體歷史上不新鮮,摩爾定律本身就是一部單位成本長期下滑史,需求總能填上省下來的空間。真正讓這一週變得不同的,是第二天紮下的另一針——它紮在了對側。

第二針:連 Meta 都有卡要往外租

7 月 2 日,一則彭博的報道傳開:Meta 正籌劃一項雲業務,要對外提供兩類服務——託管模型的 API 訪問,以及最原始的算力出租——把自己數據中心裡閒置的 AI 算力,賣給外面的客戶[4]

對 Meta 自己,這是筆好買賣。那些本被當作無底洞成本的數據中心,一旦能把閒置產能租給付費客戶,賬面上就從純支出變成了能生近期高毛利收入的資產。市場立刻投票:Meta 當天大漲近 9%,市值一夜增加約 1270 億美元[6][5]。TechCrunch 把這套邏輯類比成 SpaceX——把燒錢的重資產利用率做上去,變成現金流[14]

但對整條食物鏈,這一針扎得比前一天更深。它紮在供給側,直擊那句「產能永遠追不上需求」的信條。三年來市場被反覆告知,算力緊到一張卡都不能空轉,誰囤到卡誰就握住了硬通貨。可現在,全世界最重的 AI 買家之一站出來說:我手裡的算力多到得往外賣。

「一張卡都不能空」和「我有閒卡要出租」,這兩句話沒法同時為真。

反應因此比前一天更兇,而且方向精準。英偉達當天幾乎沒動,只跌約 1.25%[5]——芯片的賣方地位沒被撼動。真正被打穿的是那些把商業模式押在「算力絕對稀缺」上的環節:CoreWeave 跌約 14%,Nebius 跌約 17%,Micron 跌超 10%,閃迪、Intel、AMD 齊刷刷跌在 7% 到 11% 的區間[5]

市場懲罰誰、放過誰,把它想說的話說得清清楚楚。它沒在懲罰造卡的人,它在懲罰以「替市場保管稀缺品」為生的人。一份來自 Reuters 的報道,把這一天的性質總結成一句話:Meta 的舉動,把多年來被默認的「AI 算力稀缺」,翻轉成了一記供給警報[5]

為什麼最先倒下的偏偏是 CoreWeave、Nebius 這些名字?因為它們的商業模式,地基就澆築在稀缺之上。這類「新雲」靠鉅額債務把 GPU 買進來,再拿與大客戶簽下的長期租約當作償債的底氣,本質是一場「借錢囤稀缺品、賺租金差價」的槓桿生意。這套模型只在一個前提下成立:卡永遠租得出去、租金永遠堅挺。可一旦連手握海量算力的巨頭都開始對外供貨,租金的天花板被摁低、二手算力湧入市場,槓桿的兩端就同時收緊——債務是剛性的,租金卻成了變量。它們當天的跌幅是英偉達的十倍有餘,不是因為業務一夜蒸發,而是因為它們的估值裡,稀缺溢價摻得最純、稀釋起來也最快。

亞太連鎖:一句話打穿一條信念

這記警報沒有停在美東收盤。

7 月 2 日的亞太時段,隔夜美國半導體的暴跌順著 HBM 和代工這條最敏感的神經傳導過來。韓國 KOSPI 一度觸發熔斷機制,SK 海力士與三星電子領跌——兩家正是全球 HBM 高帶寬內存的命脈供應商[7][8]。存儲是這輪 AI 週期裡稀缺假設最陡峭的地方:HBM 供不應求、價格連年上臺階,幾乎成了「算力稀缺」這套敘事最實體、最可觸摸的證據。

正因為它最實體,它挨的打也最實。當「算力絕對稀缺」這個信念本身鬆動,最先重新定價的,恰恰是那些把稀缺兌現成了真金白銀訂單的公司——它們的估值裡含稀缺溢價含得最滿。一句關於「賣算力」的傳聞,就足以把整個亞太芯片板塊推下懸崖。

傳聞的殺傷力如此之大,本身就是證據:市場心裡那條地基,原來比誰都以為的要脆。一條真正穩固的共識,不會被一家公司的一項業務計劃一擊就穿。會被一擊就穿的,是那些從沒被拿出來檢驗、只是被長期默認的東西。「算力永遠稀缺」正是這樣一條——它太順理成章,以至於三年裡沒人真去問一句:如果它不成立呢?

這一週,市場被迫問了。

反過來想:稀缺沒消失,是「永遠」兩個字被打了問號

把這一週讀成「AI 泡沫破了」「算力過剩了」,會讀錯。華爾街的主流聲音,恰恰在攔這個過度解讀,而且攔得有道理。

UBS、摩根士丹利、伯恩斯坦在事發後都維持了對 Meta 的正面評級,把外租算力看作一道營收緩衝,而非行業見頂的信號[10]。他們的核心論點是:Meta 的局部閒置,證明不了全球 AI 建設已經轉入過剩[9]。一個耐人尋味的畫面是——Meta 一邊仍在往基礎設施裡砸數千億,一邊卻有外部企業主動溢價來搶購算力[9]。這兩件事同時發生,說明整體市場的算力依舊偏緊。

於是這些分析師給出了一個更精確的讀法:Meta 同時在對外找算力、又計劃賣掉自己的一部分,與其說是「多到用不完」,不如說是一次跨越「不同代際、不同用途、不同時間窗口」的再分配[9]。新一代芯片到貨、舊一代騰出手;訓練高峰過去、推理集群閒下來;某個時區的夜間產能,正好賣給另一個時區的白天需求。這是把利用率做上去的務實之舉,不是供給崩塌。

效率那一針,也有一個更古老的反駁等在前頭。經濟史上把它叫作傑文斯悖論:1865 年,人們發現蒸汽機燒煤的效率越高,全英國的耗煤量非但沒降、反而猛增——單位成本一低,用得起的人和場景就爆發式增多,省下的每一分都被更龐大的需求量重新吞掉。推理成本被砍半,未必讓英偉達少賣卡;它更可能讓原本用不起大模型的應用一擁而上,把省下來的算力連本帶利地重新吃滿。帶寬越便宜、視頻流量越洶湧,是同一條定律的現代註腳。軟件把單位消耗壓下去,是不是就等於總需求萎縮——產業史給出的答案,恰恰相反。

所以兩記重擊各自都有解藥:效率提升可能被更旺的需求反噬,閒置出租不過是利用率的再分配。這個反方站得住。它提醒人們:稀缺沒有消失。真正被這一週擠壓掉的,不是「稀缺」這個事實,而是「永遠」這兩個字——是那條把稀缺當成物理常量、假設它會線性延續到 2027 乃至更遠的隱含前提。橘生淮南則為橘,生於淮北則為枳;同樣一塊 GPU,在需求線性無限的假設裡是永不貶值的硬通貨,在需求可被軟件壓彎、供給可被閒置盤活的世界裡,就成了一件需要精細調度利用率的普通重資產。土壤換了,果子就換了。

被重新定價的,是一個形容詞

所以這一週半導體股的暴跌,真正的座標不在「情緒回調」那一欄。

情緒回調,指的是價格圍著一個大家都認同的價值上下襬動。而這一週發生的是更深一步的事:那個「大家都認同的價值」本身,第一次被拿出來稱重。稱量它的不是某一份看空報告,而是兩條來自產業內部、彼此獨立的事實——軟件能把需求曲線拽彎,巨頭手裡有閒置算力要出租。一條從需求側、一條從供給側,共同指向同一個此前無人質疑的形容詞:絕對。

市場給英偉達和整條硬件鏈的溢價裡,「稀缺」從來是「絕對稀缺」。這一週它被悄悄改寫成了「相對稀缺」——依然稀缺,但會隨代際更替、隨效率提升、隨利用率調度而波動,不再是那條只漲不跌的直線。一個形容詞的降級,就足以讓 4.7 萬億美元之下的整條鏈條重新排隊定價:造卡的人地位最穩,租卡的人最先出局,把稀缺兌成訂單的存儲廠夾在中間。

黃仁勳的「Token 工廠」沒有關門,需求無限的故事也遠未講完。改變的只是聽眾——他們第一次意識到,自己過去為之付溢價的,不只是那句「需求無限」,還有一句從沒被明說、如今被兩記重擊敲出裂紋的潛臺詞:產能,永遠追不上。

這一週之後,「永遠」這兩個字,得重新標價了。