英偉達約 75% 的毛利率,是 AI 時代最驚人的數字之一。它不全來自芯片有多好,也來自一個樸素的事實:過去兩年,你想買 AI 算力,幾乎只能買它——而且還得排隊。

這是本系列的收官篇。前三篇我們拆了英偉達護城河的三個切面:硬件被定製 ASIC 圍剿、軟件 CUDA 被抽象層架空、推理的單位經濟學重寫戰場。這一篇收到最現實的一處——錢袋子:當稀缺不再,英偉達那道靠「買不到」撐起來的定價權,還剩多少?

一、定價權的兩根支柱

英偉達能維持約 75% 的毛利率,[9] 靠的是兩根支柱疊在一起:

  • 技術領先——更強的架構、CUDA 生態、NVLink 到機架的全棧整合,讓它能賣出溢價;
  • 供給稀缺——過去兩年,幾乎每家想訓大模型的公司都需要英偉達 GPU,而它產不夠。當「人人都要、又買不到」疊加,定價權近乎絕對。[1]

關鍵在於第二根:稀缺。技術領先能解釋「為什麼貴」,但稀缺才解釋「為什麼能這麼貴還供不應求」。一旦稀缺鬆動,溢價裡靠「排隊」撐著的那部分,就會開始折舊。

二、結論先行

一句話:技術那根支柱還穩,但供給稀缺這根,第一次開始鬆動——第二供應商(AMD)拿到了超大單、自研 ASIC 從下方夾擊、產能逐漸追上需求。價格戰不會從旗艦訓練卡燒起(那裡仍是賣方市場),而會先從『推理』和『上一代/中端卡』點火。

拆開看:

  • 稀缺在松——Meta 給 AMD MI450 押下約 600 億美元的多年承諾,是「英偉達不再是唯一選項」的最強信號。[2][3]
  • 價格戰先燒推理——推理對性價比最敏感,也是 AMD 與定製 ASIC 性價比最接近的地方。[4][10]
  • 但旗艦仍稀缺——最前沿的訓練卡(Blackwell/Rubin)短期仍供不應求,溢價穩固。
  • 英偉達護價靠「賣系統」——不單賣芯片,而是把 GPU 鎖進 CUDA + NVLink + 機架的整套裡,讓單卡降價無從比起。[11]

三、稀缺鬆動的證據(數據模塊)

信號數字來源
英偉達份額與體量約 80% AI 加速器份額;FY2026 數據中心營收約 1937 億美元[1]
AMD 追趕Instinct 系列 2025 年營收估約 70~80 億美元、份額約 5%~7%[1]
Meta 押注 AMDMI450 多年承諾約 6GW、價值約 600 億美元;OpenAI 亦承諾約 6GW[2][3]
雲端租賃分層超大規模雲(Azure/Oracle)的 MI300X 租賃價,約為小眾雲的 3~4 倍[5]
資本市場情緒AMD 2026 年內股價漲約 114%(第三方統計,不代表本文立場)[8]

把這些連起來看:英偉達的份額仍佔絕對主導,但**「唯一供應商」的敘事正在被改寫**——當 Meta 這樣的超大買家敢把 6GW 押給 AMD,稀缺的城牆就出現了第一道縫。

四、價格戰會從哪裡先燒起

價格戰不是「全線降價」,而是從最薄弱處點火:

  • 推理側最先。 推理負載對每百萬 token 成本極敏感,AMD 與定製 ASIC 在這裡的性價比最接近英偉達。有評測(SemiAnalysis)專門比較 AMD 與英偉達在推理上的「每百萬 token 成本」,正說明買家已經在按這把尺子選貨。[4][10]
  • 上一代與中端卡。 隨著新架構投產,上一代 GPU 價格鬆動,公開的 GPU 價格追蹤已能看到這種壓力。[6][7]
  • 旗艦訓練卡仍是賣方市場。 最前沿的訓練算力短期仍供不應求,英偉達在這裡仍掌握定價權——價格戰暫時燒不到這塊。

換句話說:英偉達的「價格地板」會從底部和中部被慢慢抬走,但「價格天花板」(旗艦)暫時還焊得很牢。

五、英偉達怎麼護價

面對價格壓力,英偉達護價的手段不是「降價跟」,而是「讓你沒法只比價格」:

  • CUDA 鎖定——換芯片=換整套軟件棧,遷移成本高,這是上一篇講的護城河,也是護價的底盤。[11]
  • 賣系統,不賣單芯片——把 GPU 鎖進 NVLink、Spectrum-X、機架系統裡整體報價,讓「單卡多少錢」變得無從直接比較,議價錨定在整機價值上。
  • 保持代差——年度節奏(Blackwell → Rubin)讓對手永遠在追上一代,技術溢價持續再生。
  • 把競爭拉到 cost per token——如上一篇所述,用全棧優化把比較維度從「單卡價格」換成「每 token 總成本」,這是英偉達最能發揮規模優勢的賽道。

這套打法的內核,仍是首篇那句「每一層佔位、每一層收租」:只要英偉達賣的是一整套系統,單點的價格戰就很難真正傷到它的毛利。

六、量級校準與反方(防一邊倒)

  • 大單未必等於降價。 Meta、OpenAI 押注 AMD,更多是「供應鏈多元化」與「議價籌碼」,不直接等同於英偉達大幅降價;英偉達完全可能選擇守價、以讓出部分份額來保住毛利。[2]
  • 份額仍然懸殊。 英偉達約 80% 對 AMD 個位數的份額,量級差距巨大;AMD 的高增速是從小基數起跳。[1]
  • 技術與生態代差仍在。 CUDA 黏性、全棧整合、代際領先,仍是英偉達護價的硬底盤,短期難被價格單獨擊穿。[11]
  • 但「稀缺溢價」確實在折舊。 當產能追上、第二供應商可用、定製 ASIC 從下方壓價[12],英偉達毛利裡靠「買不到」撐著的那一部分,會隨時間慢慢褪色——這是結構性的、不可逆的方向。

更準確的說法是:英偉達不會打輸價格戰,但它可能要在「守份額」與「守毛利」之間,第一次做出取捨。

七、五層視角:價格如何沿五層傳導

從「五層蛋糕」看,芯片層的價格變化會沿鏈條傳導:

  • 向上(infra)——GPU 與系統的單位成本,直接決定 AI 工廠的 capex 與單位 token 成本;價格鬆動會改變數據中心的選型與擴產節奏;
  • 向下(供應鏈)——價格戰壓力會傳導到 HBM、CoWoS 封裝、代工等上游,誰有定價權、誰被擠壓,跟著重排;
  • 橫向(競爭格局)——AMD、定製 ASIC、英偉達三方的價格博弈,最終決定這一代 AI 資本開支「花得值不值」。

這正是「讀懂老黃」堅持五層框架的意義:一顆 GPU 的報價,從來不只是芯片層的事,它牽動著從能源到應用的整條賬本。

結語:四面牆,一座城

到這裡,「英偉達護城河觀察」第一季的四篇湊齊了:

  • 硬件被定製 ASIC 圍剿(首篇);
  • 軟件護城河 CUDA 被抽象層架空(第二篇);
  • 推理經濟學把戰場從「最快」改寫成「最便宜的 token」(第三篇);
  • 定價權的稀缺支柱開始鬆動(本篇)。

四面牆各有裂縫,但合起來仍是一座難攻的城。英偉達真正的本事,從來不是某一面牆最高,而是四面牆互為支撐:硬件養生態、生態鎖客戶、客戶撐定價、定價反哺研發。這一季我們拆的是裂縫;下一季,我們會接著盯——這些裂縫,究竟是會擴大成缺口,還是被老黃用「佔位—收租」一次次補上。

延伸閱讀