英偉達賣出了史上最賺錢的芯片,卻養出了一桌最有錢、也最有動機繞開它的客戶。
2026 年 6 月 3 日,博通公佈 2026 財年第二季度財報:單季營收 222 億美元、同比增長 48%,其中來自 AI 的半導體收入 108 億美元、同比暴漲 143%,約佔總營收的一半;經營利潤率 67%,創歷史新高,AI 芯片在手訂單(backlog)超過 300 億美元。[1][2]
這筆錢大半來自一件事:替谷歌、Meta、OpenAI 這些英偉達的頭號大客戶,設計並代工他們「自己的」AI 芯片。於是出現了一個耐人尋味的悖論——同一周裡,英偉達剛交出數據中心單季 752 億美元、同比 +92% 的紀錄級財報,[9] 可它最大的幾個買家,正一邊下單買 GPU、一邊掏錢造能替代 GPU 的芯片。
讀馬君決定用「五層蛋糕」框架,把這場正在發生的圍剿拆清楚:缺口為什麼先出現在推理這一層、圍剿陣營到底有多大、以及老黃的反制是不是真能補漏。這是本站「英偉達護城河觀察」系列的第一篇。
一、為什麼現在寫:博通財報撕開的那道口子
把博通這份財報放到產業鏈裡看,它其實是一張「英偉達大客戶出逃地圖」。
博通把這些為單一客戶定製的 AI 加速器稱作 XPU。按第三方統計,博通已拿下定製 AI 加速器市場約 70% 的份額,背後是谷歌 TPU、Meta MTIA 等多個長期項目。[3] 也就是說,當雲巨頭們決定「不只用英偉達」,它們第一個找的設計夥伴,往往就是博通。
更說明問題的是博通自己的指引:下季度(Q3)AI 半導體收入預計同比增長超過 200%、達到約 160 億美元;公司重申 2027 財年 AI 半導體收入將超過 1000 億美元。[1] 這條曲線背後,是一整代超大規模廠商把「自研芯片」從實驗項目變成了主力路線。
這就是本文要回答的問題:當最賺錢的客戶紛紛繞過 GPU,英偉達那條以 GPU + CUDA 築起來的護城河,到底有沒有在漏水?
二、結論先行
一句話:護城河確實被鑿了一道口子,但口子開在「推理」這一層;英偉達的應對,是一邊把定製芯片「收編」進自家機架,一邊趕在客戶之前、先把「自己的推理 ASIC」造了出來。
拆開看:
- 威脅是真的——博通 AI 營收一年漲 143%、訂單簿超 300 億;谷歌、OpenAI、Anthropic 都已把「非英偉達」算力做成了可規模化的現實。[1][3][5][6]
- 但量級仍懸殊——博通整個 2027 財年的 AI 營收目標(1000 億美元)[1],量級上仍只相當於英偉達數據中心業務單季 752 億、年化約 3000 億美元的一個零頭多一點。[9]
- 戰線很清楚——通用、要靈活的訓練仍是 GPU 的主場;追求極致單位成本的推理,才是定製芯片(ASIC)的突破口。
- 老黃已經在補漏——Rubin CPX 專用推理芯片 + NVLink Fusion 開放機架 + 綁定 Marvell,三招齊下。[10][12][14]
這既是護城河被侵蝕的故事,也是一家公司主動把自己「ASIC 化」以守住護城河的故事——這是本文貫穿始終的張力。
三、圍剿陣營點名(數據模塊)
先把「誰在自己造芯片、造到哪一步」擺成一張表。
| 陣營 | 自研 / 定製芯片進度 | 設計夥伴 | 來源 |
|---|---|---|---|
| 谷歌 TPU | 第七代 雙供應:訓練版(代號 Sunfish)+ 推理版(代號 Zebrafish);出貨量 2026 年約 430 萬顆、2028 年預計超 3500 萬顆 | 博通(訓練)/ 聯發科(推理)/ Marvell | [3][4] |
| OpenAI | 與博通合作 10GW 自研加速器,OpenAI 負責設計、博通負責系統與網絡;採用 3nm/2nm 工藝,2026 下半年首批部署、2029 完成 | 博通 | [5] |
| Anthropic | 最多 100 萬顆 TPU、超 1GW 算力(2025-10);2026-04 進一步簽下 5GW 下一代 TPU(2027 起);同時跨用 AWS Trainium + 英偉達 GPU + 谷歌 TPU 三套平臺 | 谷歌 / 博通 | [6][7] |
| 亞馬遜 / 微軟 / Meta | Trainium、Maia、MTIA 各自迭代,均走「自研 + 博通/Marvell 代工」路線 | 博通 / Marvell | [3] |
把這張表連起來看,結論很直白:英偉達數據中心營收裡佔大頭的超大規模客戶,幾乎每一家都在認真做「第二供應商」,而且第二供應商往往是自己。[3] 這不是某一家的賭氣,而是一場結構性的「去單一供應商化」。
其中最有標誌性意義的是 Anthropic:它把谷歌 TPU 作為訓練前沿模型 Claude 的主力算力底座之一,等於公開驗證了「不靠英偉達也能訓出前沿大模型」這條路是走得通的。[6] 對一個長期靠「CUDA 是唯一可靠選擇」立身的生態來說,這種示範效應,比任何一張訂單都更刺痛。
四、為什麼缺口先開在「推理」
要理解這道口子,得先分清 AI 算力的兩種活:訓練和推理。
- 訓練是把模型「教出來」:算法天天變、架構反覆試,最吃「通用 + 靈活」。GPU 什麼都能跑,疊加 CUDA 十幾年積累的軟件生態,這一層英偉達的優勢短期難撼。
- 推理是把訓練好的模型「拿去用」:一旦模型定型、開始大規模對外服務,工作負載就變得重複、可預測。這時客戶最在意的不再是靈活,而是每生成一個 token 的成本。
而定製 ASIC 的全部優勢,恰恰在「重複、可預測、追求極致單位成本」的場景裡。第三方測算顯示,在生產級推理上,定製硅相對通用 GPU 的總擁有成本(TCO)優勢可達約 65%;研究機構 TrendForce 則預計,2026 年定製芯片出貨增速約 45%,而 GPU 出貨增速約 16%。[8]
把這層邏輯放回「五層蛋糕」,缺口的位置就清晰了:
- 基礎設施層(infra)——當算力從「建集群、做訓練」轉向「鋪產能、做服務」,部署的核算口徑從「峰值算力」變成「單位推理成本」,定製芯片的賬一下子算得過來了。
- 模型層(models)——前沿模型逐漸定型、開源模型批量可用,「訓練」的邊際需求增速放緩,而「服務」的需求開始指數級放大。
- 應用層(apps)——智能體(agentic AI)真正放量後,token 消耗是按「億級調用」計的;在這個量級上,哪怕單 token 成本只降兩三成,省下的也是天文數字。
換句話說:正是黃仁勳自己反覆講的「算力即營收(compute is revenue)」敘事走向成熟,把戰場從英偉達最強的訓練,推向了它相對最容易被替代的推理。 客戶越是把 AI 用成生意,就越有動機為推理這道工序,配一顆更便宜的專用芯片。
五、老黃的三道反制
英偉達沒有裝作看不見。過去一年,它的應對可以拆成三招,而且三招都很「老黃」——核心不是把對手擋在門外,而是確保無論客戶怎麼選,英偉達都在那張機架裡留著一個收費口。
反制一:自己先造一顆「推理 ASIC」——Rubin CPX
最直接的一招,是英偉達乾脆趕在客戶之前,把「專用推理芯片」自己造了出來。
2026 年,英偉達發佈 Rubin CPX:一顆專為超長上下文(100 萬+ token)推理優化的新型 GPU,主打 30 petaFLOPs 的 NVFP4 算力,注意力(attention)處理較上一代 GB300 NVL72 提速約 3×,計劃 2026 年底上市。[10][11] 有評論一針見血:Rubin CPX 犧牲了訓練的通用靈活性、換取 token 服務效率,本質上就是英偉達在客戶造出自己的 ASIC 之前,先造了一顆自己的 ASIC。[13]
配合下一代 Vera Rubin 平臺,英偉達對外給出的承諾是把推理成本壓低約 10×——直接對著定製芯片最鋒利的那把刀(TCO)去的。[13]
提示:上述「10×」「3×」均為英偉達官方或第三方評測口徑的廠商目標值,獨立第三方大規模實測尚未跟上,宜保守看待。
反制二:攔不住,就「收編」——NVLink Fusion
第二招更見功力。既然雲巨頭鐵了心要用自己的 ASIC,英偉達索性推出 NVLink Fusion:一個開放的機架級平臺,讓客戶把半定製的 ASIC 直接插進英偉達的互聯與網絡生態裡。[12]
在這套方案裡,Marvell 提供定製 XPU 與兼容 NVLink Fusion 的擴展網絡,而英偉達繼續供應 Vera CPU、ConnectX 網卡、BlueField DPU、NVLink 互聯與 Spectrum-X 交換。[12] 翻譯成大白話:就算這臺機架裡的「主芯片」不是英偉達 GPU,英偉達照樣賣 CPU、賣網絡、賣互聯、收一筆「過路費」。 客戶的 ASIC 越是要規模化組網,就越難繞開英偉達的機架級生態。
這正是我們一直強調的「佔位—收租」邏輯:份額可以被蠶食,但英偉達要在每一層都留一個收費口。
反制三:把第二名拉進自己陣營——綁定 Marvell
第三招是結盟。定製芯片的另一極是 Marvell,英偉達選擇投資並公開站臺:黃仁勳在 Computex 2026 期間稱 Marvell 有望成為「下一家萬億美元公司」。[14]
提示:「下一家萬億美元公司」是黃仁勳的個人評價、屬第三方觀點,不代表本文立場。
把博通的頭號競爭對手拉進 NVLink Fusion 生態,既分化了定製芯片陣營,又給英偉達自己的「收租」機架補上了關鍵一環。這一手的算盤很清楚:與其讓定製芯片完全長在博通體系裡,不如讓其中一支長在英偉達的機架上。
六、量級校準與反方(防一邊倒)
講到這裡,必須把天平擺正——「護城河漏水」是一個有分寸的判斷,不是「帝國將傾」。
- 量級仍然懸殊。 博通整個 2027 財年的 AI 營收目標是 1000 億美元[1],而英偉達單季數據中心營收已達 752 億、年化約 3000 億美元。[9] 即便把博通的 AI 收入全部算作「搶英偉達的蛋糕」(事實上其中相當部分是 AI 網絡、並非直接替代 GPU),量級上也只是英偉達的一個零頭多一點。
- 增速快,但基數小。 定製芯片 45% 的出貨增速確實遠高於 GPU 的 16%[8],但這是從一個小得多的基數起跳;高增速能維持幾年、會不會隨雲資本開支波動而回落,仍要後續季度數據驗證。
- CUDA 生態仍是真護城河。 客戶能自研芯片,不代表能輕鬆複製十幾年沉澱的軟件棧、編譯器、算子庫與開發者習慣。ASIC 通常只服務單一客戶、單一工作負載,一旦模型架構跳變,靈活性短板就會暴露——這也是為什麼訓練側至今沒有被撼動。
- 「自研」未必等於「斷奶」。 Anthropic 的做法很典型:TPU、英偉達 GPU、AWS Trainium 三套並用。[6][7] 多數巨頭要的是「議價權」和「第二供應商」,而非真把英偉達踢出去。
所以更準確的說法是:英偉達不會被定製芯片掀翻,但它在推理這一層「獨佔式」的定價權,正在被結構性地侵蝕——而定價權,恰恰是過去幾年支撐其 75% 級別毛利率的關鍵。[9]
七、對產業鏈意味著什麼(五層視角)
先把話說在前面:我們只做一件事——把這場「圍剿與反制」還原成產業鏈上的因果。
從「五層蛋糕」看,這場博弈正在重塑 chips→infra→models 三層的利益分配,可以情景化地(以下均為產業推演、非預測,第三方數據已歸因)這樣理解:
- 被抬升的環節——定製芯片的設計與代工方(博通、Marvell)、以及承接 TPU/XPU 製造的代工與封裝鏈,會隨「去單一供應商化」直接受益;這從博通 AI 營收 +143%、訂單簿超 300 億已能看到旁證。[1][3]
- 被重新定價的環節——英偉達在推理芯片上的超額定價權面臨壓力,這也是它主動推出 Rubin CPX、用「成本敘事」迎戰的原因。[10][13]
- 格局未變的環節——訓練側、以及機架級的 CPU/網絡/互聯(Vera CPU、Spectrum-X、NVLink),英偉達通過 NVLink Fusion 把「替代」轉化成了「共生」,反而可能在客戶用 ASIC 的同時繼續收租。[12]
我們更願意提示的是結構性問題,而非某一天的股價:當客戶從「只能買英偉達」變成「能買、能租、也能自己造」,真正值得長期追蹤的,不是 GPU 賣了多少,而是英偉達能不能在推理這道新戰場上,把「佔位」繼續轉化為「收租」。 這正是「英偉達護城河觀察」系列接下來要持續盯的事。
八、反方與不確定性
- 「投產」≠「放量」。 Rubin CPX 官方口徑是 2026 年底上市,真實出貨曲線、良率與客戶採納節奏,仍需後續季度驗證。[10]
- 自研芯片同樣有兌現風險。 OpenAI 的 10GW 計劃要到 2029 年才完成[5],谷歌 TPU 的 3500 萬顆出貨是 2028 年的預測[4];這些長週期目標都可能因資本開支、產能或良率而打折。
- 廠商口徑需打折看。 文中「10×」「3×」「65% TCO」等均來自廠商或第三方測算,獨立大規模實測尚未跟上,應保守解讀。
- 政策與宏觀變量。 出口管制、雲資本開支週期都會改變這場博弈的節奏,本文未展開。
結語
Computex 之後,我們說「再用『一家 GPU 公司』概括英偉達已經不夠了」。這篇可以補一句:英偉達正在親手把自己變成一家「也賣推理 ASIC、也賣機架、也賣網絡」的全棧收租者——因為它比誰都清楚,護城河最先漏水的地方在哪裡。
博通們的圍剿是真的,推理這道口子也是真的;但老黃顯然沒打算站著捱打,而是一邊自造 ASIC、一邊把對手的 ASIC 收進自己的機架。護城河會不會漏水,最終取決於推理這道閘守不守得住——而這,正是我們這個系列要替你長期盯住的地方。
延伸閱讀
- 本專題的「全景起點」:Computex 2026 總綱:黃仁勳把 AI『五層蛋糕』摞齊了 —— 看英偉達如何在每一層落子。
- 同一條供應鏈的另一面:HBM 與 SK 海力士 —— AI 內存的瓶頸與格局。
- 想看英偉達的上下游與投資版圖:英偉達生態圖譜
/nvidia—— 上游供應鏈 + 下游客戶 + 投資組合追蹤。