XPU 是博通對其為單一客戶定製的 AI 加速器的稱呼。按第三方統計,博通已拿下定製 AI 加速器市場約 70% 的份額,背後是谷歌 TPU、Meta MTIA 等多個長期專案。

為什麼輝達護城河的缺口先出現在推理這一層?

訓練演算法天天變、架構反覆試,最吃通用與靈活,疊加 CUDA 十幾年生態,輝達優勢短期難撼;而推理是把定型模型拿去大規模服務,工作負載重複、可預測,客戶最在意每個 token 的成本,這正是定製 ASIC 最有優勢的場景。

谷歌、OpenAI、Anthropic 的自研晶片進展到哪一步?

谷歌第七代 TPU 雙供應(訓練版 Sunfish + 推理版 Zebrafish),出貨量 2026 年約 430 萬顆、2028 年預計超 3500 萬顆;OpenAI 與博通合作 10GW 自研加速器,2026 下半年首批部署、2029 完成;Anthropic 最多 100 萬顆 TPU 超 1GW 算力,2026 年 4 月進一步簽下 5GW 下一代 TPU。

輝達對定製 ASIC 圍剿的三道反制是什麼?

一是自己先造推理 ASIC——Rubin CPX,專為 100 萬+ token 超長上下文推理最佳化,計劃 2026 年底上市;二是推出開放機架平台 NVLink Fusion,把客戶的半定製 ASIC「收編」進自家互聯生態,照樣賣 CPU、網路、互聯收「過路費」;三是投資並繫結 Marvell,分化定製晶片陣營。

輝達的護城河真的在漏水嗎?

缺口是真的,但量級仍懸殊:博通整個 2027 財年 AI 營收目標 1000 億美元,而輝達單季資料中心營收已達 752 億、年化約 3000 億美元,博通目標量級只是其一個零頭多一點。更準確的說法是輝達不會被掀翻,但它在推理層的「獨佔式」定價權正被結構性侵蝕。

「自研晶片」是否意味著客戶徹底拋棄輝達?

未必。Anthropic 的做法很典型:TPU、輝達 GPU、AWS Trainium 三套並用。多數巨頭要的是議價權和「第二供應商」,而非真把輝達踢出去。

護城河在漏水？老黃的 GPU 帝國，正被一群「自己造晶片」的客戶包圍 · 深度報道

Q: 博通 2026 財年第二季度 AI 晶片營收表現如何?

博通 2026 財年第二季度單季營收 222 億美元、同比增長 48%,其中來自 AI 的半導體收入 108 億美元、同比暴漲 143%,約佔總營收的一半;經營利潤率 67% 創歷史新高,AI 晶片在手訂單超過 300 億美元。

輝達賣出了史上最賺錢的晶片，卻養出了一桌最有錢、也最有動機繞開它的客戶。

2026 年 6 月 3 日，博通公佈 2026 財年第二季度財報：單季營收 222 億美元、同比增長 48%，其中來自 AI 的半導體收入 108 億美元、同比暴漲 143%，約佔總營收的一半；經營利潤率 67%，創歷史新高，AI 晶片在手訂單（backlog）超過 300 億美元。^{^[1]^[2]}

這筆錢大半來自一件事：替谷歌、Meta、OpenAI 這些輝達的頭號大客戶，設計並代工他們「自己的」AI 晶片。於是出現了一個耐人尋味的悖論——同一周裡，輝達剛交出資料中心單季 752 億美元、同比 +92% 的紀錄級財報，^{^[9]} 可它最大的幾個買家，正一邊下單買 GPU、一邊掏錢造能替代 GPU 的晶片。

下面把這場正在發生的圍剿拆清楚：缺口為什麼先出現在推理這一環、圍剿陣營到底有多大、以及老黃的反制是不是真能補漏。這是本站「輝達護城河觀察」系列的第一篇。

一、為什麼現在寫：博通財報撕開的那道口子

把博通這份財報放到產業鏈裡看，它其實是一張「輝達大客戶出逃地圖」。

博通把這些為單一客戶定製的 AI 加速器稱作 XPU。按第三方統計，博通已拿下定製 AI 加速器市場約 70% 的份額，背後是谷歌 TPU、Meta MTIA 等多個長期專案。^{^[3]} 當雲巨頭們決定「不只用輝達」，它們第一個找的設計夥伴，往往就是博通。

更說明問題的是博通自己的指引：下季度（Q3）AI 半導體收入預計同比增長超過 200%、達到約 160 億美元；公司重申 2027 財年 AI 半導體收入將超過 1000 億美元。^{^[1]} 這條曲線背後，是一整代超大規模廠商把「自研晶片」從實驗專案變成了主力路線。

問題就擺在這裡：當最賺錢的客戶紛紛繞過 GPU，輝達那條以 GPU + CUDA 築起來的護城河，到底有沒有在漏水？

二、結論先行

一句話：護城河確實被鑿了一道口子，但口子開在「推理」這一層；輝達的應對，是一邊把定製晶片「收編」進自家機架，一邊趕在客戶之前、先把「自己的推理 ASIC」造了出來。

拆開看：

威脅是真的——博通 AI 營收一年漲 143%、訂單簿超 300 億；谷歌、OpenAI、Anthropic 都已把「非輝達」算力做成了可規模化的現實。^{^[1]^[3]^[5]^[6]}
但量級仍懸殊——博通整個 2027 財年的 AI 營收目標（1000 億美元）^{^[1]}，量級上仍只相當於輝達資料中心業務單季 752 億、年化約 3000 億美元的一個零頭多一點。^{^[9]}
戰線很清楚——通用、要靈活的訓練仍是 GPU 的主場；追求極致單位成本的推理，才是定製晶片（ASIC）的突破口。
老黃已經在補漏——Rubin CPX 專用推理晶片 + NVLink Fusion 開放機架 + 繫結 Marvell，三招齊下。^{^[10]^[12]^[14]}

這既是護城河被侵蝕的故事，也是一家公司主動把自己「ASIC 化」以守住護城河的故事——這層張力貫穿始終。

三、圍剿陣營點名（資料模組）

先把「誰在自己造晶片、造到哪一步」擺成一張表。

陣營	自研 / 定製晶片進度	設計夥伴	來源
谷歌 TPU	第七代雙供應：訓練版（代號 Sunfish）+ 推理版（代號 Zebrafish）；出貨量 2026 年約 430 萬顆、2028 年預計超 3500 萬顆	博通（訓練）/ 聯發科（推理）/ Marvell	^{^[3]^[4]}
OpenAI	與博通合作 10GW 自研加速器，OpenAI 負責設計、博通負責系統與網路；採用 3nm／2nm 工藝，2026 下半年首批部署、2029 完成	博通	^{^[5]}
Anthropic	最多 100 萬顆 TPU、超 1GW 算力（2025-10）；2026-04 進一步簽下 5GW 下一代 TPU（2027 起）；同時跨用 AWS Trainium + 輝達 GPU + 谷歌 TPU 三套平台	谷歌 / 博通	^{^[6]^[7]}
亞馬遜 / 微軟 / Meta	Trainium、Maia、MTIA 各自迭代，均走「自研 + 博通/Marvell 代工」路線	博通 / Marvell	^{^[3]}

把這張表連起來看，結論很直白：輝達資料中心營收裡佔大頭的超大規模客戶，幾乎每一家都在認真做「第二供應商」，而且第二供應商往往是自己。^{^[3]} 這不是某一家的賭氣，而是一場結構性的「去單一供應商化」。

其中最有標誌性意義的是 Anthropic：它把谷歌 TPU 作為訓練前沿模型 Claude 的主力算力底座之一，等於公開驗證了「不靠輝達也能訓出前沿大模型」這條路是走得通的。^{^[6]} 對一個長期靠「CUDA 是唯一可靠選擇」立身的生態來說，這種示範效應，比任何一張訂單都更刺痛。

四、為什麼缺口先開在「推理」

要理解這道口子，得先分清 AI 算力的兩種活：訓練和推理。

訓練是把模型「教出來」：演算法天天變、架構反覆試，最吃「通用 + 靈活」。GPU 什麼都能跑，疊加 CUDA 十幾年積累的軟體生態，這一層輝達的優勢短期難撼。
推理是把訓練好的模型「拿去用」：一旦模型定型、開始大規模對外服務，工作負載就變得重複、可預測。這時客戶最在意的不再是靈活，而是每生成一個 token 的成本。

而定製 ASIC 的全部優勢，恰恰在「重複、可預測、追求極致單位成本」的場景裡。第三方測算顯示，在生產級推理上，定製矽相對通用 GPU 的總擁有成本（TCO）優勢可達約 65%；研究機構 TrendForce 則預計，2026 年定製晶片出貨增速約 45%，而 GPU 出貨增速約 16%。^{^[8]}

把這層邏輯放回產業鏈的上下游，缺口的位置就清晰了：

基礎設施層（infra）——當算力從「建叢集、做訓練」轉向「鋪產能、做服務」，部署的核算口徑從「峰值算力」變成「單位推理成本」，定製晶片的賬一下子算得過來了。
模型層（models）——前沿模型逐漸定型、開源模型批次可用，「訓練」的邊際需求增速放緩，而「服務」的需求開始指數級放大。
應用層（apps）——智慧體（agentic AI）真正放量後，token 消耗是按「億級呼叫」計的；在這個量級上，哪怕單 token 成本只降兩三成，省下的也是天文數字。

正是黃仁勳自己反覆講的「算力即營收（compute is revenue）」敘事走向成熟，把戰場從輝達最強的訓練，推向了它相對最容易被替代的推理。 客戶越是把 AI 用成生意，就越有動機為推理這道工序，配一顆更便宜的專用晶片。

五、老黃的三道反制

輝達沒有裝作看不見。過去一年，它的應對可以拆成三招，而且三招都很「老黃」——核心不是把對手擋在門外，而是確保無論客戶怎麼選，輝達都在那張機架裡留著一個收費口。

反制一：自己先造一顆「推理 ASIC」——Rubin CPX

最直接的一招，是輝達乾脆趕在客戶之前，把「專用推理晶片」自己造了出來。

2026 年，輝達釋出 Rubin CPX：一顆專為超長上下文（100 萬+ token）推理最佳化的新型 GPU，主打 30 petaFLOPs 的 NVFP4 算力，注意力（attention）處理較上一代 GB300 NVL72 提速約 3×，計劃 2026 年底上市。^{^[10]^[11]} 有評論一針見血：Rubin CPX 犧牲了訓練的通用靈活性、換取 token 服務效率，本質上就是輝達在客戶造出自己的 ASIC 之前，先造了一顆自己的 ASIC。^{^[13]}

配合下一代 Vera Rubin 平台，輝達對外給出的承諾是把推理成本壓低約 10×——直接對著定製晶片最鋒利的那把刀（TCO）去的。^{^[13]}

提示：上述「10×」「3×」均為輝達官方或第三方評測口徑的廠商目標值，獨立第三方大規模實測尚未跟上，宜保守看待。

反制二：攔不住，就「收編」——NVLink Fusion

第二招更見功力。既然雲巨頭鐵了心要用自己的 ASIC，輝達索性推出 NVLink Fusion：一個開放的機架級平台，讓客戶把半定製的 ASIC 直接插進輝達的互聯與網路生態裡。^{^[12]}

在這套方案裡，Marvell 提供定製 XPU 與相容 NVLink Fusion 的擴充套件網路，而輝達繼續供應 Vera CPU、ConnectX 網絡卡、BlueField DPU、NVLink 互聯與 Spectrum-X 交換。^{^[12]} 翻譯成大白話：就算這台機架裡的「主晶片」不是輝達 GPU，輝達照樣賣 CPU、賣網路、賣互聯、收一筆「過路費」。 客戶的 ASIC 越是要規模化組網，就越難繞開輝達的機架級生態。

這正是那套「佔位—收租」邏輯：份額可以被蠶食，但輝達要在每一層都留一個收費口。

反制三：把第二名拉進自己陣營——繫結 Marvell

第三招是結盟。定製晶片的另一極是 Marvell，輝達選擇投資並公開站台：黃仁勳在 Computex 2026 期間稱 Marvell 有望成為「下一家萬億美元公司」。^{^[14]}

提示：「下一家萬億美元公司」是黃仁勳的個人評價、屬第三方觀點。

把博通的頭號競爭對手拉進 NVLink Fusion 生態，既分化了定製晶片陣營，又給輝達自己的「收租」機架補上了關鍵一環。這一手的算盤很清楚：與其讓定製晶片完全長在博通體系裡，不如讓其中一支長在輝達的機架上。

六、量級校準與反方（防一邊倒）

講到這裡，必須把天平擺正——「護城河漏水」是一個有分寸的判斷，不是「帝國將傾」。

量級仍然懸殊。 博通整個 2027 財年的 AI 營收目標是 1000 億美元^{^[1]}，而輝達單季資料中心營收已達 752 億、年化約 3000 億美元。^{^[9]} 即便把博通的 AI 收入全部算作「搶輝達的蛋糕」（其中相當部分其實是 AI 網路、並非直接替代 GPU），量級上也只是輝達的一個零頭多一點。
增速快，但基數小。 定製晶片 45% 的出貨增速確實遠高於 GPU 的 16%^{^[8]}，但這是從一個小得多的基數起跳；高增速能維持幾年、會不會隨雲資本開支波動而回落，仍要後續季度資料驗證。
CUDA 生態仍是真護城河。 客戶能自研晶片，不代表能輕鬆複製十幾年沉澱的軟體棧、編譯器、運算元庫與開發者習慣。ASIC 通常只服務單一客戶、單一工作負載，一旦模型架構跳變，靈活性短板就會暴露——這也是為什麼訓練側至今沒有被撼動。
「自研」未必等於「斷奶」。 Anthropic 的做法很典型：TPU、輝達 GPU、AWS Trainium 三套並用。^{^[6]^[7]} 多數巨頭要的是「議價權」和「第二供應商」，而非真把輝達踢出去。

所以更準確的說法是：輝達不會被定製晶片掀翻，但它在推理這一層「獨佔式」的定價權，正在被結構性地侵蝕——而定價權，恰恰是過去幾年支撐其 75% 級別毛利率的關鍵。^{^[9]}

七、對產業鏈意味著什麼（五層視角）

這場「圍剿與反制」還原到產業鏈上，就是一條因果鏈。

沿著產業鏈看，這場博弈正在重塑 chips→infra→models 三層的利益分配，可以情景化地（以下均為產業推演、非預測，第三方資料已歸因）這樣理解：

被抬升的環節——定製晶片的設計與代工方（博通、Marvell）、以及承接 TPU／XPU 製造的代工與封裝鏈，會隨「去單一供應商化」直接受益；這從博通 AI 營收 +143%、訂單簿超 300 億已能看到旁證。^{^[1]^[3]}
被重新定價的環節——輝達在推理晶片上的超額定價權面臨壓力，這也是它主動推出 Rubin CPX、用「成本敘事」迎戰的原因。^{^[10]^[13]}
格局未變的環節——訓練側、以及機架級的 CPU／網路／互聯（Vera CPU、Spectrum-X、NVLink），輝達通過 NVLink Fusion 把「替代」轉化成了「共生」，反而可能在客戶用 ASIC 的同時繼續收租。^{^[12]}

真正要緊的是結構性問題，而非某一天的股價：當客戶從「只能買輝達」變成「能買、能租、也能自己造」，真正值得長期追蹤的，不是 GPU 賣了多少，而是輝達能不能在推理這道新戰場上，把「佔位」繼續轉化為「收租」。這正是「輝達護城河觀察」系列接下來要持續盯的事。

八、反方與不確定性

「投產」≠「放量」。 Rubin CPX 官方口徑是 2026 年底上市，真實出貨曲線、良率與客戶採納節奏，仍需後續季度驗證。^{^[10]}
自研晶片同樣有兌現風險。 OpenAI 的 10GW 計劃要到 2029 年才完成^{^[5]}，谷歌 TPU 的 3500 萬顆出貨是 2028 年的預測^{^[4]}；這些長週期目標都可能因資本開支、產能或良率而打折。
廠商口徑需打折看。 文中「10×」「3×」「65% TCO」等均來自廠商或第三方測算，獨立大規模實測尚未跟上，應保守解讀。
政策與宏觀變數。 出口管制、雲資本開支週期都會改變這場博弈的節奏，此處不展開。

結語

Computex 之後已有一句話流傳：「再用『一家 GPU 公司』概括輝達已經不夠了。」這裡可以補一句：輝達正在親手把自己變成一家「也賣推理 ASIC、也賣機架、也賣網路」的全棧收租者——因為它比誰都清楚，護城河最先漏水的地方在哪裡。

博通們的圍剿是真的，推理這道口子也是真的；但老黃顯然沒打算站著捱打，而是一邊自造 ASIC、一邊把對手的 ASIC 收進自己的機架。護城河會不會漏水，最終取決於推理這道閘守不守得住——而這，正是「輝達護城河觀察」系列要長期盯住的地方。

護城河在漏水？老黃的 GPU 帝國，正被一群「自己造晶片」的客戶包圍

一、為什麼現在寫：博通財報撕開的那道口子

二、結論先行

三、圍剿陣營點名（資料模組）

四、為什麼缺口先開在「推理」

五、老黃的三道反制

反制一：自己先造一顆「推理 ASIC」——Rubin CPX

反制二：攔不住，就「收編」——NVLink Fusion

反制三：把第二名拉進自己陣營——繫結 Marvell

六、量級校準與反方（防一邊倒）

七、對產業鏈意味著什麼（五層視角）

八、反方與不確定性

結語

延伸閱讀

常見問題

參考來源

一、為什麼現在寫：博通財報撕開的那道口子

二、結論先行

三、圍剿陣營點名（資料模組）

四、為什麼缺口先開在「推理」

五、老黃的三道反制

反制一：自己先造一顆「推理 ASIC」——Rubin CPX

反制二：攔不住，就「收編」——NVLink Fusion

反制三：把第二名拉進自己陣營——繫結 Marvell

六、量級校準與反方（防一邊倒）

七、對產業鏈意味著什麼（五層視角）

八、反方與不確定性

結語

延伸閱讀

常見問題

參考來源

同系列往期 檢視完整系列 →

相關百科

跨站相關詞條

相關每日新聞

同系列往期檢視完整系列 →