The Information 週四報道,Anthropic 正與 三星 洽談定製人工智能芯片事宜,並已啟動自研 AI 芯片的早期開發工作。若這款定製服務器芯片最終進入量產,將成為 Claude 背後公司推進硬件自主化的重要一步。

這一動作被視為 Anthropic 追隨 OpenAI 的信號。OpenAI 已更早推進定製 AI 芯片項目,與芯片設計和製造夥伴合作,試圖為 ChatGPT 等產品建設更獨立、效率更高的計算基礎設施。兩家公司的共同指向很明確:大模型競爭正從單純的算法比拼,轉向軟硬件一體化的深度整合。

市場影響首先落在三條線上:英偉達 等外部 GPU 供應商的議價環境、三星等代工廠在 AI 芯片訂單中的機會,以及 AI 初創公司未來的融資和上市節奏。據 巴倫財經 報道,德銀分析師近期建議 OpenAI 和 Anthropic 不應過久推遲 IPO,原因之一正是自研芯片和算力基礎設施需要鉅額長期資本。

自研芯片的驅動力首先是算力控制權。目前,訓練和運行大模型需要大量高性能計算資源,AI 計算市場高度依賴英偉達 GPU 架構,供需緊張使模型訓練和推理成本維持高位。對 OpenAI 和 Anthropic 這樣的模型公司而言,芯片不再只是採購項目,而是核心生產資料。

Anthropic 的 Claude 模型需求在 2026 年顯著增長。TradingKey 報道稱,Anthropic 高管此前披露,公司年化收入已超過 300 億美元,而 2025 年底約為 90 億美元。業務擴張推動算力需求快速上升,也放大了外部芯片供應不確定性對公司運營的影響。Anthropic 目前仍依賴多種第三方芯片方案,包括 Alphabet 旗下 Google 設計的 TPU,以及 Amazon 自研芯片。報道稱,Anthropic 還與 Google 和 Broadcom 達成長期 TPU 供應協議,該協議與其此前承諾的 500 億美元 美國計算基礎設施投資計劃相關。這意味著,自研芯片並不等同於完全擺脫外部供應商,更現實的目標是掌握核心設計能力,形成技術備選項,並提升未來商業談判中的籌碼。

成本只是入口,軟硬件協同才是關鍵。通過定製 ASIC,AI 公司可以圍繞自身模型架構優化計算流程,減少通用芯片中不必要的模塊,從而提高能效。若 Anthropic 芯片成功流片並部署,報道稱其可能顯著降低 API 調用成本,並影響企業 AI 應用市場的定價結構。但成本並不是唯一變量。SemiAnalysis 創始人 Dylan Patel 在訪談中強調,AI 效率提升的最大空間並不只來自更快芯片,而來自模型、內核和硅片之間的協同設計。他認為,單層優化可能帶來兩倍提升,但跨層協同可能帶來遠大於簡單相乘的效果。

這解釋了為什麼 OpenAI 和 Anthropic 都在走向更深的硬件參與。模型架構並非天然適配所有芯片。Dylan Patel 稱,OpenAI 模型更偏稀疏,Anthropic 模型相對更稠密,兩者在矩陣乘法單元尺寸、注意力機制結構、專家層形狀等方面存在顯著差異,這使得兩家公司在硬件選擇上天然傾向於不同方向。他直言:“實際上,按照 OpenAI 模型的發展方向,使用 TPU 對他們而言可能是糟糕的決策;而按照 Anthropic 和谷歌模型的發展方向,用 GPU 訓練對他們而言同樣可能是糟糕的決策。”

換言之,自研芯片不只是把英偉達 GPU 替換成自己的芯片,真正目標是讓模型從設計之初就能貼合底層硬件,從而改善推理速度、能耗、吞吐量和單位經濟性。

對英偉達而言,這不是立刻替代,而是長期制衡。自研 AI 芯片從研發設計、流片驗證到最終量產部署,通常需要 18 至 24 個月。即便 Anthropic 與三星順利達成合作,其自研芯片也很難在短期內實質性替代現有算力供應。OpenAI 則推進更早。TradingKey 報道稱,OpenAI 選擇與 Broadcom 和 臺積電 合作,計劃在 2026 年下半年 部署首款推理芯片。相比 Anthropic,OpenAI 在定製芯片路徑上更主動,也更接近落地階段。

大模型公司自研芯片的方向,確實指向降低對英偉達等供應商的依賴,但這並不意味著英偉達的地位會被迅速削弱。Dylan Patel 在訪談中指出,英偉達 GPU 仍具有通用性優勢,許多模型和開源生態本身就是圍繞 GPU 優化的。他還提到,所謂 CUDA 護城河並不只是 CUDA 本身,而是大量下游模型和軟件生態已經為英偉達硬件形態做了適配。如果模型的專家結構、隱藏維度和通信模式都更適合 GPU,那麼即便其他芯片具備優勢,遷移也未必簡單。因此,自研芯片更像是建立第二條路線,OpenAI 和 Anthropic 可能會繼續使用 GPU、TPU、Trainium 等多種算力資源,同時把自研 ASIC 用於更明確、更穩定、更高頻的工作負載,尤其是推理場景。

全行業“算力自主權”競賽已全面開啟。OpenAI 和 Anthropic 自研芯片的共同邏輯,可以概括為三點:降低長期算力成本、減少外部供應依賴,以及通過軟硬件協同提升模型效率。其中,第三點可能最關鍵。隨著模型公司規模擴大,通用算力無法完全滿足差異化架構需求,自研芯片讓公司能夠把模型設計、系統軟件和底層硅片放在同一個優化框架內。

Anthropic 的探索並非孤例。從 谷歌 深耕十餘年的 TPU 系列,到 亞馬遜 專注訓練場景的 Trainium 系列,再到 Meta 面向推理場景的 MTIA 系列,以及 微軟 持續推進的 Maia 系列,頭部科技公司均已在自研芯片賽道上深度佈局。對於三星而言,若能拿下 Anthropic 的芯片代工訂單,將為其晶圓代工業務在 AI 領域的影響力帶來重要提振。三星目前正與臺積電等廠商激烈爭奪先進製程客戶,引入 Anthropic 這樣具有高成長潛力的 AI 客戶,有助於擴大其在 AI 半導體領域的版圖。