The Information 周四报道,Anthropic 正与 三星 洽谈定制人工智能芯片事宜,并已启动自研 AI 芯片的早期开发工作。若这款定制服务器芯片最终进入量产,将成为 Claude 背后公司推进硬件自主化的重要一步。

这一动作被视为 Anthropic 追随 OpenAI 的信号。OpenAI 已更早推进定制 AI 芯片项目,与芯片设计和制造伙伴合作,试图为 ChatGPT 等产品建设更独立、效率更高的计算基础设施。两家公司的共同指向很明确:大模型竞争正从单纯的算法比拼,转向软硬件一体化的深度整合。

市场影响首先落在三条线上:英伟达 等外部 GPU 供应商的议价环境、三星等代工厂在 AI 芯片订单中的机会,以及 AI 初创公司未来的融资和上市节奏。据 巴伦财经 报道,德银分析师近期建议 OpenAI 和 Anthropic 不应过久推迟 IPO,原因之一正是自研芯片和算力基础设施需要巨额长期资本。

自研芯片的驱动力首先是算力控制权。目前,训练和运行大模型需要大量高性能计算资源,AI 计算市场高度依赖英伟达 GPU 架构,供需紧张使模型训练和推理成本维持高位。对 OpenAI 和 Anthropic 这样的模型公司而言,芯片不再只是采购项目,而是核心生产资料。

Anthropic 的 Claude 模型需求在 2026 年显著增长。TradingKey 报道称,Anthropic 高管此前披露,公司年化收入已超过 300 亿美元,而 2025 年底约为 90 亿美元。业务扩张推动算力需求快速上升,也放大了外部芯片供应不确定性对公司运营的影响。Anthropic 目前仍依赖多种第三方芯片方案,包括 Alphabet 旗下 Google 设计的 TPU,以及 Amazon 自研芯片。报道称,Anthropic 还与 Google 和 Broadcom 达成长期 TPU 供应协议,该协议与其此前承诺的 500 亿美元 美国计算基础设施投资计划相关。这意味着,自研芯片并不等同于完全摆脱外部供应商,更现实的目标是掌握核心设计能力,形成技术备选项,并提升未来商业谈判中的筹码。

成本只是入口,软硬件协同才是关键。通过定制 ASIC,AI 公司可以围绕自身模型架构优化计算流程,减少通用芯片中不必要的模块,从而提高能效。若 Anthropic 芯片成功流片并部署,报道称其可能显著降低 API 调用成本,并影响企业 AI 应用市场的定价结构。但成本并不是唯一变量。SemiAnalysis 创始人 Dylan Patel 在访谈中强调,AI 效率提升的最大空间并不只来自更快芯片,而来自模型、内核和硅片之间的协同设计。他认为,单层优化可能带来两倍提升,但跨层协同可能带来远大于简单相乘的效果。

这解释了为什么 OpenAI 和 Anthropic 都在走向更深的硬件参与。模型架构并非天然适配所有芯片。Dylan Patel 称,OpenAI 模型更偏稀疏,Anthropic 模型相对更稠密,两者在矩阵乘法单元尺寸、注意力机制结构、专家层形状等方面存在显著差异,这使得两家公司在硬件选择上天然倾向于不同方向。他直言:“实际上,按照 OpenAI 模型的发展方向,使用 TPU 对他们而言可能是糟糕的决策;而按照 Anthropic 和谷歌模型的发展方向,用 GPU 训练对他们而言同样可能是糟糕的决策。”

换言之,自研芯片不只是把英伟达 GPU 替换成自己的芯片,真正目标是让模型从设计之初就能贴合底层硬件,从而改善推理速度、能耗、吞吐量和单位经济性。

对英伟达而言,这不是立刻替代,而是长期制衡。自研 AI 芯片从研发设计、流片验证到最终量产部署,通常需要 18 至 24 个月。即便 Anthropic 与三星顺利达成合作,其自研芯片也很难在短期内实质性替代现有算力供应。OpenAI 则推进更早。TradingKey 报道称,OpenAI 选择与 Broadcom 和 台积电 合作,计划在 2026 年下半年 部署首款推理芯片。相比 Anthropic,OpenAI 在定制芯片路径上更主动,也更接近落地阶段。

大模型公司自研芯片的方向,确实指向降低对英伟达等供应商的依赖,但这并不意味着英伟达的地位会被迅速削弱。Dylan Patel 在访谈中指出,英伟达 GPU 仍具有通用性优势,许多模型和开源生态本身就是围绕 GPU 优化的。他还提到,所谓 CUDA 护城河并不只是 CUDA 本身,而是大量下游模型和软件生态已经为英伟达硬件形态做了适配。如果模型的专家结构、隐藏维度和通信模式都更适合 GPU,那么即便其他芯片具备优势,迁移也未必简单。因此,自研芯片更像是建立第二条路线,OpenAI 和 Anthropic 可能会继续使用 GPU、TPU、Trainium 等多种算力资源,同时把自研 ASIC 用于更明确、更稳定、更高频的工作负载,尤其是推理场景。

全行业“算力自主权”竞赛已全面开启。OpenAI 和 Anthropic 自研芯片的共同逻辑,可以概括为三点:降低长期算力成本、减少外部供应依赖,以及通过软硬件协同提升模型效率。其中,第三点可能最关键。随着模型公司规模扩大,通用算力无法完全满足差异化架构需求,自研芯片让公司能够把模型设计、系统软件和底层硅片放在同一个优化框架内。

Anthropic 的探索并非孤例。从 谷歌 深耕十余年的 TPU 系列,到 亚马逊 专注训练场景的 Trainium 系列,再到 Meta 面向推理场景的 MTIA 系列,以及 微软 持续推进的 Maia 系列,头部科技公司均已在自研芯片赛道上深度布局。对于三星而言,若能拿下 Anthropic 的芯片代工订单,将为其晶圆代工业务在 AI 领域的影响力带来重要提振。三星目前正与台积电等厂商激烈争夺先进制程客户,引入 Anthropic 这样具有高成长潜力的 AI 客户,有助于扩大其在 AI 半导体领域的版图。