OpenAI 首款定制芯片 Jalapeño 曝光：专攻 LLM 推理，博通与台积电联手

OpenAI与博通合作定制ASIC芯片，旨在降低第三方硬件带来的高昂基础设施成本。

OpenAI 正试图从根本上改变其成本结构。这家以 ChatGPT 闻名的公司，过去一年在服务器运营上烧掉了 84 亿美元，而随着每周活跃用户攀升至 9 亿，今年的运营成本预计将飙升至约 140 亿美元。面对如此巨大的基础设施开支，OpenAI 不再满足于仅仅依赖第三方硬件，而是推出了其首款定制芯片——Jalapeño。

这款被称为“智能处理器”的芯片，并非通用型 AI 加速器，而是专门为大语言模型（LLM）推理任务设计。其核心架构由 OpenAI 根据自身模型路线图和服务系统量身打造，旨在解决交互式 LLM 服务中常见的数据移动瓶颈。具体分工上，博通负责硅工程与高性能网络集成，并将自家的 Tomahawk 网络芯片直接融入设计，使处理器能在庞大的集群化数据中心环境中高效通信。物理制造则由台积电在台湾完成，Celestica 负责构建最终的板卡和机架系统。

OpenAI 硬件项目负责人 Richard Ho 指出，该架构通过最小化数据移动，力求将实际利用率推向理论峰值性能。与那些从传统 AI 工作负载改造而来的通用加速器不同，Jalapeño 在计算、内存和网络资源之间实现了精确平衡。早期实验室样片已经在包括一款未发布的 GPT-5.3-Codex-Spark 模型在内的前沿工作负载上，以目标频率和功耗稳定运行。

这一举动背后是残酷的财务现实。目前，高端 AI 处理器的霸主英伟达享有约 75% 的利润率，而 OpenAI 在扣除庞大的运营费用后，每赚取 1 美元仅能保留约 33 美分的利润。为了支撑未来的算力需求，OpenAI 已承诺在未来八年内投入约 1.4 万亿美元，这对于一家目前年收入为 250 亿美元的公司而言，是一场豪赌。Jalapeño 芯片正是试图打破这一局面、将命运掌握在自己手中的关键棋子。

通过涉足定制硅片，OpenAI 正从一家软件层公司转变为垂直整合的基础设施公司。这种全栈策略覆盖了从芯片架构、软件内核、内存系统、网络调度到最终应用层的整个链条。类似于苹果将自有硬件与 iOS 紧密耦合的模式，OpenAI 现在可以根据其精确的内部模型路线图来优化基础设施。这形成了一个持续的运营飞轮：更高的基础设施效率降低了训练和服务的成本，更经济的服务带来更好的产品体验，从而推动用户量和收入增长，这些收入又可重新投入到下一代定制基础设施的研发中。

OpenAI 总裁兼联合创始人 Greg Brockman 表示：“Jalapeño 是我们长期全栈基础设施战略的一部分，旨在让算力更加充裕。通过自己设计更多技术栈，我们可以更高效地提供更多智能。”

尽管前景诱人，OpenAI 在自研芯片领域却是个后来者。谷歌自 2015 年起部署张量处理器（TPU），如今已掌控英伟达供应链之外约四分之一的全球 AI 算力；亚马逊已出货超过 100 万颗定制芯片；Meta 和微软也在持续扩展其自有基础设施。为了追赶近十年的差距，OpenAI 大幅压缩了开发周期。Jalapeño 芯片从一张白纸到完成制造流片——即物理生产前的最后一步——仅用了 9 个月。工程团队实现这一速度的秘诀之一，是利用 OpenAI 自家的语言模型来自动化和优化部分硬件设计流程，形成了一个独特的反馈闭环：当前服务于用户的模型，正被用于构建运行未来模型版本的物理基础设施。

首批 Jalapeño 芯片部署到数据中心的时间点定在 2026 年底。博通首席执行官 Hock Tan 确认，将与包括微软在内的基础设施合作伙伴一起扩展部署规模，为吉瓦级数据中心集成做准备。这一时间表意味着，在未来几年内，AI 算力市场的竞争将从模型层进一步向下延伸至芯片层，而 OpenAI 的入场无疑将加剧这场竞赛的激烈程度。

OpenAI 首款定制芯片 Jalapeño 曝光：专攻 LLM 推理，博通与台积电联手

延伸阅读

相关深度报道

相关每日新闻