OpenAI 正试图从根本上改变其成本结构。这家以 ChatGPT 闻名的公司,过去一年在服务器运营上烧掉了 84 亿美元,而随着每周活跃用户攀升至 9 亿,今年的运营成本预计将飙升至约 140 亿美元。面对如此巨大的基础设施开支,OpenAI 不再满足于仅仅依赖第三方硬件,而是推出了其首款定制芯片——Jalapeño。
这款被称为“智能处理器”的芯片,并非通用型 AI 加速器,而是专门为大语言模型(LLM)推理任务设计。其核心架构由 OpenAI 根据自身模型路线图和服务系统量身打造,旨在解决交互式 LLM 服务中常见的数据移动瓶颈。具体分工上,博通负责硅工程与高性能网络集成,并将自家的 Tomahawk 网络芯片直接融入设计,使处理器能在庞大的集群化数据中心环境中高效通信。物理制造则由台积电在台湾完成,Celestica 负责构建最终的板卡和机架系统。
OpenAI 硬件项目负责人 Richard Ho 指出,该架构通过最小化数据移动,力求将实际利用率推向理论峰值性能。与那些从传统 AI 工作负载改造而来的通用加速器不同,Jalapeño 在计算、内存和网络资源之间实现了精确平衡。早期实验室样片已经在包括一款未发布的 GPT-5.3-Codex-Spark 模型在内的前沿工作负载上,以目标频率和功耗稳定运行。
这一举动背后是残酷的财务现实。目前,高端 AI 处理器的霸主英伟达享有约 75% 的利润率,而 OpenAI 在扣除庞大的运营费用后,每赚取 1 美元仅能保留约 33 美分的利润。为了支撑未来的算力需求,OpenAI 已承诺在未来八年内投入约 1.4 万亿美元,这对于一家目前年收入为 250 亿美元的公司而言,是一场豪赌。Jalapeño 芯片正是试图打破这一局面、将命运掌握在自己手中的关键棋子。
通过涉足定制硅片,OpenAI 正从一家软件层公司转变为垂直整合的基础设施公司。这种全栈策略覆盖了从芯片架构、软件内核、内存系统、网络调度到最终应用层的整个链条。类似于苹果将自有硬件与 iOS 紧密耦合的模式,OpenAI 现在可以根据其精确的内部模型路线图来优化基础设施。这形成了一个持续的运营飞轮:更高的基础设施效率降低了训练和服务的成本,更经济的服务带来更好的产品体验,从而推动用户量和收入增长,这些收入又可重新投入到下一代定制基础设施的研发中。
OpenAI 总裁兼联合创始人 Greg Brockman 表示:“Jalapeño 是我们长期全栈基础设施战略的一部分,旨在让算力更加充裕。通过自己设计更多技术栈,我们可以更高效地提供更多智能。”
尽管前景诱人,OpenAI 在自研芯片领域却是个后来者。谷歌自 2015 年起部署张量处理器(TPU),如今已掌控英伟达供应链之外约四分之一的全球 AI 算力;亚马逊已出货超过 100 万颗定制芯片;Meta 和微软也在持续扩展其自有基础设施。为了追赶近十年的差距,OpenAI 大幅压缩了开发周期。Jalapeño 芯片从一张白纸到完成制造流片——即物理生产前的最后一步——仅用了 9 个月。工程团队实现这一速度的秘诀之一,是利用 OpenAI 自家的语言模型来自动化和优化部分硬件设计流程,形成了一个独特的反馈闭环:当前服务于用户的模型,正被用于构建运行未来模型版本的物理基础设施。
首批 Jalapeño 芯片部署到数据中心的时间点定在 2026 年底。博通首席执行官 Hock Tan 确认,将与包括微软在内的基础设施合作伙伴一起扩展部署规模,为吉瓦级数据中心集成做准备。这一时间表意味着,在未来几年内,AI 算力市场的竞争将从模型层进一步向下延伸至芯片层,而 OpenAI 的入场无疑将加剧这场竞赛的激烈程度。