OpenAI联手博通发布AI加速器“Jalapeño”，专攻大模型推理

OpenAI和博通发布专为LLM推理设计的AI加速器，耗时九个月开发。

人工智能基础设施的竞赛正从软件模型延伸到最底层的硅片。OpenAI与博通（Broadcom）在6月24日正式揭开了双方合作的首款定制AI加速器“Jalapeño”的面纱，这款芯片从设计之初就只为一个目的服务：更高效地运行大语言模型（LLM）的推理任务。

据披露，Jalapeño芯片的研发周期仅为九个月，在芯片行业堪称极速。它并非对现有设计的修修补补，而是从零开始的全新架构，核心设计理念围绕三个维度展开：优化内存数据搬运、提升网络互联效率以及更精细地调度计算资源。早期内部测试数据表明，在与当前业界顶尖的同类产品对比时，Jalapeño的每瓦性能将取得显著领先，这在电力成本日益成为AI算力瓶颈的当下，是一个极具杀伤力的指标。

这次发布背后，是OpenAI基础设施战略的一次根本性转向。过去，这家公司主要依赖外部采购的通用GPU来训练和运行其模型。而Jalapeño的诞生，意味着OpenAI开始走向全栈整合——将模型研发与底层硬件设计深度绑定。凭借其对自身大模型内核运算特征与未来模型架构需求的深刻理解，OpenAI得以向博通提出高度定制化的架构需求，目标直指让AI服务变得更快、更可靠、更便宜。一个值得注意的细节是，在Jalapeño的设计与优化过程中，团队本身也利用了AI模型来加速芯片开发流程，形成了“用AI设计AI芯片”的闭环。

从产业部署节奏看，Jalapeño并非一次性的实验品，而是被定位为多代计算路线图的开篇之作。双方的计划相当激进：从2026年晚些时候开始，将这批处理器以吉瓦（gigawatt）级别的电力规模进行实际部署。吉瓦级部署意味着数万个乃至更多加速器组成的大型集群，这直接对标了当前超大规模云服务商建设AI数据中心的力度，也透露出OpenAI对未来推理算力需求的巨大预期。

对博通而言，这笔合作进一步巩固了其在定制AI芯片（ASIC）领域的领先地位。博通早已不是单纯的通信芯片公司，其半导体解决方案部门已为多家云巨头提供定制化AI加速器设计服务。拿下OpenAI这一关键客户，不仅意味着可观的订单量，更是在与Marvell等同样角逐定制AI芯片市场的对手的竞争中，赢得了一个标志性的技术背书。

从更宏观的视角看，Jalapeño的出现是AI产业垂直整合趋势加剧的又一力证。当模型能力逐渐趋同，推理成本与效率就成为商业化的胜负手。头部模型公司不再满足于等待通用芯片厂商的迭代节奏，转而亲自下场定义硬件，以求在性能、功耗与成本之间取得最贴合自身模型的最优解。这一趋势将持续考验传统GPU厂商的护城河，也为半导体供应链上的设计工具、先进封装与高带宽内存等环节带来新的需求变量。

当然，任何新芯片从测试数据走向大规模生产部署都面临良率、供应链与软件生态等现实挑战。Jalapeño能否在2026年如期实现吉瓦级落地，以及其实际表现是否真能兑现早期测试的能效承诺，将是市场后续关注的焦点。

OpenAI联手博通发布AI加速器“Jalapeño”，专攻大模型推理

延伸阅读

相关深度报道

相关每日新闻