人工智能基础设施的竞赛正从软件模型延伸到最底层的硅片。OpenAI与博通(Broadcom)在6月24日正式揭开了双方合作的首款定制AI加速器“Jalapeño”的面纱,这款芯片从设计之初就只为一个目的服务:更高效地运行大语言模型(LLM)的推理任务。
据披露,Jalapeño芯片的研发周期仅为九个月,在芯片行业堪称极速。它并非对现有设计的修修补补,而是从零开始的全新架构,核心设计理念围绕三个维度展开:优化内存数据搬运、提升网络互联效率以及更精细地调度计算资源。早期内部测试数据表明,在与当前业界顶尖的同类产品对比时,Jalapeño的每瓦性能将取得显著领先,这在电力成本日益成为AI算力瓶颈的当下,是一个极具杀伤力的指标。
这次发布背后,是OpenAI基础设施战略的一次根本性转向。过去,这家公司主要依赖外部采购的通用GPU来训练和运行其模型。而Jalapeño的诞生,意味着OpenAI开始走向全栈整合——将模型研发与底层硬件设计深度绑定。凭借其对自身大模型内核运算特征与未来模型架构需求的深刻理解,OpenAI得以向博通提出高度定制化的架构需求,目标直指让AI服务变得更快、更可靠、更便宜。一个值得注意的细节是,在Jalapeño的设计与优化过程中,团队本身也利用了AI模型来加速芯片开发流程,形成了“用AI设计AI芯片”的闭环。
从产业部署节奏看,Jalapeño并非一次性的实验品,而是被定位为多代计算路线图的开篇之作。双方的计划相当激进:从2026年晚些时候开始,将这批处理器以吉瓦(gigawatt)级别的电力规模进行实际部署。吉瓦级部署意味着数万个乃至更多加速器组成的大型集群,这直接对标了当前超大规模云服务商建设AI数据中心的力度,也透露出OpenAI对未来推理算力需求的巨大预期。
对博通而言,这笔合作进一步巩固了其在定制AI芯片(ASIC)领域的领先地位。博通早已不是单纯的通信芯片公司,其半导体解决方案部门已为多家云巨头提供定制化AI加速器设计服务。拿下OpenAI这一关键客户,不仅意味着可观的订单量,更是在与Marvell等同样角逐定制AI芯片市场的对手的竞争中,赢得了一个标志性的技术背书。
从更宏观的视角看,Jalapeño的出现是AI产业垂直整合趋势加剧的又一力证。当模型能力逐渐趋同,推理成本与效率就成为商业化的胜负手。头部模型公司不再满足于等待通用芯片厂商的迭代节奏,转而亲自下场定义硬件,以求在性能、功耗与成本之间取得最贴合自身模型的最优解。这一趋势将持续考验传统GPU厂商的护城河,也为半导体供应链上的设计工具、先进封装与高带宽内存等环节带来新的需求变量。
当然,任何新芯片从测试数据走向大规模生产部署都面临良率、供应链与软件生态等现实挑战。Jalapeño能否在2026年如期实现吉瓦级落地,以及其实际表现是否真能兑现早期测试的能效承诺,将是市场后续关注的焦点。