OpenAI聯手博通發佈AI加速器“Jalapeño”，專攻大模型推理

OpenAI和博通發佈專為LLM推理設計的AI加速器，耗時九個月開發。

人工智能基礎設施的競賽正從軟件模型延伸到最底層的硅片。OpenAI與博通（Broadcom）在6月24日正式揭開了雙方合作的首款定製AI加速器“Jalapeño”的面紗，這款芯片從設計之初就只為一個目的服務：更高效地運行大語言模型（LLM）的推理任務。

據披露，Jalapeño芯片的研發週期僅為九個月，在芯片行業堪稱極速。它並非對現有設計的修修補補，而是從零開始的全新架構，核心設計理念圍繞三個維度展開：優化內存數據搬運、提升網絡互聯效率以及更精細地調度計算資源。早期內部測試數據表明，在與當前業界頂尖的同類產品對比時，Jalapeño的每瓦性能將取得顯著領先，這在電力成本日益成為AI算力瓶頸的當下，是一個極具殺傷力的指標。

這次發佈背後，是OpenAI基礎設施戰略的一次根本性轉向。過去，這家公司主要依賴外部採購的通用GPU來訓練和運行其模型。而Jalapeño的誕生，意味著OpenAI開始走向全棧整合——將模型研發與底層硬件設計深度綁定。憑藉其對自身大模型內核運算特徵與未來模型架構需求的深刻理解，OpenAI得以向博通提出高度定製化的架構需求，目標直指讓AI服務變得更快、更可靠、更便宜。一個值得注意的細節是，在Jalapeño的設計與優化過程中，團隊本身也利用了AI模型來加速芯片開發流程，形成了“用AI設計AI芯片”的閉環。

從產業部署節奏看，Jalapeño並非一次性的實驗品，而是被定位為多代計算路線圖的開篇之作。雙方的計劃相當激進：從2026年晚些時候開始，將這批處理器以吉瓦（gigawatt）級別的電力規模進行實際部署。吉瓦級部署意味著數萬個乃至更多加速器組成的大型集群，這直接對標了當前超大規模雲服務商建設AI數據中心的力度，也透露出OpenAI對未來推理算力需求的巨大預期。

對博通而言，這筆合作進一步鞏固了其在定製AI芯片（ASIC）領域的領先地位。博通早已不是單純的通信芯片公司，其半導體解決方案部門已為多家雲巨頭提供定製化AI加速器設計服務。拿下OpenAI這一關鍵客戶，不僅意味著可觀的訂單量，更是在與Marvell等同樣角逐定製AI芯片市場的對手的競爭中，贏得了一個標誌性的技術背書。

從更宏觀的視角看，Jalapeño的出現是AI產業垂直整合趨勢加劇的又一力證。當模型能力逐漸趨同，推理成本與效率就成為商業化的勝負手。頭部模型公司不再滿足於等待通用芯片廠商的迭代節奏，轉而親自下場定義硬件，以求在性能、功耗與成本之間取得最貼合自身模型的最優解。這一趨勢將持續考驗傳統GPU廠商的護城河，也為半導體供應鏈上的設計工具、先進封裝與高帶寬內存等環節帶來新的需求變量。

當然，任何新芯片從測試數據走向大規模生產部署都面臨良率、供應鏈與軟件生態等現實挑戰。Jalapeño能否在2026年如期實現吉瓦級落地，以及其實際表現是否真能兌現早期測試的能效承諾，將是市場後續關注的焦點。

OpenAI聯手博通發佈AI加速器“Jalapeño”，專攻大模型推理

延伸閱讀

相關深度報道

相關每日新聞