人工智能基礎設施的競賽正從軟件模型延伸到最底層的硅片。OpenAI與博通(Broadcom)在6月24日正式揭開了雙方合作的首款定製AI加速器“Jalapeño”的面紗,這款芯片從設計之初就只為一個目的服務:更高效地運行大語言模型(LLM)的推理任務。
據披露,Jalapeño芯片的研發週期僅為九個月,在芯片行業堪稱極速。它並非對現有設計的修修補補,而是從零開始的全新架構,核心設計理念圍繞三個維度展開:優化內存數據搬運、提升網絡互聯效率以及更精細地調度計算資源。早期內部測試數據表明,在與當前業界頂尖的同類產品對比時,Jalapeño的每瓦性能將取得顯著領先,這在電力成本日益成為AI算力瓶頸的當下,是一個極具殺傷力的指標。
這次發佈背後,是OpenAI基礎設施戰略的一次根本性轉向。過去,這家公司主要依賴外部採購的通用GPU來訓練和運行其模型。而Jalapeño的誕生,意味著OpenAI開始走向全棧整合——將模型研發與底層硬件設計深度綁定。憑藉其對自身大模型內核運算特徵與未來模型架構需求的深刻理解,OpenAI得以向博通提出高度定製化的架構需求,目標直指讓AI服務變得更快、更可靠、更便宜。一個值得注意的細節是,在Jalapeño的設計與優化過程中,團隊本身也利用了AI模型來加速芯片開發流程,形成了“用AI設計AI芯片”的閉環。
從產業部署節奏看,Jalapeño並非一次性的實驗品,而是被定位為多代計算路線圖的開篇之作。雙方的計劃相當激進:從2026年晚些時候開始,將這批處理器以吉瓦(gigawatt)級別的電力規模進行實際部署。吉瓦級部署意味著數萬個乃至更多加速器組成的大型集群,這直接對標了當前超大規模雲服務商建設AI數據中心的力度,也透露出OpenAI對未來推理算力需求的巨大預期。
對博通而言,這筆合作進一步鞏固了其在定製AI芯片(ASIC)領域的領先地位。博通早已不是單純的通信芯片公司,其半導體解決方案部門已為多家雲巨頭提供定製化AI加速器設計服務。拿下OpenAI這一關鍵客戶,不僅意味著可觀的訂單量,更是在與Marvell等同樣角逐定製AI芯片市場的對手的競爭中,贏得了一個標誌性的技術背書。
從更宏觀的視角看,Jalapeño的出現是AI產業垂直整合趨勢加劇的又一力證。當模型能力逐漸趨同,推理成本與效率就成為商業化的勝負手。頭部模型公司不再滿足於等待通用芯片廠商的迭代節奏,轉而親自下場定義硬件,以求在性能、功耗與成本之間取得最貼合自身模型的最優解。這一趨勢將持續考驗傳統GPU廠商的護城河,也為半導體供應鏈上的設計工具、先進封裝與高帶寬內存等環節帶來新的需求變量。
當然,任何新芯片從測試數據走向大規模生產部署都面臨良率、供應鏈與軟件生態等現實挑戰。Jalapeño能否在2026年如期實現吉瓦級落地,以及其實際表現是否真能兌現早期測試的能效承諾,將是市場後續關注的焦點。