OpenAI 首款定製芯片 Jalapeño 曝光：專攻 LLM 推理，博通與臺積電聯手

OpenAI與博通合作定製ASIC芯片，旨在降低第三方硬件帶來的高昂基礎設施成本。

OpenAI 正試圖從根本上改變其成本結構。這家以 ChatGPT 聞名的公司，過去一年在服務器運營上燒掉了 84 億美元，而隨著每週活躍用戶攀升至 9 億，今年的運營成本預計將飆升至約 140 億美元。面對如此巨大的基礎設施開支，OpenAI 不再滿足於僅僅依賴第三方硬件，而是推出了其首款定製芯片——Jalapeño。

這款被稱為“智能處理器”的芯片，並非通用型 AI 加速器，而是專門為大語言模型（LLM）推理任務設計。其核心架構由 OpenAI 根據自身模型路線圖和服務系統量身打造，旨在解決交互式 LLM 服務中常見的數據移動瓶頸。具體分工上，博通負責硅工程與高性能網絡集成，並將自家的 Tomahawk 網絡芯片直接融入設計，使處理器能在龐大的集群化數據中心環境中高效通信。物理製造則由臺積電在臺灣完成，Celestica 負責構建最終的板卡和機架系統。

OpenAI 硬件項目負責人 Richard Ho 指出，該架構通過最小化數據移動，力求將實際利用率推向理論峰值性能。與那些從傳統 AI 工作負載改造而來的通用加速器不同，Jalapeño 在計算、內存和網絡資源之間實現了精確平衡。早期實驗室樣片已經在包括一款未發佈的 GPT-5.3-Codex-Spark 模型在內的前沿工作負載上，以目標頻率和功耗穩定運行。

這一舉動背後是殘酷的財務現實。目前，高端 AI 處理器的霸主英偉達享有約 75% 的利潤率，而 OpenAI 在扣除龐大的運營費用後，每賺取 1 美元僅能保留約 33 美分的利潤。為了支撐未來的算力需求，OpenAI 已承諾在未來八年內投入約 1.4 萬億美元，這對於一家目前年收入為 250 億美元的公司而言，是一場豪賭。Jalapeño 芯片正是試圖打破這一局面、將命運掌握在自己手中的關鍵棋子。

通過涉足定製硅片，OpenAI 正從一家軟件層公司轉變為垂直整合的基礎設施公司。這種全棧策略覆蓋了從芯片架構、軟件內核、內存系統、網絡調度到最終應用層的整個鏈條。類似於蘋果將自有硬件與 iOS 緊密耦合的模式，OpenAI 現在可以根據其精確的內部模型路線圖來優化基礎設施。這形成了一個持續的運營飛輪：更高的基礎設施效率降低了訓練和服務的成本，更經濟的服務帶來更好的產品體驗，從而推動用戶量和收入增長，這些收入又可重新投入到下一代定製基礎設施的研發中。

OpenAI 總裁兼聯合創始人 Greg Brockman 表示：“Jalapeño 是我們長期全棧基礎設施戰略的一部分，旨在讓算力更加充裕。通過自己設計更多技術棧，我們可以更高效地提供更多智能。”

儘管前景誘人，OpenAI 在自研芯片領域卻是個後來者。谷歌自 2015 年起部署張量處理器（TPU），如今已掌控英偉達供應鏈之外約四分之一的全球 AI 算力；亞馬遜已出貨超過 100 萬顆定製芯片；Meta 和微軟也在持續擴展其自有基礎設施。為了追趕近十年的差距，OpenAI 大幅壓縮了開發週期。Jalapeño 芯片從一張白紙到完成製造流片——即物理生產前的最後一步——僅用了 9 個月。工程團隊實現這一速度的秘訣之一，是利用 OpenAI 自家的語言模型來自動化和優化部分硬件設計流程，形成了一個獨特的反饋閉環：當前服務於用戶的模型，正被用於構建運行未來模型版本的物理基礎設施。

首批 Jalapeño 芯片部署到數據中心的時間點定在 2026 年底。博通首席執行官 Hock Tan 確認，將與包括微軟在內的基礎設施合作伙伴一起擴展部署規模，為吉瓦級數據中心集成做準備。這一時間表意味著，在未來幾年內，AI 算力市場的競爭將從模型層進一步向下延伸至芯片層，而 OpenAI 的入場無疑將加劇這場競賽的激烈程度。

OpenAI 首款定製芯片 Jalapeño 曝光：專攻 LLM 推理，博通與臺積電聯手

延伸閱讀

相關深度報道

相關每日新聞