OpenAI 正試圖從根本上改變其成本結構。這家以 ChatGPT 聞名的公司,過去一年在服務器運營上燒掉了 84 億美元,而隨著每週活躍用戶攀升至 9 億,今年的運營成本預計將飆升至約 140 億美元。面對如此巨大的基礎設施開支,OpenAI 不再滿足於僅僅依賴第三方硬件,而是推出了其首款定製芯片——Jalapeño。
這款被稱為“智能處理器”的芯片,並非通用型 AI 加速器,而是專門為大語言模型(LLM)推理任務設計。其核心架構由 OpenAI 根據自身模型路線圖和服務系統量身打造,旨在解決交互式 LLM 服務中常見的數據移動瓶頸。具體分工上,博通負責硅工程與高性能網絡集成,並將自家的 Tomahawk 網絡芯片直接融入設計,使處理器能在龐大的集群化數據中心環境中高效通信。物理製造則由臺積電在臺灣完成,Celestica 負責構建最終的板卡和機架系統。
OpenAI 硬件項目負責人 Richard Ho 指出,該架構通過最小化數據移動,力求將實際利用率推向理論峰值性能。與那些從傳統 AI 工作負載改造而來的通用加速器不同,Jalapeño 在計算、內存和網絡資源之間實現了精確平衡。早期實驗室樣片已經在包括一款未發佈的 GPT-5.3-Codex-Spark 模型在內的前沿工作負載上,以目標頻率和功耗穩定運行。
這一舉動背後是殘酷的財務現實。目前,高端 AI 處理器的霸主英偉達享有約 75% 的利潤率,而 OpenAI 在扣除龐大的運營費用後,每賺取 1 美元僅能保留約 33 美分的利潤。為了支撐未來的算力需求,OpenAI 已承諾在未來八年內投入約 1.4 萬億美元,這對於一家目前年收入為 250 億美元的公司而言,是一場豪賭。Jalapeño 芯片正是試圖打破這一局面、將命運掌握在自己手中的關鍵棋子。
通過涉足定製硅片,OpenAI 正從一家軟件層公司轉變為垂直整合的基礎設施公司。這種全棧策略覆蓋了從芯片架構、軟件內核、內存系統、網絡調度到最終應用層的整個鏈條。類似於蘋果將自有硬件與 iOS 緊密耦合的模式,OpenAI 現在可以根據其精確的內部模型路線圖來優化基礎設施。這形成了一個持續的運營飛輪:更高的基礎設施效率降低了訓練和服務的成本,更經濟的服務帶來更好的產品體驗,從而推動用戶量和收入增長,這些收入又可重新投入到下一代定製基礎設施的研發中。
OpenAI 總裁兼聯合創始人 Greg Brockman 表示:“Jalapeño 是我們長期全棧基礎設施戰略的一部分,旨在讓算力更加充裕。通過自己設計更多技術棧,我們可以更高效地提供更多智能。”
儘管前景誘人,OpenAI 在自研芯片領域卻是個後來者。谷歌自 2015 年起部署張量處理器(TPU),如今已掌控英偉達供應鏈之外約四分之一的全球 AI 算力;亞馬遜已出貨超過 100 萬顆定製芯片;Meta 和微軟也在持續擴展其自有基礎設施。為了追趕近十年的差距,OpenAI 大幅壓縮了開發週期。Jalapeño 芯片從一張白紙到完成製造流片——即物理生產前的最後一步——僅用了 9 個月。工程團隊實現這一速度的秘訣之一,是利用 OpenAI 自家的語言模型來自動化和優化部分硬件設計流程,形成了一個獨特的反饋閉環:當前服務於用戶的模型,正被用於構建運行未來模型版本的物理基礎設施。
首批 Jalapeño 芯片部署到數據中心的時間點定在 2026 年底。博通首席執行官 Hock Tan 確認,將與包括微軟在內的基礎設施合作伙伴一起擴展部署規模,為吉瓦級數據中心集成做準備。這一時間表意味著,在未來幾年內,AI 算力市場的競爭將從模型層進一步向下延伸至芯片層,而 OpenAI 的入場無疑將加劇這場競賽的激烈程度。