週三,美國芯片股遭遇劇烈拋售,費城半導體指數(SOX) 單日跌幅約 5%,成為市場焦點。英偉達(NVIDIA) 下跌約 1.7%,AMD 跌幅達 5.4%,英特爾(Intel) 更是重挫 7.8%。這一輪下跌的直接導火索,是科技媒體 The Information 的一篇報道:OpenAI 的工程師團隊發現了一系列軟件優化方法,能夠將大語言模型的推理成本削減一半以上。
報道指出,這些優化技術被應用於處理 ChatGPT 的非登錄訪客流量後,所需英偉達 GPU 的數量一度降至僅“幾百塊”,這一數字被該媒體形容為“驚人的少”。儘管具體的技術細節尚未公開,但報道提到了量化、鍵值緩存、批處理以及模型路由等可能的優化方向。這一突破迅速在華爾街引發連鎖反應——投資者開始重新審視一個根本性問題:如果 AI 實驗室能從已部署的芯片中壓榨出數倍的算力,那麼未來對新芯片的採購需求是否會大幅縮水?
此次拋售發生的背景,是半導體板塊剛剛經歷了一個歷史性的季度。在 2026 年第二季度,僅 美光(Micron)、英特爾和 AMD 三家公司就合計增加了約 2 萬億美元的市值,投資者資金從英偉達向其他硬件股輪動。截至 6 月下旬,半導體公司在 標普 500 指數 中的權重已達到創紀錄的 19.7%,幾乎是 2020 年 6 月約 5% 權重的四倍。這意味著,任何有關需求侵蝕的風吹草動,都會對一個高度暴露於芯片情緒的指數產生不成比例的衝擊。
加劇市場壓力的還有來自 Meta 的消息。彭博社 同日報道稱,Meta 正計劃推出雲計算業務,向外部客戶出售 AI 算力。這一舉動可能意味著 Meta 自身的芯片採購需求將放緩——若能將過剩產能轉售給第三方,其繼續大規模激進採購硬件的緊迫性或將降低。
在普跌行情中,博通(Broadcom) 的處境相對複雜。該公司是 OpenAI 定製 AI 推理芯片 “Jalapeño” 的合作伙伴,這款芯片專為大語言模型工作負載從頭設計,計劃於 2026 年底開始部署到數據中心。這種合作關係為博通提供了一種潛在的對沖手段,使其在面對純 GPU 需求消退的擔憂時,比競爭對手多了一層緩衝。
從 OpenAI 自身的財務狀況來看,效率提升具有直接且重大的意義。截至 2026 年第一季度末,該公司的毛利率為 39%,雖較去年同期的 33% 有所提升,但距離其設定的年底前達到 52% 的目標仍有很大差距。要實現這一目標,OpenAI 在年內剩餘月份的平均毛利率需達到 56%。推理成本的大幅削減有望顯著縮小這一差距,但公司尚未公開表態是會將節省下來的成本轉化為利潤,還是通過降低 API 價格或提高查詢上限的方式讓利給客戶。
這一效率突破的消息傳出之際,OpenAI 正處於機密 IPO 進程中,已於 2026 年 5 月向監管機構提交了 S-1 文件。此前已有報道暗示該公司可能推遲上市,若毛利率改善的軌跡不及預期,將為推遲時間表提供更多理由;反之,若下半年毛利率能強勁向目標靠攏,則將有力支撐其面向潛在投資者的估值敘事。
展望未來,Jalapeño 芯片 在 2026 年底的部署將成為一次實戰檢驗,驗證軟件優化與定製 ASIC 的結合能否在規模化層面系統性地降低英偉達在推理領域的份額。對於芯片投資者而言,週三的拋售究竟是市場對 AI 硬件需求的一次持久性重估,還是對一個此前看似堅不可摧的板塊尾部風險的一次性重新定價,將是未來數月需要持續觀察的核心命題。