OpenAI首席執行官山姆·奧爾特曼近期承認,AI服務的token消耗成本已成為一個“巨大的問題”。據Tom's Hardware報道,這一表態源於企業客戶日益強烈的抱怨——許多公司在採用OpenAI的模型後,發現AI相關支出完全失控,有的甚至在一個季度內就耗盡了原本規劃好的全年AI預算。奧爾特曼的回應表明,這家全球最受矚目的AI公司正面臨來自客戶端的切實壓力,要求其提供更高效、更具性價比的解決方案。

這一問題的核心在於大語言模型的推理成本。每當用戶向GPT-4等模型發送一個請求,背後都需要大量算力進行實時計算,這些算力消耗直接轉化為token費用。對於偶爾使用的個人用戶而言,成本或許尚可接受,但對於將AI深度整合進業務流程的企業來說,持續的API調用會迅速累積出驚人的賬單。部分客戶發現,預算編制時的估算與實際發生的費用之間存在巨大鴻溝,導致AI項目的投資回報率遠低於預期。

OpenAI並非沒有意識到這一挑戰。公司一直在努力通過模型蒸餾、推理優化和推出更便宜的模型版本來降低成本,例如GPT-4o mini的發佈就是為了在保持一定性能的同時大幅降低價格。然而,隨著企業使用場景從簡單的文本生成擴展到複雜的代理任務、長文檔處理和實時數據分析,token消耗量呈指數級增長,單次交互的成本壓縮難以抵消用量激增帶來的總支出膨脹。

從產業角度看,這一現象揭示了AI商業化進程中的一個核心矛盾:模型能力越強,應用前景越廣闊,但若使用成本無法與創造的價值相匹配,大規模部署就會受阻。在黃仁勳提出的“五層蛋糕”框架中,這直接衝擊了最上層的“應用”層——如果企業無法從AI應用中獲得正向的經濟回報,整個產業鏈從底層的能源、芯片到中間的基礎設施和模型層的增長敘事都將受到質疑。

值得注意的是,OpenAI面臨的成本壓力並非孤例。谷歌、微軟、亞馬遜等雲巨頭在推廣自家AI服務時,同樣需要向客戶證明其成本效益。整個行業正在從單純追求模型性能的“軍備競賽”,轉向更務實的“性價比競賽”。未來,誰能在大幅降低推理成本的同時保持模型能力,誰就能在企業市場佔據先機。對於投資者而言,這不僅是OpenAI一家公司的問題,更是衡量整個生成式AI產業能否從技術炒作走向可持續商業變現的關鍵指標。