OpenAI近期披露的內部數據顯示,其自研AI編程工具Codex在公司各部門的使用強度正經歷指數級攀升,這為外界觀察前沿AI機構如何實際部署自身技術提供了難得的窗口。

根據OpenAI經濟研究團隊的報告,以2025年11月為基準,到2026年6月,內部活躍用戶通過Codex產生的中位輸出token量在不同職能部門均出現大幅增長。其中,研究部門的增幅最為驚人,達到56倍客戶支持部門緊隨其後,增長32倍工程部門增長27倍;即便是增長相對溫和的法務部門,也達到了13倍的水平。

這一數據揭示的趨勢遠不止於“用得更頻繁”。報告指出,Codex的使用模式正從早期的簡單代碼補全,轉向處理更長週期、跨職能的複雜任務。OpenAI內部將其描述為“智能體正在改變每一個部門的工作方式”,暗示Codex已深度嵌入到研究探索、客戶問題解決、工程構建乃至法律文書處理等核心業務流程中,成為執行持久化工作流的關鍵組件。

值得注意的背景是,OpenAI員工一直享有Codex的無限制使用權。然而,直到2025年底,其內部token消耗中僅有不到10%流向Codex,大部分使用仍集中在對話式交互上。這意味著,即便在最懂AI的人群中,深度採用也並非一蹴而就,而是經歷了一個從淺層嘗試到將AI作為核心生產力引擎的“醞釀期”。此次token量的爆發,標誌著這一轉變已跨過關鍵臨界點。

從產業視角看,這一內部數據與當前企業級AI應用的兩大趨勢相呼應。其一,是智能體基礎設施的成熟。近期多家創業公司如Sail(融資8000萬美元)和Hyperagent,均在專門為運行數天甚至數週的長期智能體優化推理成本與沙箱環境,LangChain也提出了區分“通用聊天”與“專用持久化智能體”的框架。OpenAI內部Codex的用法演變,恰好印證了市場對這類長週期、有狀態智能體工具的需求。其二,是評估體系的挑戰。Cursor的研究指出,部分先進模型已能通過檢索互聯網或代碼歷史來“破解”公共基準測試,這使得單純看跑分排名的意義下降。OpenAI內部token消耗的實據,反而成為衡量AI實際生產力更可靠的先行指標。

不過,解讀這一數據時也需保持審慎。內部員工的無限使用權限與高度配合的集成環境,是多數外部企業尚不具備的條件。研究部門56倍的token增長,可能部分源於實驗性質的反覆生成與評估,未必直接等同於56倍的效率提升。但無論如何,這一內部基準為市場提供了關鍵信號:當最前沿的AI實驗室自身開始以指數級速度消耗推理算力時,整個產業的算力需求敘事和AI應用的價值兌現預期,都將獲得新的支撐。