上半年,企業AI消費領域掀起了一股“Token最大化”風潮,MetaSalesforce等公司主動鼓勵員工大量消耗AI Token以提升生產力。Meta內部甚至推出了名為“克勞德經濟學”的排行榜,追蹤前250名重度用戶,數據顯示其員工在30天內消耗了超過60萬億個Token,單個最高消耗用戶約達2800億個Token。員工為爭奪“Token傳奇”等稱號,甚至讓AI代理進行無意義的研究來“燒Token”。隨後,Uber因在四個月內耗盡Claude CodeCodex的全年預算而登上頭條,隨即對員工實施每月1500美元的使用上限。

然而,SemiAnalysis團隊在Databricks AI峰會上實地調研,並與超過50家企業客戶深度交流後,得出了與媒體敘事截然不同的結論。該機構認為,媒體的報道嚴重誇大了問題的普遍性,Meta和Uber的極端案例根源在於激勵機制失當和內部管理鬆弛,而非企業AI投入整體失控。

真實支出數據更溫和

SemiAnalysis援引Ramp的消費數據顯示,企業AI支出呈現高度分化。前1%的頭部客戶每位員工年均AI支出約9萬美元,前10%約為7300美元,而Ramp客戶的中位數僅為136美元。即便是《財富》500強媒體類客戶,人均AI支出仍遠低於100美元。以“燒Token大戶”Meta為例,按標價計算每年每位員工花費接近5萬美元,但據SemiAnalysis估算,這僅佔Anthropic客戶收入的3%至5%。Anthropic自身文檔也印證了這一點:Claude Code開發者月均支出僅150至250美元,僅10%的用戶日均花費超過30美元。

這些數據表明,企業AI採用仍處在不均勻擴散階段,並非所有員工都在高頻調用大模型,很多公司只是少數團隊和崗位先跑起來。

預算管控標準五花八門

調研顯示,大多數受訪企業已對AI使用設置硬性上限,但標準差異極大,並無行業共識。低端案例包括:美國排名前三的航空航天與國防制造商設定每人每月250美元上限,部分重度用戶首月四天即耗盡額度;全球最大製藥公司之一設定每人每月500美元,特殊情況可申請1000美元。高端案例中,WorkdayStripe的員工月度預算約2000美元;一家上市網絡安全公司為初級員工設定每月800美元,高級員工1600至4000美元,數據科學家獲最高額度。

預算設定邏輯也各有不同。一家美國三大航空公司之一的做法最為特殊:Token分配直接與具體項目及預期營收掛鉤。例如,一個預期營收1000萬美元的項目,財務團隊批准100萬美元總支出預算,團隊再自行決定其中多少比例用於Token,AI成本被納入項目財務模型,而非單獨的IT預算。

員工“省Token”策略興起

預算壓力倒逼出了一套實用的Token節約策略。最典型的是“Copilot套利”:微軟365企業版訂閱用戶可免費無限使用標準Copilot聊天機器人,且該使用量不計入月度AI預算。一家大型荷蘭消費品與健康科技公司明確表示,員工會先用Copilot草擬和整合創意,再調用Claude或Codex處理最終任務,以此節約計量Token。

模型降級也是常見手段。一家全球旅遊科技公司已將所有員工的Claude默認模型從Opus切換為Sonnet,Opus仍可使用但需主動選擇。前述航空航天與國防制造商則直接關閉了Opus 4.8和快速模式。SemiAnalysis團隊對此點評稱,管理層認為給員工更大的Token預算會促使他們自動化那些根本不該自動化的任務,這種反自動化觀點過於天真。

便宜Token需求仍在增長

預算管理並不等於減少調用,企業更關心的是單位成本。前沿模型和開源模型Token-as-a-Service/API端點市場都在增長。AWS Bedrock被納入測算後,SemiAnalysis對AWS本季度整體增長率的估計高於市場預期。TogetherFireworksBaseten等TaaS供應商合計年經常性收入已超過40億美元。這說明企業預算壓力會改變採購結構,能用便宜模型解決的問題就不會一直調用最貴模型,默認模型被降級不代表AI使用減少,而是成本曲線被重新優化。

編碼仍是核心驅動力

編碼場景仍是當前AI收入最大的驅動力,OpenAIAnthropic70%的年經常性收入來自這一方向。Anthropic的B2B佔比超90%,決定了其收入結構對企業端的依賴更深,也更穩定。下一波增長被認為將來自網絡安全和白領知識工作。當前大多數財富500強企業的人均AI支出仍遠低於2000美元/年,主要集中在工程和數據科學部門,這意味著AI在企業中的普及仍處於早期階段,增長空間並未消失,只是從“隨意燒錢”變成了“有預算地持續投入”。

效率提升與產出預期同步上升

AI帶來的效率提升案例真實且顯著。亞馬遜招聘部門藉助AI工具,將初步篩選到團隊安置的流程從6至9個月縮短至3至4個月;一家為85%的《財富》500強提供數據分析服務的公司,過去需要一週完成的工作現在只需幾小時。但效率提升的另一面是產出預期同步上升,有員工坦言原本一週的工作量被壓縮到幾小時,公司卻因此期待她完成更多工作,結果比之前更忙碌。SemiAnalysis指出,Uber、Meta等公司的Token超支事件,根本原因是激勵機制失當和監管鬆懈,而非缺乏高ROI的應用場景。亞馬遜儘管大規模裁員,但因AI工具帶來的效率提升,正在以更快速度招聘新員工,這成為AI作為“人力槓桿”最清晰的註腳。