《華爾街日報》6月11日的報道揭示了一個正在AI產業內部快速發酵的趨勢:越來越多的美國企業和初創公司開始“棄貴選廉”,從OpenAI、Anthropic等價格高昂的閉源模型,轉向來自中國的DeepSeek、智譜AI的GLM等開源模型。這一轉向的核心驅動力是成本——部分企業反饋,在特定場景下,通過動態切換模型,某些AI輔助工作的成本可以降低高達95%。
成本壓力的直接體現,是行業巨頭態度的轉變。OpenAI CEO薩姆·奧爾特曼在最近一次內部活動中坦言,成本已經突然成為“一個大問題”。據知情人士透露,OpenAI正在考慮大幅降價,而外界普遍預計其主要競爭對手Anthropic也可能跟進。這對於兩家均已向美國SEC秘密提交潛在IPO文件的公司而言,無疑是一個敏感時刻。如果被迫大幅降價,它們本就龐大的算力支出與虧損可能進一步擴大,實現盈利的時間表將被推遲。
報道中列舉了多個具體案例,勾勒出企業如何精打細算地重構自己的模型使用策略。美國AI識別Bug公司Detail的創始人丹·羅賓遜表示,他已將公司約90%的工作負載從Anthropic的Claude和谷歌的Gemini,遷移到了自家定製模型以及中國的GLM模型上。他的邏輯很直接:一旦找到運行良好且工程師喜歡的模型,就想辦法讓成本可控,而目前開源模型的資源非常豐富。
另一家AI助手初創公司Lindy的實踐更具說服力。該公司兩個月前開始測試DeepSeek的V4模型,其創始人Flo Crivello稱,在處理收件箱、日曆管理、郵件草擬和會議轉錄等日常任務上,DeepSeek的表現與Anthropic的Sonnet相當,但成本僅約為後者的十分之一,僅此一項就為公司節省了數百萬美元。
這種成本差異在token計價層面顯得尤為懸殊。報道指出,Anthropic 6月9日發佈的新模型Claude Fable 5,每token價格是DeepSeek V4 Pro的50倍以上。在簡單任務中,使用DeepSeek的成本僅約為閉源模型的2%。哥倫比亞大學工程學院副院長Vishal Misra的評論點出了這一變化的本質:“你不需要一個懂量子引力的模型。開源模型能力已經非常強,高額AI溢價的空間將減小。”
開源模型的份額增長數據也印證了這一趨勢。AI開發平臺Vercel的數據顯示,DeepSeek在該平臺上的AI使用份額從4月的不足1%激增至5月的17%。在AI路由平臺OpenRouter上,自5月中旬以來,DeepSeek的市場份額一直佔據第一。該平臺還指出,從2025年秋到2026年春,其高消費客戶群中開源模型token使用量增長速度是閉源模型的4倍,已有超過500家機構從專有模型切換到開源模型。
不過,這並不意味著閉源模型的護城河已經消失。研究人員指出,OpenAI、Anthropic或谷歌的頂級閉源模型在複雜任務上仍領先開源競品約4-6個月。在某些情況下,閉源模型可以用更少token完成任務,從而平衡綜合使用成本。Anthropic發言人也強調,企業越來越多地按“每任務價格”而非單個token成本來評估模型,且Anthropic本身也提供價格更低的模型版本。
面對開源模型的衝擊,科技巨頭們並非無動於衷。微軟上週推出了一系列小型AI模型,強調其運行效率更高。英偉達也推出了較便宜的Nemotron模型系列,並投資了開源AI初創公司Reflection。這些動作顯示,即便是在閉源陣營內部,降低成本、提供更具性價比的選擇也已成為明確的戰略方向。
企業實際採用的策略正演變為一種“混合模式”:日常任務使用開源模型,複雜任務則留給閉源旗艦模型。智能路由工具的普及讓這種精打細算的方式更容易實施。前谷歌雲AI負責人Andrew Moore形容道,如今的AI變得非常“節約”和“精打細算”,它們完全知道如何用最便宜的模型完成任務,只有遇到難題時,才會臨時切換到價格更高、能力更強的模型。
這場由成本驅動的模型選擇變遷,其影響遠不止於幾家公司的財務報表。它可能從根本上改變AI基礎設施的投資邏輯、模型商業化的定價模式,以及企業級AI應用的普及速度。Citadel Securities本週發佈的報告也顯示AI支出指數近期出現下降,並指出即使最先進的技術,也必須經歷成本曲線、產能限制和邊際收益的考驗。OpenAI認為自己仍有優勢,過去一年投入巨資鎖定了遠低於市場的算力資源,這或許能支撐其在價格戰中堅持更久。但隨著開源模型能力的持續提升,閉源模型能否依靠性能優勢維持溢價,將是未來一年較大的懸念。可以確定的是,AI價格戰才剛剛開始。