人工智能產業正在經歷一場靜默但意義深遠的消費模式轉變。過去兩年,企業爭先恐後地將生成式AI整合進業務流程,普遍的做法是直接調用市場上能力最強、也最昂貴的大語言模型,例如OpenAI的GPT-4系列或Anthropic的Claude系列。然而,隨著AI賬單日益膨脹,一種更為精明的策略——“模型路由”開始進入主流視野,並可能重塑整個AI產業鏈的價值分配。

CNBC的報道揭示了這一趨勢的核心邏輯。模型路由,簡單來說,就是由一個智能調度層對用戶輸入的查詢進行實時分析,判斷其複雜程度,然後將其導向最合適的模型。一個簡單的客戶服務問題,比如“我的訂單什麼時候發貨?”,可能只需要一個輕量級、成本極低的模型就能完美處理。而一個複雜的代碼生成或法律文件分析任務,才會被路由到像Claude或GPT-4這樣的頂級模型。這意味著,企業不再為所有任務支付“頂配”價格。

這種轉變的直接後果是,企業的AI推理成本有望顯著下降。報道中引述的行業觀點認為,通過路由,超過80%的日常查詢可由較小的開源或專用模型處理,僅將不到20%的高難度任務留給旗艦模型。這相當於將原本全部按米其林三星標準付費的餐食,改為大部分時間吃營養均衡且價格合理的家常菜,只在特殊場合才享用大餐。

對於AI模型的供應商而言,這無疑是一個需要嚴肅對待的信號,尤其對OpenAI和Anthropic這類以提供最前沿、高定價模型為核心商業模式的初創公司。它們的收入增長高度依賴於客戶持續、大規模地使用其最昂貴的模型。如果模型路由成為行業標準,客戶對頂級模型的調用量增速可能會顯著放緩,即便AI的整體使用量仍在激增。這將對它們的營收增長敘事和估值邏輯構成直接挑戰。

黃仁勳提出的“五層蛋糕”框架來看,這一變化主要發生在應用層模型層的交界處,但其影響會迅速向上傳導。在應用層,企業找到了優化成本、提高AI投資回報率的有效手段,這會加速AI在更廣泛商業場景中的落地,從長遠看有利於擴大整個市場的蛋糕。但在模型層,競爭格局將變得更加複雜。一方面,頂級閉源模型的提供商需要證明,其高昂的價格對應著不可替代的、解決最困難問題的獨特能力,從而在“路由”體系中穩固其作為最終決策者的地位。另一方面,像Google、Meta和Mistral AI等提供多層次、多尺寸模型矩陣的廠商,以及託管著大量開源模型的雲平臺,可能會成為這一趨勢的受益者,因為它們能提供構建路由體系所需的“彈藥庫”——從廉價小模型到強大前沿模型的全光譜選擇。

更深一層看,模型路由的普及還可能對基礎設施層的算力需求結構產生影響。如果大量簡單任務被分流到可以在更廉價、更低端硬件上高效運行的小模型,那麼對最尖端、供應緊張的GPU(如英偉達的H100/H200系列)的增量需求,其增長速度或許會從“瘋狂”迴歸到“強勁”。當然,這並不意味著算力總需求會下降,恰恰相反,更低的推理成本會催生更多全新的應用場景,帶來海量的長尾推理需求,但這部分需求將更多地由不同等級的芯片共同滿足,而非僅僅依賴金字塔尖的那一小部分。

報道也點出了這一趨勢背後的一個關鍵假設:路由技術本身必須足夠智能和可靠,能夠準確判斷任務難度,避免將複雜問題錯誤地交給能力不足的小模型,導致用戶體驗崩潰。目前,包括多家初創公司和雲服務商在內的玩家正在積極研發和提供此類路由解決方案,其成熟度將決定這場成本革命推進的速度。

總而言之,模型路由並非一個簡單的技術修補,它標誌著AI產業正從“不惜代價追求最強性能”的狂熱實驗階段,邁向“精打細算、追求商業可持續性”的理性落地階段。對於投資者而言,這提醒我們需要更細緻地審視AI價值鏈上不同環節的議價能力和增長驅動力。模型廠商的護城河,將不僅在於能否訓練出最強的模型,更在於能否構建一個難以被路由策略繞開的、不可或缺的價值生態。