全球智算基礎設施的估值邏輯正在發生根本性轉變。過去三年,資本市場對算力租賃和智算中心的判斷高度依賴GPU持有量和芯片供應稀缺性,但這一粗放模式正面臨邊際報酬遞減的壓力。隨著硬件供應鏈多元化、存量資產折舊壓力加大,以及下游應用端對推理成本的極致敏感,行業被迫從“以資產負債表擴張為導向的硬件軍備競賽”轉向“以資本回報率和每瓦Token生成效率為核心的精細化運營”。
英偉達CEO黃仁勳在GTC 2026大會上提出的Token工廠概念,正從理論走向實踐。軟通動力旗下“北京壹號詞元工廠”已完成點亮,並與頭部大模型公司簽署智算服務協議,率先落地Token分潤模式。這一模式不再簡單按租賃時長或硬件規格收費,而是根據實際產出的Token數量進行分成,將算力提供方與模型使用方的利益更緊密綁定,也倒逼算力服務商優化能效與吞吐效率。
與此同時,定價機制也在發生變革。DeepSeek V4正式版計劃於7月中旬上線,首次引入峰谷定價機制,高峰時段API調用價格將翻倍。這一動態調峰策略意在平滑算力負載、提升整體利用率,也反映出大模型服務商對成本結構的精細化管理需求。對下游應用開發者而言,這意味著需要更主動地規劃推理任務的時序,以控制成本。
行業規模方面,算力租賃市場預計在2026年突破2600億元。競爭焦點正從早期的“認證為王”——即誰能拿到英偉達等廠商的芯片授權——轉向“貨源為王”,即誰能穩定獲取並高效運營大規模算力資源。這一轉變背後,是算力供給端的逐步充裕與需求端對性價比的持續追求。
對AI產業鏈而言,這場變革牽動多層環節。上游芯片廠商面臨客戶採購邏輯從“囤貨”轉向“按需”的挑戰;中游算力服務商必須證明自身的運營效率而非僅靠硬件庫存;下游模型廠商和應用開發者則獲得更靈活的算力成本選項。整個產業的估值敘事,正從稀缺性溢價轉向效率溢價。