是什麼
規模定律(Scaling Law)是關於大模型的一條經驗規律:模型的性能,會隨 參數量、訓練數據量、投入算力 三者的增長而可預測地提升,通常呈冪律關係。換句話說,在方法不變的前提下,把模型做得更大、喂更多數據、投更多算力,模型大概率會變得更強——而且強多少,在相當範圍內是可以外推預測的。這一發現,是過去幾年「大力出奇跡」式路線的理論依據。參數量、訓練數據量與訓練算力這三者的真實增長軌跡,可在數據頁 AI 模型規模趨勢 一圖查看。
為什麼重要
規模定律把「模型會不會更強」從難以把握的玄學,變成了一個可以外推的工程問題:投入越多、能力越強,且回報可預期。正因如此,各家實驗室才敢於不斷加碼訓練投入,雲廠商與芯片廠商也據此做出鉅額資本開支決策——這輪 AI 數據中心與算力的狂飆,底層正是對規模定律的信念。與此同時,「預訓練規模定律是否放緩」也成為業界最重要的爭論之一:當單純堆預訓練算力的邊際收益下降,產業開始轉向新的擴展維度,例如讓模型在回答時多「思考」的推理算力。
在 AI 產業鏈中的位置
規模定律處在 AI 產業鏈的 模型 層,卻是貫穿全鏈條的「需求引擎」:正是因為相信「更大規模 → 更強能力」,模型層才會源源不斷地向下拉動 基礎設施、芯片 與 能源 的巨量投入。可以說,規模定律是理解「為什麼每一個成功的應用,都會一路拉動到它下面那座電廠」的理論註腳;而它是否放緩、以及擴展維度如何從預訓練轉向 推理模型,則決定著未來算力需求的形態。