規模定律 Scaling Law · 百科

是什麼

規模定律（Scaling Law）是關於大模型的一條經驗規律：模型的性能，會隨 參數量、訓練數據量、投入算力 三者的增長而可預測地提升，通常呈冪律關係。換句話說，在方法不變的前提下，把模型做得更大、喂更多數據、投更多算力，模型大概率會變得更強——而且強多少，在相當範圍內是可以外推預測的。這一發現，是過去幾年「大力出奇跡」式路線的理論依據。參數量、訓練數據量與訓練算力這三者的真實增長軌跡，可在數據頁 AI 模型規模趨勢 一圖查看。

為什麼重要

規模定律把「模型會不會更強」從難以把握的玄學，變成了一個可以外推的工程問題：投入越多、能力越強，且回報可預期。正因如此，各家實驗室才敢於不斷加碼訓練投入，雲廠商與芯片廠商也據此做出鉅額資本開支決策——這輪 AI 數據中心與算力的狂飆，底層正是對規模定律的信念。與此同時，「預訓練規模定律是否放緩」也成為業界最重要的爭論之一：當單純堆預訓練算力的邊際收益下降，產業開始轉向新的擴展維度，例如讓模型在回答時多「思考」的推理算力。

在 AI 產業鏈中的位置

規模定律處在 AI 產業鏈的模型層，卻是貫穿全鏈條的「需求引擎」：正是因為相信「更大規模 → 更強能力」，模型層才會源源不斷地向下拉動 基礎設施、芯片與能源的巨量投入。可以說，規模定律是理解「為什麼每一個成功的應用，都會一路拉動到它下面那座電廠」的理論註腳；而它是否放緩、以及擴展維度如何從預訓練轉向 推理模型，則決定著未來算力需求的形態。

常見問題

什麼是規模定律（Scaling Law）？

規模定律指大模型的性能會隨三個要素——參數量、訓練數據量、投入的算力——的增長而「可預測地」持續提升，通常呈冪律關係。它意味著：只要持續加大規模，模型大概率會變得更強。這一經驗規律是過去幾年「大力出奇跡」路線的理論依據。

為什麼規模定律重要？

它把「模型會不會更強」從玄學變成了可外推的工程問題，直接支撐了各家不斷加大訓練投入的決策，也是這輪 AI 數據中心與芯片資本開支狂飆的底層邏輯——投入被認為能換來可預期的能力提升。

規模定律會失效嗎？

業界一直在討論「預訓練規模定律是否放緩」。即便單純堆預訓練算力的邊際收益下降，產業也在轉向新的擴展維度——例如推理階段的「思考」算力（見推理模型）——因此「規模」的含義在演化，而非簡單終結。這也是理解模型層技術路線之爭的一把鑰匙。

是什麼

為什麼重要

在 AI 產業鏈中的位置

常見問題

參考來源

相關新聞

相關條目