规模定律 Scaling Law · 百科

是什么

规模定律（Scaling Law）是关于大模型的一条经验规律：模型的性能，会随 参数量、训练数据量、投入算力 三者的增长而可预测地提升，通常呈幂律关系。换句话说，在方法不变的前提下，把模型做得更大、喂更多数据、投更多算力，模型大概率会变得更强——而且强多少，在相当范围内是可以外推预测的。这一发现，是过去几年「大力出奇迹」式路线的理论依据。参数量、训练数据量与训练算力这三者的真实增长轨迹，可在数据页 AI 模型规模趋势 一图查看。

为什么重要

规模定律把「模型会不会更强」从难以把握的玄学，变成了一个可以外推的工程问题：投入越多、能力越强，且回报可预期。正因如此，各家实验室才敢于不断加码训练投入，云厂商与芯片厂商也据此做出巨额资本开支决策——这轮 AI 数据中心与算力的狂飙，底层正是对规模定律的信念。与此同时，「预训练规模定律是否放缓」也成为业界最重要的争论之一：当单纯堆预训练算力的边际收益下降，产业开始转向新的扩展维度，例如让模型在回答时多「思考」的推理算力。

在 AI 产业链中的位置

规模定律处在 AI 产业链的模型层，却是贯穿全链条的「需求引擎」：正是因为相信「更大规模 → 更强能力」，模型层才会源源不断地向下拉动 基础设施、芯片与能源的巨量投入。可以说，规模定律是理解「为什么每一个成功的应用，都会一路拉动到它下面那座电厂」的理论注脚；而它是否放缓、以及扩展维度如何从预训练转向 推理模型，则决定着未来算力需求的形态。

常见问题

什么是规模定律（Scaling Law）？

规模定律指大模型的性能会随三个要素——参数量、训练数据量、投入的算力——的增长而「可预测地」持续提升，通常呈幂律关系。它意味着：只要持续加大规模，模型大概率会变得更强。这一经验规律是过去几年「大力出奇迹」路线的理论依据。

为什么规模定律重要？

它把「模型会不会更强」从玄学变成了可外推的工程问题，直接支撑了各家不断加大训练投入的决策，也是这轮 AI 数据中心与芯片资本开支狂飙的底层逻辑——投入被认为能换来可预期的能力提升。

规模定律会失效吗？

业界一直在讨论「预训练规模定律是否放缓」。即便单纯堆预训练算力的边际收益下降，产业也在转向新的扩展维度——例如推理阶段的「思考」算力（见推理模型）——因此「规模」的含义在演化，而非简单终结。这也是理解模型层技术路线之争的一把钥匙。

是什么

为什么重要

在 AI 产业链中的位置

常见问题

参考来源

相关新闻

相关条目