过去十几年,AI 之所以突飞猛进,底层是三件东西在指数级变大:训练用的算力、模型的参数量、喂进去的数据量。 这也是「规模定律」和这轮 AI 资本开支狂飙的底层逻辑。下图收录了 527 个知名 AI 模型——单看训练算力,从最早的神经网络到当下的前沿大模型,已增长约 25 个数量级(10²⁵ 倍)。 以下只陈述已公开的客观数据,不预测、不构成任何投资建议。

训练算力趋势

训练一个模型消耗的总计算量(浮点运算次数,10^15 FLOP = 1 petaFLOP)。纵轴为对数刻度——每上一格代表大 10 倍。最新的前沿模型训练算力已达约 5.0×10¹¹ petaFLOP 量级。

每个点为一个知名 AI 模型,横轴=发布年份、纵轴=训练算力(对数轴,单位 petaFLOP=10¹⁵ 次浮点运算),按应用领域着色;共 527 个模型。

参数量趋势

模型的可训练参数数量——参数越多,模型「容量」通常越大。按开发方类型(产业界 / 学术界 / 产学合作)着色,可见近年前沿被产业界主导。

每个点为一个知名 AI 模型,纵轴=可训练参数量(对数轴),按开发方类型着色;共 702 个模型。

训练数据量趋势

训练数据集的样本 / token 规模——喂进模型的样本 / token 规模。数据量与算力、参数量一同增长,是规模定律的第三根支柱。

每个点为一个知名 AI 模型,纵轴=训练数据集规模(对数轴,样本 / token 数),按应用领域着色;共 659 个模型。

训练算力纪录:历年刷新前沿的模型

下表为在其发布时刷新「已知最高训练算力」纪录的模型(按算力升序刷新),倒序展示最近 12 个纪录。

年份	模型	领域	训练算力(petaFLOP)
2025	Grok 4	多领域	5.0×10¹¹
2025	GPT-4.5	多领域	3.8×10¹¹
2025	Grok 3	多领域	3.5×10¹¹
2023	Gemini 1.0 Ultra	多领域	5.0×10¹⁰
2023	GPT-4 (Jun 2023)	多领域	2.1×10¹⁰
2022	Minerva (540B)	语言	2.7×10⁹
2022		语言	2.6×10⁹
2021	FLAN 137B	语言	2.1×10⁹
2021	Jurassic-1-Jumbo	语言	3.7×10⁸
2020	GPT-3 175B (davinci)	语言	3.1×10⁸
2020	Meena	语言	1.1×10⁸
2019	AlphaStar	游戏	1.1×10⁸

延伸阅读

词条规模定律 Scaling Law 数据四大云厂 AI 资本开支数据AI 研究产出(论文与专利) 股市AI 股市面板(算力→芯片→英伟达)

数据来源:Epoch AI「Notable AI models」数据集(CC BY 4.0), 经 Our World in Data 整理。原始数据页: 训练算力 · 参数量 · 训练数据量。数据于 2026-07-01 抓取,慢数据(约年度更新)、定期刷新;各图纵轴均为对数刻度。本页仅客观呈现已公开数据,不预测、不构成任何投资建议。