過去十幾年,AI 之所以突飛猛進,底層是三件東西在指數級變大:訓練用的算力、模型的參數量、喂進去的數據量。 這也是「規模定律」和這輪 AI 資本開支狂飆的底層邏輯。下圖收錄了 527 個知名 AI 模型——單看訓練算力,從最早的神經網絡到當下的前沿大模型,已增長約 25 個數量級(10²⁵ 倍)。 以下只陳述已公開的客觀數據,不預測、不構成任何投資建議。

訓練算力趨勢

訓練一個模型消耗的總計算量(浮點運算次數,10^15 FLOP = 1 petaFLOP)。縱軸為對數刻度——每上一格代表大 10 倍。最新的前沿模型訓練算力已達約 5.0×10¹¹ petaFLOP 量級。

每個點為一個知名 AI 模型,橫軸=發佈年份、縱軸=訓練算力(對數軸,單位 petaFLOP=10¹⁵ 次浮點運算),按應用領域著色;共 527 個模型。

參數量趨勢

模型的可訓練參數數量——參數越多,模型「容量」通常越大。按開發方類型(產業界 / 學術界 / 產學合作)著色,可見近年前沿被產業界主導。

每個點為一個知名 AI 模型,縱軸=可訓練參數量(對數軸),按開發方類型著色;共 702 個模型。

訓練數據量趨勢

訓練數據集的樣本 / token 規模——喂進模型的樣本 / token 規模。數據量與算力、參數量一同增長,是規模定律的第三根支柱。

每個點為一個知名 AI 模型,縱軸=訓練數據集規模(對數軸,樣本 / token 數),按應用領域著色;共 659 個模型。

訓練算力紀錄:歷年刷新前沿的模型

下表為在其發佈時刷新「已知最高訓練算力」紀錄的模型(按算力升序刷新),倒序展示最近 12 個紀錄。

年份	模型	領域	訓練算力(petaFLOP)
2025	Grok 4	多領域	5.0×10¹¹
2025	GPT-4.5	多領域	3.8×10¹¹
2025	Grok 3	多領域	3.5×10¹¹
2023	Gemini 1.0 Ultra	多領域	5.0×10¹⁰
2023	GPT-4 (Jun 2023)	多領域	2.1×10¹⁰
2022	Minerva (540B)	語言	2.7×10⁹
2022		語言	2.6×10⁹
2021	FLAN 137B	語言	2.1×10⁹
2021	Jurassic-1-Jumbo	語言	3.7×10⁸
2020	GPT-3 175B (davinci)	語言	3.1×10⁸
2020	Meena	語言	1.1×10⁸
2019	AlphaStar	遊戲	1.1×10⁸

延伸閱讀

詞條規模定律 Scaling Law 數據四大雲廠 AI 資本開支數據AI 研究產出(論文與專利) 股市AI 股市面板(算力→芯片→英偉達)

數據來源:Epoch AI「Notable AI models」數據集(CC BY 4.0), 經 Our World in Data 整理。原始數據頁: 訓練算力 · 參數量 · 訓練數據量。數據於 2026-07-01 抓取,慢數據(約年度更新)、定期刷新;各圖縱軸均為對數刻度。本頁僅客觀呈現已公開數據,不預測、不構成任何投資建議。