钛媒体近日刊发巨潮WAVE的深度评论,系统梳理了中美AI竞赛中因高端算力短缺引发的产业困境。文章指出,以Anthropic为代表的美国AI公司已推出参数规模达10万亿的模型Mythos,其训练成本估算高达100亿美元,而中国当前最强模型DeepSeek V4 Pro总参数量为1.6万亿,两者相差约6倍。有研究显示,中国前沿模型能力落后美国约8个月,创新工场董事长李开复在接受采访时更将差距评估为15个月

评论认为,这种代际差的根源在于高端AI训练芯片的缺失。美国科技巨头正进行一场“富裕仗”:Meta计划到2026年底部署超120万张高端GPU,年投入超1450亿美元;谷歌拥有的AI算力相当于500万块英伟达H100,占全球总量四分之一。亚马逊、微软、Alphabet、Meta四家公司今年资本开支高达7250亿美元,同比猛增77%。相比之下,芯片禁令后中国可用高端芯片仅为美国的八分之一,美国数据中心数量是中国10倍有余。据中国信息通信研究院测算,美国算力规模为2400 EFLOPS,中国为1053 EFLOPS,差距超过两倍。

文章进一步分析,AI训练芯片需支撑万亿级参数的动态更新,对计算能力、带宽、通信效率及万卡集群稳定性要求极高,而国产GPU目前主要参与相对边缘的推理任务。例如,字节跳动旗下豆包计划采购天数智芯5万块芯片用于推理运算,但在训练这一算力金字塔顶端,国产芯片仅能承担“打杂”角色。英伟达凭借CUDA生态拥有超400万开发者,全球95%以上的AI模型基于其生态开发,这构成了国产GPU最难逾越的壁垒。

尽管如此,国产替代正在局部突破。华为昇腾910B算力可达640TOPS,接近英伟达A100水平;智谱联合华为昇腾完成了首个依托国产芯片全程训练的SOTA多模态模型GLM-Image;摩尔线程与北京智源研究院基于国产算力集群,成功训练了具身智能大脑模型RoboBrain 2.5。这些案例验证了国产GPU从推理侧向训练侧逐步适配的可行性。

评论最后指出,中国AI产业需在高端芯片进口受阻的现实下,采取“中西结合”两条腿走路的策略,同时给予国产算力芯片足够的资本与政策耐心。文章以韩国存储芯片产业熬过至暗时刻最终击败日本的历史为参照,认为凭借巨大市场、人才储备与资本实力,国产GPU已开始展露适配性,但这场关于国运的AI对弈绝非一朝一夕之功。