中国AI模型的低价策略,正从市场边缘话题演变为可能改写行业竞争规则的结构性力量。瑞银半导体团队分析师Sundeep Gantori近期发布深度报告,对以MiniMax和智谱为代表的中国模型进行了成本拆解,结论指向一个关键事实:价格优势并非补贴虚火,而是根植于训练、推理与基础设施各环节的系统性成本领先。
报告测算显示,中国模型的训练成本不到OpenAI和Anthropic的10%,API调用均价低于美国同类产品的20%。但更具颠覆性的数据在于利润率——中国模型的毛利率约在20%-40%之间,与美国同行基本持平。这意味着低价并未牺牲商业可持续性,反而揭示出截然不同的成本结构。
成本差距首先体现在训练阶段。中国模型的参数规模普遍更小,例如DeepSeek V4总参数量为1.6万亿,Kimi K2.6约1万亿,而业界估算Claude Opus 4.6和GPT-5.5的参数量分别约为10万亿和5万亿。参数少直接降低了训练所需的计算量。更关键的差异在于技术路径选择:中国模型广泛采用稀疏注意力机制,让每个token仅与部分相关token交互,大幅压缩长上下文训练的计算消耗。DeepSeek V3.2搭载自研稀疏注意力设计,V4进一步加入上下文压缩。在计算精度上,中国模型也走在前列,DeepSeek-V3率先引入FP8混合精度训练,V4更采用FP4量化感知训练,而百度ERNIE 4.5/5.0与阿里Qwen3.5均已跟进。
基础设施层面,中国的电力成本优势显著。美国主要数据中心州平均电价约7.9美分/度,中国可比地区约4.4美分/度,低约44%。这直接拉低了GPU租用价格:美国市场Nvidia H100租用成本约1.99-3.99美元/GPU小时,中国约1.3-2.1美元/GPU小时,低约40%。三层成本优势叠加,使中国模型的低价具有结构性支撑,而非短期营销行为。
推理端的成本控制更为激进。中国模型普遍采用混合专家架构(MoE),且激活参数比例远低于美国同行。美国MoE模型通常激活总参数的15%-30%,而中国领先模型仅激活约3%-10%。DeepSeek从V3.2到V4 Pro,活跃参数比从约5%降至约3%,但模型智能指数反而从42升至52。此外,KV缓存压缩技术将多轮对话中占推理成本约70%的缓存输入成本大幅削减,DeepSeek V4在百万token上下文长度下仅需V3.2约10%的KV缓存。在服务编排上,P/D分离与持续批处理技术进一步提升了GPU利用率,MiniMax通过端到端基础设施优化,实现了超过75%的模型算力利用率,远高于行业平均的40%-50%。这些技术叠加,使推理成本持续压缩,而MiniMax M2.7的毛利率仍超过40%,与Anthropic 2025年约40%的API毛利率基本持平。
成本优势正伴随性能差距的快速收窄而更具市场杀伤力。根据Artificial Analysis的数据,中国前沿模型综合智能从2023年约为美国顶尖模型的60%,升至2025年的约90%。在文本智能上已接近九成水平,多模态与视频生成领域全球前五名中有四个来自中国。更引人注目的是研发投入效率:智谱和MiniMax 2025年研发支出合计约8亿美元,仅为Anthropic的约十分之一。这种高效追赶得益于蒸馏技术与开源生态的集体杠杆效应——当一家实验室验证某种架构或训练方法,其他实验室可直接迭代,无需重复大规模实验,使整个中国AI生态的研发边际成本系统性低于各自为战的美国闭源模型。
企业端对成本压力的反应正在加速这一趋势。Uber在2026年4月耗尽全年AI预算,随即对员工个人AI工具设置每月1500美元token消耗上限;Walmart限制了内部AI智能体的token使用量;软件公司Workato在Anthropic切换至按token计费的首日,支出翻了7倍。OpenAI CEO山姆·奥特曼也公开承认成本已成为客户的“巨大问题”。据报,微软正在评估用DeepSeek替换Copilot中更贵的OpenAI和Anthropic模型,这标志着成本考量已从中小企业蔓延至科技巨头自身的采购决策。
瑞银报告将中国模型的全球扩张路径归纳为三种场景:成本主导场景下,若模型能力趋同且token调用同质化,中国或可复制光伏产业超过80%的全球市占率;性价比场景下,在绝对智能仍稍逊但价格优势明显的中高端以下市场,获取30%-50%的全球份额,这是瑞银的基准预期;性能或生态主导场景下,若美国前沿模型保持明显领先且AI深度嵌入企业工作流,中国份额可能维持在个位数低段至10%以下。报告认为性价比场景更可能成为现实,因为需求将趋于分层——复杂高价值任务仍为顶尖模型支付溢价,而大量高频、ROI敏感的工作负载将流向更便宜的替代品。
高盛交易台负责人Rich Privorotsky近期的分析与此形成呼应。他指出AI板块正面临两股对立力量:更广泛的应用普及推升算力需求,但代币通缩加剧与货币化前景存疑。他援引实验称,由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组合的模型,以约一半成本将性能差距缩小至距顶尖模型不足1%。他将核心矛盾提炼为“价值万亿的问题”:更低的智能成本,究竟创造的需求多,还是摧毁的定价权多?这一问题的答案,将深刻影响当前AI产业数万亿美元市值的合理性,以及中国模型全球扩张的最终边界。地缘政治风险虽是不确定变量,但欧洲、亚洲、中东等地区目前缺乏本地头部基础模型,为中国模型的海外拓展留下了可观空间。