瑞银拆解中国AI模型成本：低价并非烧钱，毛利率比肩美国同行

瑞银报告称中国AI模型训练成本低于美国10%，API均价低80%，毛利率持平

中国AI模型的低价策略，正从市场边缘话题演变为可能改写行业竞争规则的结构性力量。瑞银半导体团队分析师Sundeep Gantori近期发布深度报告，对以MiniMax和智谱为代表的中国模型进行了成本拆解，结论指向一个关键事实：价格优势并非补贴虚火，而是根植于训练、推理与基础设施各环节的系统性成本领先。

报告测算显示，中国模型的训练成本不到OpenAI和Anthropic的10%，API调用均价低于美国同类产品的20%。但更具颠覆性的数据在于利润率——中国模型的毛利率约在20%-40%之间，与美国同行基本持平。这意味着低价并未牺牲商业可持续性，反而揭示出截然不同的成本结构。

成本差距首先体现在训练阶段。中国模型的参数规模普遍更小，例如DeepSeek V4总参数量为1.6万亿，Kimi K2.6约1万亿，而业界估算Claude Opus 4.6和GPT-5.5的参数量分别约为10万亿和5万亿。参数少直接降低了训练所需的计算量。更关键的差异在于技术路径选择：中国模型广泛采用稀疏注意力机制，让每个token仅与部分相关token交互，大幅压缩长上下文训练的计算消耗。DeepSeek V3.2搭载自研稀疏注意力设计，V4进一步加入上下文压缩。在计算精度上，中国模型也走在前列，DeepSeek-V3率先引入FP8混合精度训练，V4更采用FP4量化感知训练，而百度ERNIE 4.5/5.0与阿里Qwen3.5均已跟进。

基础设施层面，中国的电力成本优势显著。美国主要数据中心州平均电价约7.9美分/度，中国可比地区约4.4美分/度，低约44%。这直接拉低了GPU租用价格：美国市场Nvidia H100租用成本约1.99-3.99美元/GPU小时，中国约1.3-2.1美元/GPU小时，低约40%。三层成本优势叠加，使中国模型的低价具有结构性支撑，而非短期营销行为。

推理端的成本控制更为激进。中国模型普遍采用混合专家架构（MoE），且激活参数比例远低于美国同行。美国MoE模型通常激活总参数的15%-30%，而中国领先模型仅激活约3%-10%。DeepSeek从V3.2到V4 Pro，活跃参数比从约5%降至约3%，但模型智能指数反而从42升至52。此外，KV缓存压缩技术将多轮对话中占推理成本约70%的缓存输入成本大幅削减，DeepSeek V4在百万token上下文长度下仅需V3.2约10%的KV缓存。在服务编排上，P/D分离与持续批处理技术进一步提升了GPU利用率，MiniMax通过端到端基础设施优化，实现了超过75%的模型算力利用率，远高于行业平均的40%-50%。这些技术叠加，使推理成本持续压缩，而MiniMax M2.7的毛利率仍超过40%，与Anthropic 2025年约40%的API毛利率基本持平。

成本优势正伴随性能差距的快速收窄而更具市场杀伤力。根据Artificial Analysis的数据，中国前沿模型综合智能从2023年约为美国顶尖模型的60%，升至2025年的约90%。在文本智能上已接近九成水平，多模态与视频生成领域全球前五名中有四个来自中国。更引人注目的是研发投入效率：智谱和MiniMax 2025年研发支出合计约8亿美元，仅为Anthropic的约十分之一。这种高效追赶得益于蒸馏技术与开源生态的集体杠杆效应——当一家实验室验证某种架构或训练方法，其他实验室可直接迭代，无需重复大规模实验，使整个中国AI生态的研发边际成本系统性低于各自为战的美国闭源模型。

企业端对成本压力的反应正在加速这一趋势。Uber在2026年4月耗尽全年AI预算，随即对员工个人AI工具设置每月1500美元token消耗上限；Walmart限制了内部AI智能体的token使用量；软件公司Workato在Anthropic切换至按token计费的首日，支出翻了7倍。OpenAI CEO山姆·奥特曼也公开承认成本已成为客户的“巨大问题”。据报，微软正在评估用DeepSeek替换Copilot中更贵的OpenAI和Anthropic模型，这标志着成本考量已从中小企业蔓延至科技巨头自身的采购决策。

瑞银报告将中国模型的全球扩张路径归纳为三种场景：成本主导场景下，若模型能力趋同且token调用同质化，中国或可复制光伏产业超过80%的全球市占率；性价比场景下，在绝对智能仍稍逊但价格优势明显的中高端以下市场，获取30%-50%的全球份额，这是瑞银的基准预期；性能或生态主导场景下，若美国前沿模型保持明显领先且AI深度嵌入企业工作流，中国份额可能维持在个位数低段至10%以下。报告认为性价比场景更可能成为现实，因为需求将趋于分层——复杂高价值任务仍为顶尖模型支付溢价，而大量高频、ROI敏感的工作负载将流向更便宜的替代品。

高盛交易台负责人Rich Privorotsky近期的分析与此形成呼应。他指出AI板块正面临两股对立力量：更广泛的应用普及推升算力需求，但代币通缩加剧与货币化前景存疑。他援引实验称，由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组合的模型，以约一半成本将性能差距缩小至距顶尖模型不足1%。他将核心矛盾提炼为“价值万亿的问题”：更低的智能成本，究竟创造的需求多，还是摧毁的定价权多？这一问题的答案，将深刻影响当前AI产业数万亿美元市值的合理性，以及中国模型全球扩张的最终边界。地缘政治风险虽是不确定变量，但欧洲、亚洲、中东等地区目前缺乏本地头部基础模型，为中国模型的海外拓展留下了可观空间。

瑞银拆解中国AI模型成本：低价并非烧钱，毛利率比肩美国同行

延伸阅读

相关深度报道

相关每日新闻