瑞銀拆解中國AI模型成本：低價並非燒錢，毛利率比肩美國同行

瑞銀報告稱中國AI模型訓練成本低於美國10%，API均價低80%，毛利率持平

中國AI模型的低價策略，正從市場邊緣話題演變為可能改寫行業競爭規則的結構性力量。瑞銀半導體團隊分析師Sundeep Gantori近期發佈深度報告，對以MiniMax和智譜為代表的中國模型進行了成本拆解，結論指向一個關鍵事實：價格優勢並非補貼虛火，而是根植於訓練、推理與基礎設施各環節的系統性成本領先。

報告測算顯示，中國模型的訓練成本不到OpenAI和Anthropic的10%，API調用均價低於美國同類產品的20%。但更具顛覆性的數據在於利潤率——中國模型的毛利率約在20%-40%之間，與美國同行基本持平。這意味著低價並未犧牲商業可持續性，反而揭示出截然不同的成本結構。

成本差距首先體現在訓練階段。中國模型的參數規模普遍更小，例如DeepSeek V4總參數量為1.6萬億，Kimi K2.6約1萬億，而業界估算Claude Opus 4.6和GPT-5.5的參數量分別約為10萬億和5萬億。參數少直接降低了訓練所需的計算量。更關鍵的差異在於技術路徑選擇：中國模型廣泛採用稀疏注意力機制，讓每個token僅與部分相關token交互，大幅壓縮長上下文訓練的計算消耗。DeepSeek V3.2搭載自研稀疏注意力設計，V4進一步加入上下文壓縮。在計算精度上，中國模型也走在前列，DeepSeek-V3率先引入FP8混合精度訓練，V4更採用FP4量化感知訓練，而百度ERNIE 4.5/5.0與阿里Qwen3.5均已跟進。

基礎設施層面，中國的電力成本優勢顯著。美國主要數據中心州平均電價約7.9美分/度，中國可比地區約4.4美分/度，低約44%。這直接拉低了GPU租用價格：美國市場Nvidia H100租用成本約1.99-3.99美元/GPU小時，中國約1.3-2.1美元/GPU小時，低約40%。三層成本優勢疊加，使中國模型的低價具有結構性支撐，而非短期營銷行為。

推理端的成本控制更為激進。中國模型普遍採用混合專家架構（MoE），且激活參數比例遠低於美國同行。美國MoE模型通常激活總參數的15%-30%，而中國領先模型僅激活約3%-10%。DeepSeek從V3.2到V4 Pro，活躍參數比從約5%降至約3%，但模型智能指數反而從42升至52。此外，KV緩存壓縮技術將多輪對話中佔推理成本約70%的緩存輸入成本大幅削減，DeepSeek V4在百萬token上下文長度下僅需V3.2約10%的KV緩存。在服務編排上，P/D分離與持續批處理技術進一步提升了GPU利用率，MiniMax通過端到端基礎設施優化，實現了超過75%的模型算力利用率，遠高於行業平均的40%-50%。這些技術疊加，使推理成本持續壓縮，而MiniMax M2.7的毛利率仍超過40%，與Anthropic 2025年約40%的API毛利率基本持平。

成本優勢正伴隨性能差距的快速收窄而更具市場殺傷力。根據Artificial Analysis的數據，中國前沿模型綜合智能從2023年約為美國頂尖模型的60%，升至2025年的約90%。在文本智能上已接近九成水平，多模態與視頻生成領域全球前五名中有四個來自中國。更引人注目的是研發投入效率：智譜和MiniMax 2025年研發支出合計約8億美元，僅為Anthropic的約十分之一。這種高效追趕得益於蒸餾技術與開源生態的集體槓桿效應——當一家實驗室驗證某種架構或訓練方法，其他實驗室可直接迭代，無需重複大規模實驗，使整個中國AI生態的研發邊際成本系統性低於各自為戰的美國閉源模型。

企業端對成本壓力的反應正在加速這一趨勢。Uber在2026年4月耗盡全年AI預算，隨即對員工個人AI工具設置每月1500美元token消耗上限；Walmart限制了內部AI智能體的token使用量；軟件公司Workato在Anthropic切換至按token計費的首日，支出翻了7倍。OpenAI CEO山姆·奧特曼也公開承認成本已成為客戶的“巨大問題”。據報，微軟正在評估用DeepSeek替換Copilot中更貴的OpenAI和Anthropic模型，這標誌著成本考量已從中小企業蔓延至科技巨頭自身的採購決策。

瑞銀報告將中國模型的全球擴張路徑歸納為三種場景：成本主導場景下，若模型能力趨同且token調用同質化，中國或可複製光伏產業超過80%的全球市佔率；性價比場景下，在絕對智能仍稍遜但價格優勢明顯的中高端以下市場，獲取30%-50%的全球份額，這是瑞銀的基準預期；性能或生態主導場景下，若美國前沿模型保持明顯領先且AI深度嵌入企業工作流，中國份額可能維持在個位數低段至10%以下。報告認為性價比場景更可能成為現實，因為需求將趨於分層——複雜高價值任務仍為頂尖模型支付溢價，而大量高頻、ROI敏感的工作負載將流向更便宜的替代品。

高盛交易臺負責人Rich Privorotsky近期的分析與此形成呼應。他指出AI板塊正面臨兩股對立力量：更廣泛的應用普及推升算力需求，但代幣通縮加劇與貨幣化前景存疑。他援引實驗稱，由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro組合的模型，以約一半成本將性能差距縮小至距頂尖模型不足1%。他將核心矛盾提煉為“價值萬億的問題”：更低的智能成本，究竟創造的需求多，還是摧毀的定價權多？這一問題的答案，將深刻影響當前AI產業數萬億美元市值的合理性，以及中國模型全球擴張的最終邊界。地緣政治風險雖是不確定變量，但歐洲、亞洲、中東等地區目前缺乏本地頭部基礎模型，為中國模型的海外拓展留下了可觀空間。

瑞銀拆解中國AI模型成本：低價並非燒錢，毛利率比肩美國同行

延伸閱讀

相關深度報道

相關每日新聞