中國AI模型的低價策略,正從市場邊緣話題演變為可能改寫行業競爭規則的結構性力量。瑞銀半導體團隊分析師Sundeep Gantori近期發佈深度報告,對以MiniMax智譜為代表的中國模型進行了成本拆解,結論指向一個關鍵事實:價格優勢並非補貼虛火,而是根植於訓練、推理與基礎設施各環節的系統性成本領先。

報告測算顯示,中國模型的訓練成本不到OpenAIAnthropic的10%,API調用均價低於美國同類產品的20%。但更具顛覆性的數據在於利潤率——中國模型的毛利率約在20%-40%之間,與美國同行基本持平。這意味著低價並未犧牲商業可持續性,反而揭示出截然不同的成本結構。

成本差距首先體現在訓練階段。中國模型的參數規模普遍更小,例如DeepSeek V4總參數量為1.6萬億Kimi K2.61萬億,而業界估算Claude Opus 4.6GPT-5.5的參數量分別約為10萬億5萬億。參數少直接降低了訓練所需的計算量。更關鍵的差異在於技術路徑選擇:中國模型廣泛採用稀疏注意力機制,讓每個token僅與部分相關token交互,大幅壓縮長上下文訓練的計算消耗。DeepSeek V3.2搭載自研稀疏注意力設計,V4進一步加入上下文壓縮。在計算精度上,中國模型也走在前列,DeepSeek-V3率先引入FP8混合精度訓練,V4更採用FP4量化感知訓練,而百度ERNIE 4.5/5.0與阿里Qwen3.5均已跟進。

基礎設施層面,中國的電力成本優勢顯著。美國主要數據中心州平均電價約7.9美分/度,中國可比地區約4.4美分/度,低約44%。這直接拉低了GPU租用價格:美國市場Nvidia H100租用成本約1.99-3.99美元/GPU小時,中國約1.3-2.1美元/GPU小時,低約40%。三層成本優勢疊加,使中國模型的低價具有結構性支撐,而非短期營銷行為。

推理端的成本控制更為激進。中國模型普遍採用混合專家架構(MoE),且激活參數比例遠低於美國同行。美國MoE模型通常激活總參數的15%-30%,而中國領先模型僅激活約3%-10%。DeepSeek從V3.2到V4 Pro,活躍參數比從約5%降至約3%,但模型智能指數反而從42升至52。此外,KV緩存壓縮技術將多輪對話中佔推理成本約70%的緩存輸入成本大幅削減,DeepSeek V4在百萬token上下文長度下僅需V3.2約10%的KV緩存。在服務編排上,P/D分離與持續批處理技術進一步提升了GPU利用率,MiniMax通過端到端基礎設施優化,實現了超過75%的模型算力利用率,遠高於行業平均的40%-50%。這些技術疊加,使推理成本持續壓縮,而MiniMax M2.7的毛利率仍超過40%,與Anthropic 2025年約40%的API毛利率基本持平。

成本優勢正伴隨性能差距的快速收窄而更具市場殺傷力。根據Artificial Analysis的數據,中國前沿模型綜合智能從2023年約為美國頂尖模型的60%,升至2025年的約90%。在文本智能上已接近九成水平,多模態與視頻生成領域全球前五名中有四個來自中國。更引人注目的是研發投入效率:智譜和MiniMax 2025年研發支出合計約8億美元,僅為Anthropic的約十分之一。這種高效追趕得益於蒸餾技術開源生態的集體槓桿效應——當一家實驗室驗證某種架構或訓練方法,其他實驗室可直接迭代,無需重複大規模實驗,使整個中國AI生態的研發邊際成本系統性低於各自為戰的美國閉源模型。

企業端對成本壓力的反應正在加速這一趨勢。Uber在2026年4月耗盡全年AI預算,隨即對員工個人AI工具設置每月1500美元token消耗上限;Walmart限制了內部AI智能體的token使用量;軟件公司Workato在Anthropic切換至按token計費的首日,支出翻了7倍。OpenAI CEO山姆·奧特曼也公開承認成本已成為客戶的“巨大問題”。據報,微軟正在評估用DeepSeek替換Copilot中更貴的OpenAI和Anthropic模型,這標誌著成本考量已從中小企業蔓延至科技巨頭自身的採購決策。

瑞銀報告將中國模型的全球擴張路徑歸納為三種場景:成本主導場景下,若模型能力趨同且token調用同質化,中國或可複製光伏產業超過80%的全球市佔率;性價比場景下,在絕對智能仍稍遜但價格優勢明顯的中高端以下市場,獲取30%-50%的全球份額,這是瑞銀的基準預期;性能或生態主導場景下,若美國前沿模型保持明顯領先且AI深度嵌入企業工作流,中國份額可能維持在個位數低段至10%以下。報告認為性價比場景更可能成為現實,因為需求將趨於分層——複雜高價值任務仍為頂尖模型支付溢價,而大量高頻、ROI敏感的工作負載將流向更便宜的替代品。

高盛交易臺負責人Rich Privorotsky近期的分析與此形成呼應。他指出AI板塊正面臨兩股對立力量:更廣泛的應用普及推升算力需求,但代幣通縮加劇與貨幣化前景存疑。他援引實驗稱,由Gemini 3 FlashKimi K2.6DeepSeek V4 Pro組合的模型,以約一半成本將性能差距縮小至距頂尖模型不足1%。他將核心矛盾提煉為“價值萬億的問題”:更低的智能成本,究竟創造的需求多,還是摧毀的定價權多?這一問題的答案,將深刻影響當前AI產業數萬億美元市值的合理性,以及中國模型全球擴張的最終邊界。地緣政治風險雖是不確定變量,但歐洲、亞洲、中東等地區目前缺乏本地頭部基礎模型,為中國模型的海外拓展留下了可觀空間。