美團訓練1.6萬億參數AI模型，完全基於國產芯片

美團完全基於中國芯片訓練出1.6萬億參數AI模型LongCat-2.0，無需英偉達GPU。

美團近日正式披露其LongCat-2.0大模型，最引人注目的不是它的性能，而是它背後的算力來源——這個1.6萬億參數的模型，完全在超過5萬顆國產AI ASIC芯片組成的集群上訓練完成，全程未使用任何英偉達GPU。

LongCat團隊自2023年才成立，去年底剛推出首代模型，如今僅隔半年便迭代至萬億參數級別。訓練數據覆蓋超過35萬億個token，規模已躋身全球第一梯隊。美團方面明確表示：“LongCat-2.0證明我們現在有能力在國產計算集群上訓練大規模模型。”

這一表態的時間點耐人尋味。自2022年美國對華實施先進芯片出口管制以來，外界一直質疑中國能否在脫離英偉達高端GPU的情況下，訓練出真正有競爭力的基礎模型。LongCat-2.0的出現，至少在紙面上給出了一個肯定答案。

從已公佈的基準測試成績來看，LongCat-2.0呈現出明顯的“偏科”特徵。在SWE-bench Pro（得分59.5）和SWE-bench Multilingual（得分77.3）兩項軟件工程相關測試中，它超越了Gemini 3.1 Pro和GPT-5.5，但落後於Claude Opus 4.7與4.8。而在IFEval（90.0）、IMO-AnswerBench（81.8）和GPQA-diamond（88.9）等測試上，它與Gemini及GPT-5.5的差距則相當明顯。

這種不均衡的表現，可能折射出國產芯片在特定計算負載下的優勢與短板。不過，美團並未披露具體芯片供應商的身份，這讓外界難以判斷究竟是哪家國產芯片廠商在背後支撐了這次訓練。

另一個值得注意的細節是，LongCat-2.0目前尚未在HuggingFace等平臺開源，也未提供公開可用的API接口。這意味著上述基準測試成績暫時無法被第三方獨立復現和驗證。在AI領域，閉源模型聲稱的性能與真實可用性之間往往存在落差，這一點需要持續觀察。

從產業格局來看，LongCat-2.0的意義遠超美團一家公司。它向華盛頓傳遞了一個清晰信號：出口管制或許能延緩、但難以阻斷中國AI大模型的前進步伐。當國產芯片集群能夠支撐萬億參數模型的完整訓練流程時，整個中國AI產業鏈的“去英偉達化”敘事就獲得了實質性支撐——從芯片設計、製造到集群搭建、模型訓練，一條替代路徑正在從概念走向落地。

當然，這並不意味著國產芯片已在性能上比肩英偉達最新產品。訓練成功只是第一步，模型的實際推理成本、芯片的良率與產能、生態工具的成熟度，都是決定這條路線能否大規模鋪開的關鍵變量。LongCat-2.0更像是一個“可行性驗證”，而非終極答案。

對於關注AI算力投資的讀者而言，這條消息的衝擊力在於：它可能加速全球AI芯片市場從“一家獨大”走向“多極競爭”的進程。如果中國國產芯片能在未來一兩年內持續迭代、並在更多公開模型中證明自己，那麼英偉達在中國市場的長期收入預期就需要重新評估，而國產芯片產業鏈上的相關公司則可能迎來新的估值邏輯。

美團訓練1.6萬億參數AI模型，完全基於國產芯片

延伸閱讀

相關深度報道

相關每日新聞