美團近日正式披露其LongCat-2.0大模型,最引人注目的不是它的性能,而是它背後的算力來源——這個1.6萬億參數的模型,完全在超過5萬顆國產AI ASIC芯片組成的集群上訓練完成,全程未使用任何英偉達GPU。
LongCat團隊自2023年才成立,去年底剛推出首代模型,如今僅隔半年便迭代至萬億參數級別。訓練數據覆蓋超過35萬億個token,規模已躋身全球第一梯隊。美團方面明確表示:“LongCat-2.0證明我們現在有能力在國產計算集群上訓練大規模模型。”
這一表態的時間點耐人尋味。自2022年美國對華實施先進芯片出口管制以來,外界一直質疑中國能否在脫離英偉達高端GPU的情況下,訓練出真正有競爭力的基礎模型。LongCat-2.0的出現,至少在紙面上給出了一個肯定答案。
從已公佈的基準測試成績來看,LongCat-2.0呈現出明顯的“偏科”特徵。在SWE-bench Pro(得分59.5)和SWE-bench Multilingual(得分77.3)兩項軟件工程相關測試中,它超越了Gemini 3.1 Pro和GPT-5.5,但落後於Claude Opus 4.7與4.8。而在IFEval(90.0)、IMO-AnswerBench(81.8)和GPQA-diamond(88.9)等測試上,它與Gemini及GPT-5.5的差距則相當明顯。
這種不均衡的表現,可能折射出國產芯片在特定計算負載下的優勢與短板。不過,美團並未披露具體芯片供應商的身份,這讓外界難以判斷究竟是哪家國產芯片廠商在背後支撐了這次訓練。
另一個值得注意的細節是,LongCat-2.0目前尚未在HuggingFace等平臺開源,也未提供公開可用的API接口。這意味著上述基準測試成績暫時無法被第三方獨立復現和驗證。在AI領域,閉源模型聲稱的性能與真實可用性之間往往存在落差,這一點需要持續觀察。
從產業格局來看,LongCat-2.0的意義遠超美團一家公司。它向華盛頓傳遞了一個清晰信號:出口管制或許能延緩、但難以阻斷中國AI大模型的前進步伐。當國產芯片集群能夠支撐萬億參數模型的完整訓練流程時,整個中國AI產業鏈的“去英偉達化”敘事就獲得了實質性支撐——從芯片設計、製造到集群搭建、模型訓練,一條替代路徑正在從概念走向落地。
當然,這並不意味著國產芯片已在性能上比肩英偉達最新產品。訓練成功只是第一步,模型的實際推理成本、芯片的良率與產能、生態工具的成熟度,都是決定這條路線能否大規模鋪開的關鍵變量。LongCat-2.0更像是一個“可行性驗證”,而非終極答案。
對於關注AI算力投資的讀者而言,這條消息的衝擊力在於:它可能加速全球AI芯片市場從“一家獨大”走向“多極競爭”的進程。如果中國國產芯片能在未來一兩年內持續迭代、並在更多公開模型中證明自己,那麼英偉達在中國市場的長期收入預期就需要重新評估,而國產芯片產業鏈上的相關公司則可能迎來新的估值邏輯。