美團開源1.6萬億參數大模型LongCat-2.0，基於5萬張國產算力卡訓練

美團開源萬億參數大模型LongCat-2.0，首次基於5萬張國產芯片集群完成全流程訓練。

6月30日，美團正式發佈並宣佈開源新一代基礎大模型LongCat-2.0（中文名“龍貓2.0”），總參數量達到1.6萬億。這是國內首個基於5萬張國產AI芯片集群完成預訓練及推理全流程的大型語言模型，標誌著國產算力在超大規模模型訓練上的工程化突破。

LongCat-2.0此前曾以“Owl Alpha”為代號在OpenRouter等平臺進行灰度測試。在技術架構上，該模型在超過5萬張國產AI芯片集群上完成了30萬億Token的預訓練，主要採用了稀疏注意力與動態激活機制。推理階段單次Token平均激活參數約480億，這種設計旨在處理常規指令時減少高能耗計算節點的調用，從而壓降單次交互的顯存佔用和推理成本。

在模型能力側，LongCat-2.0被明確設定為側重智能體工作負載。它從零開始預訓練，原生支持1M超長上下文，架構設計使其在真實的Agentic Coding任務中能更高效地完成代碼理解、生成與執行。在主流Agent與代碼生成評測中，其主要優勢指向自動化工作流和代碼理解。目前，該模型已兼容Claude Code、OpenClaw等主流開發工具接口，表明美團試圖在長文本和代碼生成維度尋找更確定的落地場景。

此次發佈背後，是美團自2023年起推進的國產算力適配戰略。在海外高端GPU獲取受限的市場環境下，5萬卡國產集群成功支撐萬億模型從零預訓練，驗證了底層的算子適配、通信庫異常處理與流水線調度能力已達到商用標準。萬卡以上級別集群的核心壁壘在於節點協同與系統糾錯，能在該規模上完成全流程訓練，意味著國產硬件在超大規模AI訓練中的工程可用性得到實證。對企業而言，擺脫對單一海外硬件供應商的依賴，可在未來的資本支出結構和算力採購上獲得一定的成本調控空間。

在新模型發佈前，美團近期在內部成立了AI Transformation部門，反映出其對大模型的預期正從技術探索轉向業務流的實質改造。將側重智能體和代碼能力的LongCat-2.0置入實際業務鏈條，預期的影響路徑主要集中於兩點：其一，內部研發端的結構性降本，通過接入各類開發工具，模型衍生的AI代碼助手與SQL數據分析智能體可直接縮減後端開發與數據查詢的人力與時間消耗；其二，業務流的自動化調度，美團主營的同城物流與本地生活業務涉及高頻的商戶與騎手交互，1M超長上下文結合原生的工具調用能力，可用於處理多維度的調度指令分發與自動化客訴流轉，嘗試進一步攤薄單均履約成本。

整體來看，LongCat-2.0的發佈是一次基於現有國產算力底座和業務需求的工程化交付。在行業算力投入持續擴大的週期內，美團試圖通過架構調整壓降推理成本，並以智能體編碼作為切口推進內部提效。該模型後續的財務表現，仍需考察其在美團高併發真實業務中，能否兌現預期的開發降本與運營增效指標。

美團開源1.6萬億參數大模型LongCat-2.0，基於5萬張國產算力卡訓練

延伸閱讀

相關深度報道

相關每日新聞