6月30日,美團正式發佈並宣佈開源新一代基礎大模型LongCat-2.0(中文名“龍貓2.0”),總參數量達到1.6萬億。這是國內首個基於5萬張國產AI芯片集群完成預訓練及推理全流程的大型語言模型,標誌著國產算力在超大規模模型訓練上的工程化突破。
LongCat-2.0此前曾以“Owl Alpha”為代號在OpenRouter等平臺進行灰度測試。在技術架構上,該模型在超過5萬張國產AI芯片集群上完成了30萬億Token的預訓練,主要採用了稀疏注意力與動態激活機制。推理階段單次Token平均激活參數約480億,這種設計旨在處理常規指令時減少高能耗計算節點的調用,從而壓降單次交互的顯存佔用和推理成本。
在模型能力側,LongCat-2.0被明確設定為側重智能體工作負載。它從零開始預訓練,原生支持1M超長上下文,架構設計使其在真實的Agentic Coding任務中能更高效地完成代碼理解、生成與執行。在主流Agent與代碼生成評測中,其主要優勢指向自動化工作流和代碼理解。目前,該模型已兼容Claude Code、OpenClaw等主流開發工具接口,表明美團試圖在長文本和代碼生成維度尋找更確定的落地場景。
此次發佈背後,是美團自2023年起推進的國產算力適配戰略。在海外高端GPU獲取受限的市場環境下,5萬卡國產集群成功支撐萬億模型從零預訓練,驗證了底層的算子適配、通信庫異常處理與流水線調度能力已達到商用標準。萬卡以上級別集群的核心壁壘在於節點協同與系統糾錯,能在該規模上完成全流程訓練,意味著國產硬件在超大規模AI訓練中的工程可用性得到實證。對企業而言,擺脫對單一海外硬件供應商的依賴,可在未來的資本支出結構和算力採購上獲得一定的成本調控空間。
在新模型發佈前,美團近期在內部成立了AI Transformation部門,反映出其對大模型的預期正從技術探索轉向業務流的實質改造。將側重智能體和代碼能力的LongCat-2.0置入實際業務鏈條,預期的影響路徑主要集中於兩點:其一,內部研發端的結構性降本,通過接入各類開發工具,模型衍生的AI代碼助手與SQL數據分析智能體可直接縮減後端開發與數據查詢的人力與時間消耗;其二,業務流的自動化調度,美團主營的同城物流與本地生活業務涉及高頻的商戶與騎手交互,1M超長上下文結合原生的工具調用能力,可用於處理多維度的調度指令分發與自動化客訴流轉,嘗試進一步攤薄單均履約成本。
整體來看,LongCat-2.0的發佈是一次基於現有國產算力底座和業務需求的工程化交付。在行業算力投入持續擴大的週期內,美團試圖通過架構調整壓降推理成本,並以智能體編碼作為切口推進內部提效。該模型後續的財務表現,仍需考察其在美團高併發真實業務中,能否兌現預期的開發降本與運營增效指標。