美团开源1.6万亿参数大模型LongCat-2.0，基于5万张国产算力卡训练

美团开源万亿参数大模型LongCat-2.0，首次基于5万张国产芯片集群完成全流程训练。

6月30日，美团正式发布并宣布开源新一代基础大模型LongCat-2.0（中文名“龙猫2.0”），总参数量达到1.6万亿。这是国内首个基于5万张国产AI芯片集群完成预训练及推理全流程的大型语言模型，标志着国产算力在超大规模模型训练上的工程化突破。

LongCat-2.0此前曾以“Owl Alpha”为代号在OpenRouter等平台进行灰度测试。在技术架构上，该模型在超过5万张国产AI芯片集群上完成了30万亿Token的预训练，主要采用了稀疏注意力与动态激活机制。推理阶段单次Token平均激活参数约480亿，这种设计旨在处理常规指令时减少高能耗计算节点的调用，从而压降单次交互的显存占用和推理成本。

在模型能力侧，LongCat-2.0被明确设定为侧重智能体工作负载。它从零开始预训练，原生支持1M超长上下文，架构设计使其在真实的Agentic Coding任务中能更高效地完成代码理解、生成与执行。在主流Agent与代码生成评测中，其主要优势指向自动化工作流和代码理解。目前，该模型已兼容Claude Code、OpenClaw等主流开发工具接口，表明美团试图在长文本和代码生成维度寻找更确定的落地场景。

此次发布背后，是美团自2023年起推进的国产算力适配战略。在海外高端GPU获取受限的市场环境下，5万卡国产集群成功支撑万亿模型从零预训练，验证了底层的算子适配、通信库异常处理与流水线调度能力已达到商用标准。万卡以上级别集群的核心壁垒在于节点协同与系统纠错，能在该规模上完成全流程训练，意味着国产硬件在超大规模AI训练中的工程可用性得到实证。对企业而言，摆脱对单一海外硬件供应商的依赖，可在未来的资本支出结构和算力采购上获得一定的成本调控空间。

在新模型发布前，美团近期在内部成立了AI Transformation部门，反映出其对大模型的预期正从技术探索转向业务流的实质改造。将侧重智能体和代码能力的LongCat-2.0置入实际业务链条，预期的影响路径主要集中于两点：其一，内部研发端的结构性降本，通过接入各类开发工具，模型衍生的AI代码助手与SQL数据分析智能体可直接缩减后端开发与数据查询的人力与时间消耗；其二，业务流的自动化调度，美团主营的同城物流与本地生活业务涉及高频的商户与骑手交互，1M超长上下文结合原生的工具调用能力，可用于处理多维度的调度指令分发与自动化客诉流转，尝试进一步摊薄单均履约成本。

整体来看，LongCat-2.0的发布是一次基于现有国产算力底座和业务需求的工程化交付。在行业算力投入持续扩大的周期内，美团试图通过架构调整压降推理成本，并以智能体编码作为切口推进内部提效。该模型后续的财务表现，仍需考察其在美团高并发真实业务中，能否兑现预期的开发降本与运营增效指标。

美团开源1.6万亿参数大模型LongCat-2.0，基于5万张国产算力卡训练

延伸阅读

相关深度报道

相关每日新闻