6月30日,美团正式发布并宣布开源新一代基础大模型LongCat-2.0(中文名“龙猫2.0”),总参数量达到1.6万亿。这是国内首个基于5万张国产AI芯片集群完成预训练及推理全流程的大型语言模型,标志着国产算力在超大规模模型训练上的工程化突破。

LongCat-2.0此前曾以“Owl Alpha”为代号在OpenRouter等平台进行灰度测试。在技术架构上,该模型在超过5万张国产AI芯片集群上完成了30万亿Token的预训练,主要采用了稀疏注意力动态激活机制。推理阶段单次Token平均激活参数约480亿,这种设计旨在处理常规指令时减少高能耗计算节点的调用,从而压降单次交互的显存占用和推理成本。

在模型能力侧,LongCat-2.0被明确设定为侧重智能体工作负载。它从零开始预训练,原生支持1M超长上下文,架构设计使其在真实的Agentic Coding任务中能更高效地完成代码理解、生成与执行。在主流Agent与代码生成评测中,其主要优势指向自动化工作流和代码理解。目前,该模型已兼容Claude CodeOpenClaw等主流开发工具接口,表明美团试图在长文本和代码生成维度寻找更确定的落地场景。

此次发布背后,是美团自2023年起推进的国产算力适配战略。在海外高端GPU获取受限的市场环境下,5万卡国产集群成功支撑万亿模型从零预训练,验证了底层的算子适配、通信库异常处理与流水线调度能力已达到商用标准。万卡以上级别集群的核心壁垒在于节点协同与系统纠错,能在该规模上完成全流程训练,意味着国产硬件在超大规模AI训练中的工程可用性得到实证。对企业而言,摆脱对单一海外硬件供应商的依赖,可在未来的资本支出结构和算力采购上获得一定的成本调控空间。

在新模型发布前,美团近期在内部成立了AI Transformation部门,反映出其对大模型的预期正从技术探索转向业务流的实质改造。将侧重智能体和代码能力的LongCat-2.0置入实际业务链条,预期的影响路径主要集中于两点:其一,内部研发端的结构性降本,通过接入各类开发工具,模型衍生的AI代码助手与SQL数据分析智能体可直接缩减后端开发与数据查询的人力与时间消耗;其二,业务流的自动化调度,美团主营的同城物流与本地生活业务涉及高频的商户与骑手交互,1M超长上下文结合原生的工具调用能力,可用于处理多维度的调度指令分发与自动化客诉流转,尝试进一步摊薄单均履约成本。

整体来看,LongCat-2.0的发布是一次基于现有国产算力底座和业务需求的工程化交付。在行业算力投入持续扩大的周期内,美团试图通过架构调整压降推理成本,并以智能体编码作为切口推进内部提效。该模型后续的财务表现,仍需考察其在美团高并发真实业务中,能否兑现预期的开发降本与运营增效指标。