Meta近日对内部Applied AI部门工程师下达明确禁令:限制使用Anthropic的Claude Code和OpenAI的Codex,部分涉及这些模型的工作被直接叫停。一份内部备忘录揭示原因——竞品AI输出的内容若混入Meta训练数据,将触发“与合作方的严重纠纷升级”。
这是AI行业首次有大型前沿实验室因蒸馏担忧,公开限制员工使用竞品编码工具。而它只是2026年蒸馏战争全面升级的最新一幕。
蒸馏,通俗讲就是拿一个强大模型的输出去训练另一个模型。当Meta工程师在编写AI训练代码时大量依赖Claude Code或Codex,这些工具生成的代码片段、调试建议和架构方案,就可能被无意间收入Meta自身的训练素材库。备忘录警告,若Claude或Codex的输出最终出现在Meta的训练数据集里,将直接触发合同条款的严肃后果——OpenAI、Anthropic、Google的服务条款均明确禁止使用模型输出来构建竞争性系统。
回看2026年,蒸馏争议的烈度逐月攀升。2月12日,OpenAI向美国众议院中国特设委员会提交备忘录,指控DeepSeek使用“新的、混淆的方法”蒸馏其模型训练R1。2月23日,Anthropic率先发难,指控DeepSeek、月之暗面、MiniMax三家中国公司实施“工业级蒸馏攻击”,涉及超过2.4万个虚假账号、1600万次交互。马斯克随即在X平台反呛。4月30日,在xAI诉OpenAI案法庭上,马斯克被问及xAI是否蒸馏了OpenAI模型来训练Grok,给出“部分是的”回答。5月初,白宫发布反蒸馏政策备忘录,将蒸馏问题从商业纠纷上升至国家安全层面。6月10日,Anthropic再次向美国参议院银行委员会致信,指控阿里巴巴关联方在4月22日至6月5日期间,通过约2.5万个虚假账户发起超过2880万次Claude交互,Anthropic称之为“已知最大规模的蒸馏攻击”。6月13日,美国政府以国家安全为由,要求AI企业限制非美国公民访问顶尖大模型。
Meta的禁令正是在这一连串事件后浮出水面。这家以“开源急先锋”著称的公司,从Llama 2到Llama 4,扎克伯格反复宣讲开放AI的价值观,允许外部开发者基于Llama微调、二次开发,甚至鼓励商业产品落地。但对自己内部核心数据和训练流程的保护,远比外界想象中严苛。
这构成了一个商业悖论。面向外部开源Llama,Meta输出的是一套战略:通过降低AI技术门槛,削弱OpenAI和Google的封闭生态优势,让Llama成为行业事实标准。可一旦涉及自家核心模型的训练数据——那些真正决定下一代模型能力上限的高质量数据集——Meta立刻切换到最保守的防御姿态。
Meta的恐惧首先来自合同层面。若被证实利用Claude或Codex的输出训练自家模型,备忘录中“严重升级”指向的很可能是诉讼或天价赔偿。更深一层是竞争壁垒。Meta正在自研AI编码助手MetaCode,如果内部工程师一边花着Meta预算开发MetaCode,一边依赖竞品工具完成关键编码工作,那MetaCode最终的能力究竟是Meta自己的,还是“借”来的?讲不清这个故事,损失的不仅是法律层面,更是投资者信心。还有一层现实是成本失控——2026年仅内部AI使用一项就将耗费数十亿美元,迫使公司必须控制员工对外部昂贵AI工具的消耗。最后是数据主权:当工程师用Claude Code调试训练脚本时,Meta的专有代码库正通过API流向Anthropic服务器,这对一家把AI作为核心战略的公司而言是不可容忍的数据泄露路径。
蒸馏之所以让所有大模型公司又爱又恨,是因为它在技术上几乎不可防御。当一家公司的员工在正常编码工作中使用竞品AI工具,再将生成的代码片段作为参考写入自己的训练数据——这算不算蒸馏?在法律和技术两个维度,答案可能截然不同。Anthropic在2025年8月底修订消费者条款,宣布用户对话数据将默认用于模型训练,直接引起Meta法务和安全团队的高度警惕:当数据默认流向训练集,谁训练了谁的数据,在法律上变得说不清。
Meta这道禁令不止是内部IT管理,更像一个行业宣言——AI巨头之间的“数据护城河”正从概念走向制度。其他AI巨头很可能跟进类似限制政策。Google、微软、Amazon内部都在大量使用竞品AI工具,面临同样的蒸馏风险。政策层面同样在加速,白宫的反蒸馏备忘录和美国政府对非美国公民访问顶尖模型的限制,正在改变整个行业的竞争规则。
企业级AI编码工具将迎来需求爆发。如果Claude和GPT-4这类模型无法满足企业对数据残留的合规要求,真正的赢家或许是那些能提供完全本地部署或私有云方案的AI公司。Meta选择自研MetaCode,本质上就是走这条路。对Anthropic和OpenAI而言,这是挑战也是机会——谁能更快推出让企业客户放心的部署方案,谁就能在下一阶段占据先机。蒸馏不会消失,它就像互联网早期的盗版问题,技术和法律将在动态博弈中不断寻求平衡。